行動計量学会「春の合宿セミナー」 於:安田生命アカデミア 2002/3/21-22 反復測定データの分析 狩野裕@大阪大学 協力:SAS・SPSS 1 2 AGENDA 1. はじめに 2. 一般線型モデルによる分析 – ANOVA分割法計画 – MANOVA – Box のε修正と球面性検定 3. SEM (共分散構造分析) によるモデリング – (マルコフ連鎖モデル) – 潜在曲線モデル 4. 混合モデル(Mixed Model) – ANOVA+共分散行列の指定, MANOVA – 成長曲線モデル 3 1.1 反復測定データの種類 • 縦断的(経時)データとそうでない反復測定 – 測定順序がランダマイズ可能か 反復測定データ – 経時データは順序を 変更できない 経時データ 4 1.2 成長と因果 • 成長は平均の変化 – 全体的にみて増加(or 減少)しているか – 潜在曲線モデル,成長曲線モデル • 因果は相関の大きさ – 予測可能性が焦点 – マルコフ連鎖モデル T1 T2 T3 5 因果と成長のパターン_1 成長なし相関=1 成長あり相関=1 6 6 5 5 個体1 個体2 個体3 個体4 3 2 4 特性 特性 4 個体1 個体2 個体3 個体4 3 2 1 1 0 0 T1 T1 T2 時間 時間 成長あり相関=1 成長なし相関=1 6 6 5 個体4 4 5 個体4 個体3 3 特性(T2) 特性(T2) T2 個体2 2 個体1 4 個体3 3 個体2 2 個体1 1 1 0 0 0 1 2 3 特性(T1) 4 5 0 1 2 3 特性(T1) 4 5 6 因果と成長のパターン_2 成長あり相関=0 成長なし相関=0 6 6 5 5 個体1 個体2 個体3 個体4 3 2 4 特性 特性 4 個体1 個体2 個体3 個体4 3 2 1 1 0 0 T1 T2 T1 時間 時間 成長あり相関=0 成長なし相関=0 6 6 個体2 個体4 5 特性(T2) 5 特性(T2) T2 4 個体1 個体3 3 2 1 4 個体2 個体3 個体1 個体4 3 2 1 0 0 0 1 2 3 特性(T1) 4 5 0 1 2 3 特性(T1) 4 5 7 1.3 全体的傾向と個体差 • これらを区別して評価することが必要 • 個体差は変化の特徴に関して グルーピングする – SEM...潜在曲線モデル – MIXED...成長曲線モデル 成長なし相関=0 成長あり相関=1 6 6 5 5 個体1 個体2 個体3 個体4 3 2 4 特性 特性 4 個体1 個体2 個体3 個体4 3 2 1 1 0 0 T1 T2 時間 T1 T2 時間 8 第2章 一般線型モデル 反復測定データの分析は,まず 「 ANOVA分割法計画」 9 料理の道具 2.1 ANOVA分割法計画 2.2 MANOVA(多変量分散分析) 2.3 修正ANOVA Boxのε,H-HとG-Gの推定方法がある A1 種 々 の デ ザ イ ン • 完全無作為 要因計画 B1 データ 3 (被験者 3 40名) 1 3 5 合計 (AB) 15 B2 4 3 4 5 7 23 B3 6 6 6 4 8 30 B4 B1 5 3 7 5 8 2 7 4 9 6 36 20 B2 2 6 3 6 4 21 B3 3 2 3 6 5 19 B4 2 3 3 4 6 18 B4 B1 5 3 A2 B2 B3 2 3 B4 2 A1 • 乱塊法計画 12 A2 被験者1 B1 3 B2 4 B3 6 被験者2 3 3 6 7 5 6 2 3 被験者3 1 4 6 8 2 3 3 3 被験者4 3 5 4 7 4 6 6 4 5 被験者5 合計 (AB) 15 7 8 9 6 4 5 6 23 30 36 20 21 19 18 B1 A2 B2 B3 B4 • 分割法計画 B1 A1 B2 B3 B4 被験者11 3 4 6 5 被験者21 3 2 3 2 被験者12 3 3 6 7 被験者22 5 6 2 3 被験者13 1 4 6 8 被験者23 2 3 3 3 被験者14 3 5 4 7 被験者24 4 6 6 4 被験者15 5 合計 (AB) 15 7 8 9 被験者25 6 4 5 6 23 30 36 合計 (AB) 20 21 19 18 13 データのグラフ化 生データのグラフ 10 特性の値 8 6 4 2 0 A1B1 A1B2 A1B3 A1B4 A2B1 要因の組合せ A2B2 A2B3 A2B4 14 分析結果 実験のデザイン 完全無作為計画 乱塊法計画 分割法計画 要 A 有意 有意 非有意 因 B 非有意 有意 有意 A* B 有意 有意 有意 • 実験デザインに合わせて分析方法を正確 に選ぶ必要 • データの出展:森-吉田.データ解析テクニカルブック 16 データの構造式 完全無作為要因計画 Yijk a j bk ( ab) jk eijk 乱塊法計画 (非加算モデル ) Yijk subi a j bk ( ab) jk ( sa ) ij ( sb ) ik ( sab) ijk 分割法計画 Yijk a j subij bk (ab) jk eijk || sub(a )ij 観測変数 データの構造式(分割法) Yi11 A1B1 a1 b1 (ab)11 ( sub) i1 ei11 Y a b (ab) ( sub) e A 1 B 2 i1 i12 12 i12 1 2 Yi13 A1B3 a1 b3 (ab)13 ( sub) i1 ei13 Yi14 A1B 4 a1 b4 (ab)14 ( sub) i1 ei14 Yi 21 A2 B1 a2 b1 (ab) 21 ( sub) i 2 ei 21 Y a b (ab) ( sub) e A 2 B 2 i2 i 22 22 i 22 2 2 Yi 23 A2 B3 a2 b3 (ab) 23 ( sub) i 2 ei 23 Yi 24 A2 B 4 a2 b4 (ab) 24 ( sub) i 2 ei 24 17 18 観測変数の分散(分割法) データの構造式 A1B1 sub a1 b1 (ab)11 e11 A1B 2 sub a b (ab) e 12 12 1 2 A1B3 sub a1 b3 (ab)13 e13 A1B 4 sub a1 b4 (ab)14 e14 分散共分散行列 e11 S2 e2 S2 S2 S2 A1B1 sub e A1B 2 sub 2 2 2 2 2 S S e S S Var Var 12 Var e13 S2 A1B3 sub S2 S2 e2 S2 2 2 2 2 2 S S S e A1B 4 sub e14 S 複合対称性(CS; Compound Symmetry)という 19 複合対称性 • CS (Compound Symmetry)の仮定 – 分散が互いに等しい.共分散が互いに等しい – 誤差間の相関係数は全て等しい • この仮定が成立しない場合がある – 経時データではたぶん成立しない 1 2 1 , 1 1 1 1 * 2 .8 1 , 2 * * 3 .6 .8 1 * * * 4 . 4 . 6 . 8 1 20 球面性仮定への拡張 • CSから球面性(sphericity)の仮定へ – Huynh-Feldt(1970)はF検定が正確であるための より良い条件を導いた – これを球面性の仮定という • この仮定でも,いつも成立するとは限らない – 経時データではたぶん成立しない e11 12 e 2 2 2 ( 2 1 ) / 2 2 12 Var e13 ( 32 12 ) / 2 ( 32 22 ) / 2 32 2 2 2 2 2 2 2 e14 ( 4 1 ) / 2 ( 4 2 ) / 2 ( 4 3 ) / 2 4 21 方向性 • 球面性仮定を検定する – 球面性仮説が受容された場合はANOVA (分割法計画)で分析 – 球面性仮説が棄却された場合は次の オプションがある • MANOVA • 修正ANOVA(分割法計画) 22 §2.1 のまとめ • 反復測定データの分析方法としてANOVA (分割法計画)を紹介 • ANOVAは球面性の仮定が成立しないとき は不正確 • その場合は,いくつかのオプションがある – MANOVA – 修正ANOVA(分割法計画) 23 2.2 MANOVA 多変量分散分析と CS・球面性の仮定 24 動機づけ • 誤差ベクトルに関する球面性仮定が,棄却 された場合は,ANOVAは不正確(分割法 計画)である – 第一種の過誤が不正確 • 正確な方法としてMANOVAがある – ひとつのオプション • 球面性仮定の検定は次節で... 26 MANOVAによる 反復測定データの分析 • 反復測定データでは,一つの個体から 複数個データをとる => 多変量データとみなせる • SPSS – 「一般線型モデル_反復測定」を選択 • SAS – 「PROC glm」において 「repeated」 ステートメントを用いる 28 多変量分散分析の結果(SPSS) [SASも同様] 多 変 量検 定b 効果 時間B 時間B x 要因A Pilla i のトレース Wilks のラムダ Hotelling のトレース Roy の最大根 Pilla i のトレース Wilks のラムダ Hotelling のトレース Roy の最大根 a. 正確統計量 b. 計画: Interc ept+MEASURE_1 要因A 測定変数名: 被験者内計画: 時間B 変換変数: 平均 ソース タイプ III 平方和 Intercept 828.100 要因A 16.900 誤差 46.500 値 .674 .326 2.065 2.065 .746 .254 2.940 2.940 F値 仮説自由度 a 4.129 3.000 4.129 a 3.000 a 4.129 3.000 4.129 a 3.000 a 5.880 3.000 5.880 a 3.000 a 5.880 3.000 5.880 a 3.000 誤差自由度 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.000 被 験者 間 効果 の 検 定 自由度 1 1 8 平均平方 828.100 16.900 5.813 F値 142.469 2.908 有意確率 .000 .127 有意確率 .066 .066 .066 .066 .032 .032 .032 .032 29 データの構造式(MANOVA) 観測変数 A1B1 a1 b1 (ab)11 e11 A1B 2 a b (ab) e 12 12 1 2 A1B3 a1 b3 (ab)13 e13 A1B 4 a1 b4 (ab)14 e14 A2 B1 a2 b1 (ab) 21 e21 A2 B 2 a b (ab) e 22 22 2 2 A2 B3 a2 b3 (ab) 23 e23 A2 B 4 a2 b4 (ab) 24 e24 30 MANOVAの誤差 • 被験者内での4つの誤差はすべて (自由に)相関していることを仮定 • 推定すべき母数が多く,検出力(検定力) が落ちる – サンプルサイズが十分大きく検出力が確保さ れているときはOK e11 11 e 12 Var 21 e13 31 e14 41 12 22 32 42 13 23 33 43 14 24 34 44 31 誤差のまとめ • CS – 分割法は正しい • HF 球面性仮定 – 分割法は正しい • MANOVAの構造 12 22 2 2 2 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 1 1 1 1 2 12 2 2 2 ( ) / 2 2 1 2 ( 32 12 ) / 2 ( 32 22 ) / 2 2 2 2 2 ( 4 1 ) / 2 ( 4 2 ) / 2 11 21 22 31 32 33 42 43 44 41 2 3 ( 42 32 ) / 2 42 32 MANOVA vs 分割法計画 • MANOVAは,特別な仮定は必要なく,どんな 誤差構造に対しても使える – 検出力が低くなる • 分割法計画は,球面性仮定(含むCS)の下で, 正しく推測が行える – 推定すべき母数が少ないので,MANOVAより検出力 (検定力)が高い – この仮定が成立しないときは,第一種の過誤が 不正確になる • 球面性のチェックは経時データの分析でより重要 33 有意確率(検出力)の比較: ANOVA vs MANOVA 被験者 間要因 被験者内要因 A B A×B ANOVA:球面性仮定 .127 .007 .001 MANOVA .127 .066 .032 37 2.3 Box のε修正と球面性検定 ・ 分割法には厳しい球面性仮定があり MANOVAは検出力が低い どうしよう? ・ 球面性仮定のチェックはどうするの? 38 では,どうするのか? • ANOVAとMANOVAの中間をねらった方法に存在 意義がある – BoxのεによるANOVAの修正:自由度をεで調整 – εの推定値 • Greenhouse-Geiser • Huynh-Feldt(G-Gの改良版) • 第一種の過誤と検出力も共にまずまず • そのまえに,球面性の仮定をチェックしておく 39 球面性(の仮定)の検定 (test of sphericity) • 反復測定分散分析を適用するきは,球面 性仮定の吟味をしておく • もし,球面性仮定が成り立たないのであれ ば,出力されたεでF値の自由度を補正す る – 修正されたF値・P値が出力される • 球面性の検定が高度(P値<0.0001)に有意 の場合はMANOVAを適用するのが無難 40 球面性の検定結果 SAS Applied to Orthogonal Components: Test for Sphericity: Mauchly's Criterion = 0.8428411 Chisquare Approximation = 1.1493445 with 5 df Prob > Chisquare = 0.9496 SPSS M a uc h l y の 球 面性 検 定b 測定変数名: MEASURE_1 イプシロンa Greenhous 被験者内効果 Mau chly の W 近似カイ2乗 自由度 有意確率 e-Geisser Huynh-Feldt 下限 時間B .843 1.149 5 .950 .890 1.000 .333 正規直交した変換従属変数の誤差共分散行列が単位行列に比例する という帰無仮説を 検定します。 a. 有意性の平均検定の自由度調整に使用できる 可能性があります。修正した検定は、被験者内効果の検定テーブル に表示されます 。 b. 41 BoxのεによるANOVAの修正結果 SAS Source: B DF 3 Type III SS 19.70000000 Mean Square 6.56666667 F Value 5.20 Pr > F 0.0066 Adj Pr > F G - G H - F 0.0092 0.0066 Pr > F 0.0007 Adj Pr > F G - G H - F 0.0012 0.0007 Source: B*A DF 3 Type III SS 30.50000000 Mean Square 10.16666667 F Value 8.05 Source: Error(B) DF 24 Type III SS 30.30000000 Mean Square 1.26250000 Greenhouse-Geisser Epsilon = 0.8896 Huynh-Feldt Epsilon = 1.5436 H-Fは1を超える場合がある.そのときは1にまるめる 42 BoxのεによるANOVAの修正結果 SPSS 被 験者 内 効果 の 検 定 測定変数名: MEASURE_1 ソース タイプ III 平方和 時間B 球面性の仮定 19.700 Greenhouse-Geisser 19.700 Huynh-Feldt 19.700 下限 19.700 時間B x 要因A 球面性の仮定 30.500 Greenhouse-Geisser 30.500 Huynh-Feldt 30.500 下限 30.500 誤差 (時間B) 球面性の仮定 30.300 Greenhouse-Geisser 30.300 Huynh-Feldt 30.300 下限 30.300 自由度 3 2.669 3.000 1.000 3 2.669 3.000 1.000 24 21.350 24.000 8.000 平均平方 6.567 7.382 6.567 19.700 10.167 11.428 10.167 30.500 1.263 1.419 1.263 3.787 F値 5.201 5.201 5.201 5.201 8.053 8.053 8.053 8.053 有意確率 .007 .009 .007 .052 .001 .001 .001 .022 43 有意確率(検出力)の比較: ANOVA vs MANOVA 被験者 間要因 被験者内要因 A B A×B ANOVA:球面性仮定 .127 .007 .001 ANOVA:G-G .127 .009 .001 ANOVA:H-F .127 .007 .001 ANOVA:下限 .127 .052 .022 MANOVA .127 .066 .032 44 考察 • 本データでは,球面性の仮定が成り立っていると 考えてよい – 「ANOVA:球面性仮定」が適切な検定である – 一般に,G-GやH-Fによる修正を行うとすこし検出力 が落ちる – MANOVAではもっと検出力が落ちる • 球面性の仮定が成り立っていない場合 – G-GやH-Fによる修正統計量を用いる – MANOVAは検出力の点でおとる • MANOVAで有意になるなら,それを報告してよい 48 §2.3 のまとめ • 球面性仮説は統計的に検定できる • 球面性仮説が棄却されたときのオプション として,Box’s εによる修正ANOVAがある • 修正ANOVAは – ANOVAとMANOVAの中間を狙った方法 – 第一種の過誤は近似的に保証する – 検出力はかなりよい 49 蛇足: 反復測定データと経時測定データ • 経時測定(縦断的)⊂反復測定 – 経時測定データは測定の順序が変更できない • 測定の順序をランダマイズできれば,球面性の仮定 は成り立つ可能性が大きくなる – 経時測定データでは次のような共分散行列が期待され る: e11 1 0.6 0.4 0.2 0.6 1 0.6 0.4 e 12 Var 2 e13 0.4 0.6 1 0.6 e14 0.2 0.4 0.6 1 • 球面性仮定は,経時測定データの分析でより重要 50 第2章のまとめ • 反復測定データの分散分析には3種類ある – ANOVA(分割法計画) – Boxのεによる修正ANOVA [近似] – MANOVA • 反復測定間の相関の入り方(球面性仮定 の正否)によって使い分ける – 経時測定データでは球面性仮定の吟味は必須 51 フローチャート 球面性検定 非有意 有意 ANOVA 分割法 εによる 修正ANOVA 高度に有意 (P値 <0.0001) MANOVA 52 補足 • 修正ANOVAとMANOVAの使い分けに 厳格な理由付けがあるわけではない – SAS mentions “However, in cases where the sphericity test is dramatically rejected (p<0.0001), all these univariate tests should be interpreted cautiously.” • p<0.0001のときには,サンプルサイズがかなり 大きく,検出力が確保されている場合がある => MANOVAがよい 53 さいごに --- 経時測定データ分析の昨今 --• 古典的方法 – 反復測定ANOVAと多変量分散分析(MANOVA) – G-GやH-Fによる修正ANOVA • 最近の方法 – Mixed model による分析 • 誤差分散のタイプを分析者が指定・選択 • 個体の変化に曲線(直線)を当てはめる – SEMによってモデル化 • 誤差のタイプをモデリング • 個体の変化に曲線(直線)を当てはめる 54 このあと勉強すること_1 • CS, HF, UN 以外のタイプの共分散行列を 指定したいMIXED モデル 12 22 2 2 2 1 1 2 2 2 2 12 1 1 2 2 12 12 12 22 1 12 2 2 22 ( 2 1 ) / 2 ( 32 12 ) / 2 ( 32 22 ) / 2 2 2 2 2 ( 4 1 ) / 2 ( 4 2 ) / 2 11 21 22 31 32 33 41 42 43 44 2 3 ( 42 32 ) / 2 42 1 2 2 3 1 2 1 1 因子分析モデル 55 このあと勉強すること_2 • 成長を記述したい – 線型 or 2次曲線 or ゴンベルツ曲線... • 成長の個体差をみたい – 属性で成長に違いがある.. MIXED モデルやSEMによる 「成長曲線モデル」や「潜在曲線モデル」 56 おわり
© Copyright 2024 ExpyDoc