反復測定データの分析

行動計量学会「春の合宿セミナー」
於:安田生命アカデミア
2002/3/21-22
反復測定データの分析
狩野裕@大阪大学
協力:SAS・SPSS
1
2
AGENDA
1. はじめに
2. 一般線型モデルによる分析
– ANOVA分割法計画
– MANOVA
– Box のε修正と球面性検定
3. SEM (共分散構造分析) によるモデリング
– (マルコフ連鎖モデル)
– 潜在曲線モデル
4. 混合モデル(Mixed Model)
– ANOVA+共分散行列の指定, MANOVA
– 成長曲線モデル
3
1.1 反復測定データの種類
• 縦断的(経時)データとそうでない反復測定
– 測定順序がランダマイズ可能か
反復測定データ
– 経時データは順序を
変更できない
経時データ
4
1.2 成長と因果
• 成長は平均の変化
– 全体的にみて増加(or 減少)しているか
– 潜在曲線モデル,成長曲線モデル
• 因果は相関の大きさ
– 予測可能性が焦点
– マルコフ連鎖モデル
T1
T2
T3
5
因果と成長のパターン_1
成長なし相関=1
成長あり相関=1
6
6
5
5
個体1
個体2
個体3
個体4
3
2
4
特性
特性
4
個体1
個体2
個体3
個体4
3
2
1
1
0
0
T1
T1
T2
時間
時間
成長あり相関=1
成長なし相関=1
6
6
5
個体4
4
5
個体4
個体3
3
特性(T2)
特性(T2)
T2
個体2
2
個体1
4
個体3
3
個体2
2
個体1
1
1
0
0
0
1
2
3
特性(T1)
4
5
0
1
2
3
特性(T1)
4
5
6
因果と成長のパターン_2
成長あり相関=0
成長なし相関=0
6
6
5
5
個体1
個体2
個体3
個体4
3
2
4
特性
特性
4
個体1
個体2
個体3
個体4
3
2
1
1
0
0
T1
T2
T1
時間
時間
成長あり相関=0
成長なし相関=0
6
6
個体2
個体4
5
特性(T2)
5
特性(T2)
T2
4
個体1
個体3
3
2
1
4
個体2
個体3
個体1
個体4
3
2
1
0
0
0
1
2
3
特性(T1)
4
5
0
1
2
3
特性(T1)
4
5
7
1.3 全体的傾向と個体差
• これらを区別して評価することが必要
• 個体差は変化の特徴に関して
グルーピングする
– SEM...潜在曲線モデル
– MIXED...成長曲線モデル
成長なし相関=0
成長あり相関=1
6
6
5
5
個体1
個体2
個体3
個体4
3
2
4
特性
特性
4
個体1
個体2
個体3
個体4
3
2
1
1
0
0
T1
T2
時間
T1
T2
時間
8
第2章 一般線型モデル
反復測定データの分析は,まず
「 ANOVA分割法計画」
9
料理の道具
2.1 ANOVA分割法計画
2.2 MANOVA(多変量分散分析)
2.3 修正ANOVA
Boxのε,H-HとG-Gの推定方法がある
A1
種
々
の
デ
ザ
イ
ン
• 完全無作為
要因計画
B1
データ
3
(被験者
3
40名)
1
3
5
合計 (AB) 15
B2
4
3
4
5
7
23
B3
6
6
6
4
8
30
B4 B1
5 3
7 5
8 2
7 4
9 6
36 20
B2
2
6
3
6
4
21
B3
3
2
3
6
5
19
B4
2
3
3
4
6
18
B4 B1
5 3
A2
B2 B3
2
3
B4
2
A1
• 乱塊法計画
12
A2
被験者1
B1
3
B2
4
B3
6
被験者2
3
3
6
7
5
6
2
3
被験者3
1
4
6
8
2
3
3
3
被験者4
3
5
4
7
4
6
6
4
5
被験者5
合計 (AB) 15
7
8
9
6
4
5
6
23
30
36 20
21
19
18
B1
A2
B2 B3
B4
• 分割法計画
B1
A1
B2 B3
B4
被験者11
3
4
6
5
被験者21 3
2
3
2
被験者12
3
3
6
7
被験者22 5
6
2
3
被験者13
1
4
6
8
被験者23 2
3
3
3
被験者14
3
5
4
7
被験者24 4
6
6
4
被験者15 5
合計 (AB) 15
7
8
9
被験者25 6
4
5
6
23
30
36
合計 (AB) 20
21
19
18
13
データのグラフ化
生データのグラフ
10
特性の値
8
6
4
2
0
A1B1
A1B2
A1B3
A1B4
A2B1
要因の組合せ
A2B2
A2B3
A2B4
14
分析結果
実験のデザイン
完全無作為計画
乱塊法計画
分割法計画
要
A
有意
有意
非有意
因
B
非有意
有意
有意
A* B
有意
有意
有意
• 実験デザインに合わせて分析方法を正確
に選ぶ必要
• データの出展:森-吉田.データ解析テクニカルブック
16
データの構造式
完全無作為要因計画
Yijk    a j  bk  ( ab) jk  eijk
乱塊法計画 (非加算モデル )
Yijk    subi  a j  bk  ( ab) jk  ( sa ) ij  ( sb ) ik  ( sab) ijk
分割法計画
Yijk    a j  subij  bk  (ab) jk  eijk

||
sub(a )ij
観測変数
データの構造式(分割法)
Yi11   A1B1     a1  b1  (ab)11  ( sub) i1  ei11 
Y  
    a  b  (ab)  ( sub)  e 
A
1
B
2
i1 
i12
12 
 i12   
      1   2   

 
Yi13   A1B3     a1  b3  (ab)13  ( sub) i1  ei13 
  
  
 
       
Yi14   A1B 4    a1  b4  (ab)14  ( sub) i1  ei14 
Yi 21   A2 B1     a2  b1  (ab) 21  ( sub) i 2  ei 21 
Y  
    a  b  (ab)  ( sub)  e 
A
2
B
2
i2 
i 22
22 
 i 22   
      2   2  

 
Yi 23   A2 B3     a2  b3  (ab) 23  ( sub) i 2  ei 23 
  
  
 
       
Yi 24   A2 B 4    a2  b4  (ab) 24  ( sub) i 2  ei 24 
17
18
観測変数の分散(分割法)
データの構造式
 A1B1      sub a1  b1  (ab)11  e11 
 A1B 2     sub a  b  (ab)  e 
12 
12

         1   2   
 
 A1B3      sub a1  b3  (ab)13  e13 
  

         
 A1B 4     sub a1  b4  (ab)14  e14 
分散共分散行列
e11   S2   e2
 S2
 S2
 S2 
 A1B1 
 sub

e  
 A1B 2
 sub
2
2
2
2
2






S
S
e
S
S

  Var    Var  12   
Var 
e13    S2
 A1B3 
 sub
 S2
 S2   e2
 S2 
  


 
2
2
2
2
2
S
S
 S   e 
 A1B 4
 sub
e14    S
複合対称性(CS; Compound Symmetry)という
19
複合対称性
• CS (Compound Symmetry)の仮定
– 分散が互いに等しい.共分散が互いに等しい
– 誤差間の相関係数は全て等しい
• この仮定が成立しない場合がある
– 経時データではたぶん成立しない
1

 2



1




,
1 

 1
1

1

* 2

.8 1


,  2 

* * 3 
.6 .8 1 




*
*
*
4
.
4
.
6
.
8
1




20
球面性仮定への拡張
• CSから球面性(sphericity)の仮定へ
– Huynh-Feldt(1970)はF検定が正確であるための
より良い条件を導いた
– これを球面性の仮定という
• この仮定でも,いつも成立するとは限らない
– 経時データではたぶん成立しない

e11  
 12

e   2
2
2
( 2   1 ) / 2  
2
12 



Var


e13  ( 32   12 ) / 2   ( 32   22 ) / 2  
 32
   2
2
2
2
2
2
2
e14  ( 4   1 ) / 2   ( 4   2 ) / 2   ( 4   3 ) / 2    4 
21
方向性
• 球面性仮定を検定する
– 球面性仮説が受容された場合はANOVA
(分割法計画)で分析
– 球面性仮説が棄却された場合は次の
オプションがある
• MANOVA
• 修正ANOVA(分割法計画)
22
§2.1 のまとめ
• 反復測定データの分析方法としてANOVA
(分割法計画)を紹介
• ANOVAは球面性の仮定が成立しないとき
は不正確
• その場合は,いくつかのオプションがある
– MANOVA
– 修正ANOVA(分割法計画)
23
2.2 MANOVA
多変量分散分析と
CS・球面性の仮定
24
動機づけ
• 誤差ベクトルに関する球面性仮定が,棄却
された場合は,ANOVAは不正確(分割法
計画)である
– 第一種の過誤が不正確
• 正確な方法としてMANOVAがある
– ひとつのオプション
• 球面性仮定の検定は次節で...
26
MANOVAによる
反復測定データの分析
• 反復測定データでは,一つの個体から
複数個データをとる
=> 多変量データとみなせる
• SPSS
– 「一般線型モデル_反復測定」を選択
• SAS
– 「PROC glm」において
「repeated」 ステートメントを用いる
28
多変量分散分析の結果(SPSS)
[SASも同様]
多 変 量検 定b
効果
時間B
時間B x 要因A
Pilla i のトレース
Wilks のラムダ
Hotelling のトレース
Roy の最大根
Pilla i のトレース
Wilks のラムダ
Hotelling のトレース
Roy の最大根
a. 正確統計量
b.
計画:
Interc ept+MEASURE_1
要因A
測定変数名:
被験者内計画:
時間B
変換変数: 平均
ソース
タイプ III 平方和
Intercept
828.100
要因A
16.900
誤差
46.500
値
.674
.326
2.065
2.065
.746
.254
2.940
2.940
F値
仮説自由度
a
4.129
3.000
4.129 a
3.000
a
4.129
3.000
4.129 a
3.000
a
5.880
3.000
5.880 a
3.000
a
5.880
3.000
5.880 a
3.000
誤差自由度
6.000
6.000
6.000
6.000
6.000
6.000
6.000
6.000
被 験者 間 効果 の 検 定
自由度
1
1
8
平均平方
828.100
16.900
5.813
F値
142.469
2.908
有意確率
.000
.127
有意確率
.066
.066
.066
.066
.032
.032
.032
.032
29
データの構造式(MANOVA)
観測変数
 A1B1     a1  b1  (ab)11  e11 
 A1B 2    a  b  (ab)  e 
12 
12

      1   2   
 
 A1B3     a1  b3  (ab)13  e13 
  

       
 A1B 4    a1  b4  (ab)14  e14 
 A2 B1     a2  b1  (ab) 21  e21 
 A2 B 2    a  b  (ab)  e 
22 
22

      2   2  
 
 A2 B3     a2  b3  (ab) 23  e23 
  

       
 A2 B 4    a2  b4  (ab) 24  e24 
30
MANOVAの誤差
• 被験者内での4つの誤差はすべて
(自由に)相関していることを仮定
• 推定すべき母数が多く,検出力(検定力)
が落ちる
– サンプルサイズが十分大きく検出力が確保さ
れているときはOK
e11   11
e  
12
Var     21
e13   31
  
e14   41
 12
 22
 32
 42
 13
 23
 33
 43
 14 
 24 
 34 

 44 
31
誤差のまとめ
• CS
– 分割法は正しい
• HF 球面性仮定
– 分割法は正しい
• MANOVAの構造
 12   22



2
2
2




1
1
2


2
2
2
2
 1

1
1   2

2
2
2
2
2







1
1
1
1
2


 12
 2
2
2
(



)
/
2



2
1
2

( 32   12 ) / 2   ( 32   22 ) / 2  
 2
2
2
2
( 4   1 ) / 2   ( 4   2 ) / 2  
 11




21
22


 31  32  33







42
43
44 
 41



2

3

( 42   32 ) / 2    42 
32
MANOVA vs 分割法計画
• MANOVAは,特別な仮定は必要なく,どんな
誤差構造に対しても使える
– 検出力が低くなる
• 分割法計画は,球面性仮定(含むCS)の下で,
正しく推測が行える
– 推定すべき母数が少ないので,MANOVAより検出力
(検定力)が高い
– この仮定が成立しないときは,第一種の過誤が
不正確になる
• 球面性のチェックは経時データの分析でより重要
33
有意確率(検出力)の比較:
ANOVA vs MANOVA
被験者
間要因
被験者内要因
A
B
A×B
ANOVA:球面性仮定
.127
.007
.001
MANOVA
.127
.066
.032
37
2.3 Box のε修正と球面性検定
・ 分割法には厳しい球面性仮定があり
MANOVAは検出力が低い
どうしよう?
・ 球面性仮定のチェックはどうするの?
38
では,どうするのか?
• ANOVAとMANOVAの中間をねらった方法に存在
意義がある
– BoxのεによるANOVAの修正:自由度をεで調整
– εの推定値
• Greenhouse-Geiser
• Huynh-Feldt(G-Gの改良版)
• 第一種の過誤と検出力も共にまずまず
• そのまえに,球面性の仮定をチェックしておく
39
球面性(の仮定)の検定
(test of sphericity)
• 反復測定分散分析を適用するきは,球面
性仮定の吟味をしておく
• もし,球面性仮定が成り立たないのであれ
ば,出力されたεでF値の自由度を補正す
る
– 修正されたF値・P値が出力される
• 球面性の検定が高度(P値<0.0001)に有意
の場合はMANOVAを適用するのが無難
40
球面性の検定結果
SAS
Applied to Orthogonal Components:
Test for Sphericity: Mauchly's Criterion = 0.8428411
Chisquare Approximation = 1.1493445 with 5 df
Prob > Chisquare = 0.9496
SPSS
M a uc h l y の 球 面性 検 定b
測定変数名: MEASURE_1
イプシロンa
Greenhous
被験者内効果 Mau chly の W 近似カイ2乗
自由度
有意確率
e-Geisser
Huynh-Feldt
下限
時間B
.843
1.149
5
.950
.890
1.000
.333
正規直交した変換従属変数の誤差共分散行列が単位行列に比例する という帰無仮説を 検定します。
a. 有意性の平均検定の自由度調整に使用できる 可能性があります。修正した検定は、被験者内効果の検定テーブル
に表示されます 。
b.
41
BoxのεによるANOVAの修正結果
SAS
Source: B
DF
3
Type III SS
19.70000000
Mean Square
6.56666667
F Value
5.20
Pr > F
0.0066
Adj Pr > F
G - G
H - F
0.0092
0.0066
Pr > F
0.0007
Adj Pr > F
G - G
H - F
0.0012
0.0007
Source: B*A
DF
3
Type III SS
30.50000000
Mean Square
10.16666667
F Value
8.05
Source: Error(B)
DF
24
Type III SS
30.30000000
Mean Square
1.26250000
Greenhouse-Geisser Epsilon = 0.8896
Huynh-Feldt Epsilon = 1.5436
H-Fは1を超える場合がある.そのときは1にまるめる
42
BoxのεによるANOVAの修正結果
SPSS
被 験者 内 効果 の 検 定
測定変数名: MEASURE_1
ソース
タイプ III 平方和
時間B
球面性の仮定
19.700
Greenhouse-Geisser
19.700
Huynh-Feldt
19.700
下限
19.700
時間B x 要因A 球面性の仮定
30.500
Greenhouse-Geisser
30.500
Huynh-Feldt
30.500
下限
30.500
誤差 (時間B)
球面性の仮定
30.300
Greenhouse-Geisser
30.300
Huynh-Feldt
30.300
下限
30.300
自由度
3
2.669
3.000
1.000
3
2.669
3.000
1.000
24
21.350
24.000
8.000
平均平方
6.567
7.382
6.567
19.700
10.167
11.428
10.167
30.500
1.263
1.419
1.263
3.787
F値
5.201
5.201
5.201
5.201
8.053
8.053
8.053
8.053
有意確率
.007
.009
.007
.052
.001
.001
.001
.022
43
有意確率(検出力)の比較:
ANOVA vs MANOVA
被験者
間要因
被験者内要因
A
B
A×B
ANOVA:球面性仮定
.127
.007
.001
ANOVA:G-G
.127
.009
.001
ANOVA:H-F
.127
.007
.001
ANOVA:下限
.127
.052
.022
MANOVA
.127
.066
.032
44
考察
• 本データでは,球面性の仮定が成り立っていると
考えてよい
– 「ANOVA:球面性仮定」が適切な検定である
– 一般に,G-GやH-Fによる修正を行うとすこし検出力
が落ちる
– MANOVAではもっと検出力が落ちる
• 球面性の仮定が成り立っていない場合
– G-GやH-Fによる修正統計量を用いる
– MANOVAは検出力の点でおとる
• MANOVAで有意になるなら,それを報告してよい
48
§2.3 のまとめ
• 球面性仮説は統計的に検定できる
• 球面性仮説が棄却されたときのオプション
として,Box’s εによる修正ANOVAがある
• 修正ANOVAは
– ANOVAとMANOVAの中間を狙った方法
– 第一種の過誤は近似的に保証する
– 検出力はかなりよい
49
蛇足:
反復測定データと経時測定データ
• 経時測定(縦断的)⊂反復測定
– 経時測定データは測定の順序が変更できない
• 測定の順序をランダマイズできれば,球面性の仮定
は成り立つ可能性が大きくなる
– 経時測定データでは次のような共分散行列が期待され
る:
e11 
 1 0.6 0.4 0.2
 
0.6 1 0.6 0.4
e
12

Var    2 
e13 
0.4 0.6 1 0.6
 


e14 
0.2 0.4 0.6 1 
• 球面性仮定は,経時測定データの分析でより重要
50
第2章のまとめ
• 反復測定データの分散分析には3種類ある
– ANOVA(分割法計画)
– Boxのεによる修正ANOVA [近似]
– MANOVA
• 反復測定間の相関の入り方(球面性仮定
の正否)によって使い分ける
– 経時測定データでは球面性仮定の吟味は必須
51
フローチャート
球面性検定
非有意
有意
ANOVA
分割法
εによる
修正ANOVA
高度に有意
(P値
<0.0001)
MANOVA
52
補足
• 修正ANOVAとMANOVAの使い分けに
厳格な理由付けがあるわけではない
– SAS mentions “However, in cases where the
sphericity test is dramatically rejected (p<0.0001), all
these univariate tests should be interpreted
cautiously.”
• p<0.0001のときには,サンプルサイズがかなり
大きく,検出力が確保されている場合がある
=> MANOVAがよい
53
さいごに
--- 経時測定データ分析の昨今 --• 古典的方法
– 反復測定ANOVAと多変量分散分析(MANOVA)
– G-GやH-Fによる修正ANOVA
• 最近の方法
– Mixed model による分析
• 誤差分散のタイプを分析者が指定・選択
• 個体の変化に曲線(直線)を当てはめる
– SEMによってモデル化
• 誤差のタイプをモデリング
• 個体の変化に曲線(直線)を当てはめる
54
このあと勉強すること_1
• CS, HF, UN 以外のタイプの共分散行列を
指定したいMIXED モデル
 12   22



2
2
2




1
1
2


2
2
2
  12

1
1   2


2
 12
 12
 12   22 
  1

 12
 2
2
 22
( 2   1 ) / 2  
( 32   12 ) / 2   ( 32   22 ) / 2  
 2
2
2
2
( 4   1 ) / 2   ( 4   2 ) / 2  
 11




21
22


 31  32  33



 41  42  43  44 



2

3

( 42   32 ) / 2    42 
1

 2 2

 3

1

2



1 

 1
因子分析モデル
55
このあと勉強すること_2
• 成長を記述したい
– 線型 or 2次曲線 or ゴンベルツ曲線...
• 成長の個体差をみたい
– 属性で成長に違いがある..
MIXED モデルやSEMによる
「成長曲線モデル」や「潜在曲線モデル」
56
おわり