精神症状評価の信頼性試験における 被験者数と評価者数の統計的検討

精神症状評価の信頼性試験における
被験者数と評価者数の統計的検討
工学研究科経営工学専攻
医薬統計コース
4402611 斎藤 有希
1
背景
精神疾患の症状の評価においては、客観
的な尺度がなく、主観的な尺度を用いるこ
とが多い
主観的な尺度を用いる場合には、同一の
被験者に対する評価が評価者によって異
なる
2
評価尺度の例
躁病の評価尺度(YMRS)
医師が患者と面接を実施し、評価を行う
11項目について各々スコアを付け、それら
の合計点で症状を評価する
3
評価尺度の例
YMRSの評価項目
評価項目
1.気分高揚
2.活動の量的−質的増加
3.性的関心
4.睡眠
5.易怒性
6.会話(速度と量)
7.言語−思考障害
8.内容
9.破壊的−攻撃的行為
10.身なり
11.病識
合計点
スコアの範囲
0∼4
0∼4
0∼4
0∼4
0∼8
0∼8
0∼4
0∼8
0∼8
0∼4
0∼4
0∼60
4
信頼性試験
目的
評価尺度の性能を調べる
z 同一の被験者に対する評価の再現性を確認
する
z
本研究で検討するデザイン
I 人の評価者が J 人の被験者を1回づつ評価
z 総評価件数 K = I × J
z
5
適用するモデル
被験者と評価者を変量効果とした二元配置
モデル
Yij = μ + Si + Rj + eij
Yij : 被験者 i に対する評価者 j の評点
μ : 総平均
Si : 被験者 i の効果 ∼ N (0,σs2)
Rj : 評価者 j の効果 ∼ N (0,σr2)
eij : 誤差 ∼ N (0,σe2)
6
信頼性の指標
級内相関係数
σs
ρ= 2
2
2
σs + σr + σe
2
ρが 1 に近いほど信頼性が高いと解釈する
信頼性試験の目的はρを推定すること
7
級内相関係数の推定値
分散分析表
要因
被験者
評価者
誤差
自由度
J-1
I-1
(J-1)(I-1)
平均平方
S12
S22
S32
平均平方の期待値
σe2+Iσt 2
σe2+Jσr2
σe2
S1 − S3
ρ$ = 2
2
2
S1 + ( I J ) S2 + ( I − 1 − I J ) S3
2
2
8
本研究の目的
ρの推定精度を確保するために必要な被
験者数および評価者数について統計的に
検討する
推定精度は信頼区間の幅と分散の大きさで
評価
z 総評価件数 K (= I×J) を固定した場合に,
最適な評価者数と被験者数のバランスを検討
する
z
9
本研究の意義 (1)
過去の研究において,一元配置モデルを適
用した場合の検討が行われていた
Giraudeau (2001)
z Shoukri (2003)
z
本研究では,二元配置モデルを適用した場合
について検討する
10
本研究の意義 (2)
現在のところ,信頼性試験における被験者数
と評価者数の設定方法についてコンセンサス
がない
臨床研究の現場で利用可能な設定方針を提
示する
11
級内相関係数の信頼区間による検討
信頼区間の算出方法
z
Fleiss ら (1978)が提案した近似式を用いた
信頼区間の幅に影響を与えるパラメータ
評価者数 I および被験者数 J
z σs2 ,σr2 ,σe2
z
12
検討方法
R =σr2 /σe2 とおく
K とρを固定する
R を変化させ,信頼区間の幅が小さくなる被
験者数と評価者数の組合せを調べた
13
90%信頼区間幅の算出結果
K = 72,ρ= 0.8の場合
評価者数 被験者数
2
3
4
6
8
9
12
18
36
24
18
12
9
8
6
4
0
0.21 *
0.21
0.22
0.25
0.28
0.29
0.32
0.38
R (=σr2/σe2)
0.5
1
4
10000
0.37
0.57
0.92
0.93
0.28
0.38
0.62
0.76
0.26 * 0.32
0.48
0.61
0.27
0.30 * 0.39
0.47
0.29
0.31
0.36
0.42
0.30
0.31
0.36 * 0.40
0.33
0.34
0.37
0.39 *
0.39
0.39
0.40
0.42
14
結果 (1)
最適な被験者数と評価者数の組合せは, R に
よって変化する
R が 0 の場合は,評価者数を少なくし,被験者
数を多くした方が良い
z
これは先行研究の結果と一致した
R によらず,被験者数が極端に少ない場合は
推定精度が低い
15
結果 (2)
R が不明な場合は, R を大きく見積もり,その
中で推定精度が高い組合せを選択すると良い
K = 24,120の場合,ρ= 0.7,0.9の場合につい
ても同様の結論が得られた
16
級内相関係数の分散による検討
{
}
V log( ρ$ ) をデルタ法を用いて計算
K,σs2 ,σr2 ,σe2を固定すると,
V log( ρ$ ) は I の関数 h(I) として表せる
{
}
dI 2 + eI + f
h( I ) = 2
aI + bI + c
a∼fは,K,σs2 ,σr2 ,σe2による式
17
分散を最小にする I の導出
K = 72,ρ= 0.8,R = 1 の場合
hI
0.1
0.08
0.06
0.04
0.02
I
10
20
30
40
18
分散を最小にする I の導出
h(I) を最小にする I (= Imin )を数学的に解く
I min = K + O(ε ) ただし、ε = σ e σ r = 1 R
2
2
誤差分散が 0 に近いときは,I = J で 分散が
最小となる
19
分散の算出結果
K = 72,ρ= 0.8の場合
評価者数 被験者数
2
3
4
6
8
9
12
18
36
24
18
12
9
8
6
4
0
0.004 *
0.004
0.004
0.006
0.008
0.009
0.011
0.018
R (=σr2/σe2)
0.5
1
4
0.009
0.016
0.035
0.006
0.010
0.019
0.006 *
0.008
0.014
0.007
0.008 *
0.012
0.008
0.009
0.011 *
0.009
0.010
0.012
0.012
0.012
0.014
0.018
0.019
0.019
10000
0.053
0.028
0.020
0.015
0.014 *
0.014
0.015
0.020
20
例数設定の実例
前提条件
z
目標とする級内相関係数は0.8とする
z
Rに関する情報は不確かである
z
級内相関係数の90%信頼区間の幅を0.4以下に
おさめたい場合を考える
21
例数設定の実例
Iminの算出結果
K
75
76
77
78
79
80
81
Imin
8.66
8.72
8.77
8.83
8.89
8.94
9.00
Jmin
8.66
8.72
8.78
8.83
8.89
8.94
9.00
信頼区間幅
0.404
0.402
0.401
0.399
0.397
0.396
0.394
22
例数設定の実例
K が81以下,信頼区間幅が0.4以下となる組合せ
I
9
10
11
12
13
15
16
J
9
8
7
6
6
5
5
K
81
80
77
72
78
75
80
信頼区間幅
0.394
0.388
0.388
0.394
0.386
0.397
0.392
23
まとめ
総評価件数 K を固定した場合に,最適な被験
者数と評価者数のバランスについて検討した
z
最適なバランスは評価者間分散の大きさによって
変わる
z
評価者間分散の大きさが不明な場合は,被験者数
と評価者数を同程度にすればよい
24
今後の課題
本研究で示した設定方針が,臨床研究の現場
でどの程度受け入れ可能か評価する
級内相関係数の信頼区間の近似計算法につ
いては、近年様々な改良法が提案されている
ので,より良い近似式を採用する
25
参考文献
1.
Fleiss JL. ‘The Design and Analysis of Clinical
Experiments’, John Wiley & Sons (1999).
2.
Cappelleri JC, and Ting N. ‘A modified large-sample
approach to approximate interval estimation for a
particular intraclass correlation coefficient’, Statistcs in
Medicine, 22, 1861−1877 (2003).
3.
Giraudeau B, Mary JY. 'Planning a reproducibility study:
how many subjects and how many replicates per subject
for an expected width of the 95 per cent confidence
interval of the intraclass correlation coefficient', Statistics
in Medicine, 20, 3205−3214 (2001).
26
参考文献
4.
Shoukri MM, Asyali MH, Walter SD. 'Issues of Cost and
Efficiency in the Design of Reliability Studies', Biometrics,
59, 1107−1112 (2003).
5.
Fleiss JL, Shrout PE. 'Approximate interval estimation for
a certain intraclass correlation coefficient', Psychometrika,
43(2), 259−262 (1978).
6.
Inada T et al. 'A preliminary study on the reliability of
Japanese version of Young Mania Rating Scale',
Japanese Journal of Clinical Psychopharmacology, 5,
425−431 (2002).
27
本発表で用いた記号
I : 評価者数
J:被験者数
K:総評価件数(= I×J)
σs2:被験者間分散
σr2:評価者間分散
σe2:誤差分散
ρ:級内相関係数
R = σr2 /σe2
ε = σe2 / σr2
28