精神症状評価の信頼性試験における 被験者数と評価者数の統計的検討 工学研究科経営工学専攻 医薬統計コース 4402611 斎藤 有希 1 背景 精神疾患の症状の評価においては、客観 的な尺度がなく、主観的な尺度を用いるこ とが多い 主観的な尺度を用いる場合には、同一の 被験者に対する評価が評価者によって異 なる 2 評価尺度の例 躁病の評価尺度(YMRS) 医師が患者と面接を実施し、評価を行う 11項目について各々スコアを付け、それら の合計点で症状を評価する 3 評価尺度の例 YMRSの評価項目 評価項目 1.気分高揚 2.活動の量的−質的増加 3.性的関心 4.睡眠 5.易怒性 6.会話(速度と量) 7.言語−思考障害 8.内容 9.破壊的−攻撃的行為 10.身なり 11.病識 合計点 スコアの範囲 0∼4 0∼4 0∼4 0∼4 0∼8 0∼8 0∼4 0∼8 0∼8 0∼4 0∼4 0∼60 4 信頼性試験 目的 評価尺度の性能を調べる z 同一の被験者に対する評価の再現性を確認 する z 本研究で検討するデザイン I 人の評価者が J 人の被験者を1回づつ評価 z 総評価件数 K = I × J z 5 適用するモデル 被験者と評価者を変量効果とした二元配置 モデル Yij = μ + Si + Rj + eij Yij : 被験者 i に対する評価者 j の評点 μ : 総平均 Si : 被験者 i の効果 ∼ N (0,σs2) Rj : 評価者 j の効果 ∼ N (0,σr2) eij : 誤差 ∼ N (0,σe2) 6 信頼性の指標 級内相関係数 σs ρ= 2 2 2 σs + σr + σe 2 ρが 1 に近いほど信頼性が高いと解釈する 信頼性試験の目的はρを推定すること 7 級内相関係数の推定値 分散分析表 要因 被験者 評価者 誤差 自由度 J-1 I-1 (J-1)(I-1) 平均平方 S12 S22 S32 平均平方の期待値 σe2+Iσt 2 σe2+Jσr2 σe2 S1 − S3 ρ$ = 2 2 2 S1 + ( I J ) S2 + ( I − 1 − I J ) S3 2 2 8 本研究の目的 ρの推定精度を確保するために必要な被 験者数および評価者数について統計的に 検討する 推定精度は信頼区間の幅と分散の大きさで 評価 z 総評価件数 K (= I×J) を固定した場合に, 最適な評価者数と被験者数のバランスを検討 する z 9 本研究の意義 (1) 過去の研究において,一元配置モデルを適 用した場合の検討が行われていた Giraudeau (2001) z Shoukri (2003) z 本研究では,二元配置モデルを適用した場合 について検討する 10 本研究の意義 (2) 現在のところ,信頼性試験における被験者数 と評価者数の設定方法についてコンセンサス がない 臨床研究の現場で利用可能な設定方針を提 示する 11 級内相関係数の信頼区間による検討 信頼区間の算出方法 z Fleiss ら (1978)が提案した近似式を用いた 信頼区間の幅に影響を与えるパラメータ 評価者数 I および被験者数 J z σs2 ,σr2 ,σe2 z 12 検討方法 R =σr2 /σe2 とおく K とρを固定する R を変化させ,信頼区間の幅が小さくなる被 験者数と評価者数の組合せを調べた 13 90%信頼区間幅の算出結果 K = 72,ρ= 0.8の場合 評価者数 被験者数 2 3 4 6 8 9 12 18 36 24 18 12 9 8 6 4 0 0.21 * 0.21 0.22 0.25 0.28 0.29 0.32 0.38 R (=σr2/σe2) 0.5 1 4 10000 0.37 0.57 0.92 0.93 0.28 0.38 0.62 0.76 0.26 * 0.32 0.48 0.61 0.27 0.30 * 0.39 0.47 0.29 0.31 0.36 0.42 0.30 0.31 0.36 * 0.40 0.33 0.34 0.37 0.39 * 0.39 0.39 0.40 0.42 14 結果 (1) 最適な被験者数と評価者数の組合せは, R に よって変化する R が 0 の場合は,評価者数を少なくし,被験者 数を多くした方が良い z これは先行研究の結果と一致した R によらず,被験者数が極端に少ない場合は 推定精度が低い 15 結果 (2) R が不明な場合は, R を大きく見積もり,その 中で推定精度が高い組合せを選択すると良い K = 24,120の場合,ρ= 0.7,0.9の場合につい ても同様の結論が得られた 16 級内相関係数の分散による検討 { } V log( ρ$ ) をデルタ法を用いて計算 K,σs2 ,σr2 ,σe2を固定すると, V log( ρ$ ) は I の関数 h(I) として表せる { } dI 2 + eI + f h( I ) = 2 aI + bI + c a∼fは,K,σs2 ,σr2 ,σe2による式 17 分散を最小にする I の導出 K = 72,ρ= 0.8,R = 1 の場合 hI 0.1 0.08 0.06 0.04 0.02 I 10 20 30 40 18 分散を最小にする I の導出 h(I) を最小にする I (= Imin )を数学的に解く I min = K + O(ε ) ただし、ε = σ e σ r = 1 R 2 2 誤差分散が 0 に近いときは,I = J で 分散が 最小となる 19 分散の算出結果 K = 72,ρ= 0.8の場合 評価者数 被験者数 2 3 4 6 8 9 12 18 36 24 18 12 9 8 6 4 0 0.004 * 0.004 0.004 0.006 0.008 0.009 0.011 0.018 R (=σr2/σe2) 0.5 1 4 0.009 0.016 0.035 0.006 0.010 0.019 0.006 * 0.008 0.014 0.007 0.008 * 0.012 0.008 0.009 0.011 * 0.009 0.010 0.012 0.012 0.012 0.014 0.018 0.019 0.019 10000 0.053 0.028 0.020 0.015 0.014 * 0.014 0.015 0.020 20 例数設定の実例 前提条件 z 目標とする級内相関係数は0.8とする z Rに関する情報は不確かである z 級内相関係数の90%信頼区間の幅を0.4以下に おさめたい場合を考える 21 例数設定の実例 Iminの算出結果 K 75 76 77 78 79 80 81 Imin 8.66 8.72 8.77 8.83 8.89 8.94 9.00 Jmin 8.66 8.72 8.78 8.83 8.89 8.94 9.00 信頼区間幅 0.404 0.402 0.401 0.399 0.397 0.396 0.394 22 例数設定の実例 K が81以下,信頼区間幅が0.4以下となる組合せ I 9 10 11 12 13 15 16 J 9 8 7 6 6 5 5 K 81 80 77 72 78 75 80 信頼区間幅 0.394 0.388 0.388 0.394 0.386 0.397 0.392 23 まとめ 総評価件数 K を固定した場合に,最適な被験 者数と評価者数のバランスについて検討した z 最適なバランスは評価者間分散の大きさによって 変わる z 評価者間分散の大きさが不明な場合は,被験者数 と評価者数を同程度にすればよい 24 今後の課題 本研究で示した設定方針が,臨床研究の現場 でどの程度受け入れ可能か評価する 級内相関係数の信頼区間の近似計算法につ いては、近年様々な改良法が提案されている ので,より良い近似式を採用する 25 参考文献 1. Fleiss JL. ‘The Design and Analysis of Clinical Experiments’, John Wiley & Sons (1999). 2. Cappelleri JC, and Ting N. ‘A modified large-sample approach to approximate interval estimation for a particular intraclass correlation coefficient’, Statistcs in Medicine, 22, 1861−1877 (2003). 3. Giraudeau B, Mary JY. 'Planning a reproducibility study: how many subjects and how many replicates per subject for an expected width of the 95 per cent confidence interval of the intraclass correlation coefficient', Statistics in Medicine, 20, 3205−3214 (2001). 26 参考文献 4. Shoukri MM, Asyali MH, Walter SD. 'Issues of Cost and Efficiency in the Design of Reliability Studies', Biometrics, 59, 1107−1112 (2003). 5. Fleiss JL, Shrout PE. 'Approximate interval estimation for a certain intraclass correlation coefficient', Psychometrika, 43(2), 259−262 (1978). 6. Inada T et al. 'A preliminary study on the reliability of Japanese version of Young Mania Rating Scale', Japanese Journal of Clinical Psychopharmacology, 5, 425−431 (2002). 27 本発表で用いた記号 I : 評価者数 J:被験者数 K:総評価件数(= I×J) σs2:被験者間分散 σr2:評価者間分散 σe2:誤差分散 ρ:級内相関係数 R = σr2 /σe2 ε = σe2 / σr2 28
© Copyright 2024 ExpyDoc