【MedR】第12回

東京大学医学系研究科
特任助教 倉橋一成
1

時系列モデル
◦ 株データなどで利用
◦ ARIMA
◦ カルマンフィルタ

混合効果モデル
◦ 臨床試験、実験データ、観察データなどで利用
2

うつ病の認知行動療法(cognitive behavioural therapy; CBT)
◦ Beat the Blues vs. Treatment as Usualのランダム化臨床試験
 BtheB:対話型システム、9セッション×約5分
 TAU:一般療法(療法士の治療など?)

うつの尺度
◦ 今回はBeckのうつ評価尺度IIに焦点を当てる
◦ 測定時点は5回
 治療前
 治療開始後2、3、5、8カ月

共変量(解析に利用する変数)
◦ 抗うつ薬服用の有無
◦ 病歴の長さ(半年以上か)
3

サンプル同士が相関しているデータに当てはめる
◦
◦
◦
◦

同じ人の繰り返し測定(擬似反復)
同じ人の経時データ
複数施設のデータ
相関しているグループを「クラスター」と表現する
興味のあるパラメータ
◦ 固定効果:クラスターに係わらない全体のパラメータ(fixed parameter)
◦ 変量効果:クラスター毎のパラメータ(random parameter)
 変量効果を条件付けると繰り返し測定値は独立→局所独立性

局外パラメータ(nuisance parameters)
◦ 相関構造のパラメータ

繰り返し測定データの解析方法はDiggle et al, 2003やDavis
2002にレビュー
4

Yij = β0 + β1*tj + ui + eij
◦ 個体(クラスター)i、時点j
◦ uiがランダム切片:平均0、分散σu^2の正規分布に従う
◦ eij:平均0、分散σ^2の正規分布に従う



どの個体も時間の勾配は同じ(固定効果)
どの個体も異なる切片を持つ(変量効果)
V(y) = σu^2 + σ^2と分解できる
◦ 分散成分モデルとも呼ばれる(variance component model)

時点間の共分散がCompound symmetryの構造となる
◦ どの時点間も同じ共分散
◦ 時系列データにはそぐわない
5

Yij = β0 + β1*tj + ui + vi*tj + eij
◦ 時点の勾配にも変量効果が入る

Yの分散、共分散は時点によって変化する
◦ Compound symmetry構造ではない
6


最尤法:分散成分を過小推定する
制限付き最尤法(restricted maximum likelihood; REML)
◦ 分散成分の一致推定量が得られる:こちらを推奨
7

変量効果は「事後確率」の形で表現できる
◦ P(u|y, x) = f(y|u, x)g(u)

事後確率の期待値を変量効果の推定値とする
◦ 経験ベイズ推定値(empirical Bayes estimates)
◦ 真の変量効果の最良線形不偏推定量(best linear unbiased
predictions; BLUP)になっている

交互作用項のように固定効果で推定したときよりも0に近くな
るという特性がある
◦ 縮小推定量と呼ばれる
8


欠測に関する研究:Rubin 1976
完全にランダムな欠測(missing completely at random;
MCAR)
◦ 観測値にも欠測値にも依存しない欠測

ランダムな欠測(missing at random; MAR)
◦ 観測値には依存しているが観測値を条件つけるとランダムになる欠測
◦ 例:Murray and Fendlay 1988、Heitjan 1997
 血圧が高くなってきた患者はランダムに脱落していく
 初回BMIが高い対象者は脱落しやすい

ランダムでない欠測(missing not at random; MNAR)
◦ 無視できない(non-ignorable)、情報のある(informative)とも言われる
◦ 欠測値に依存した欠測
 血圧が高すぎたため、疼痛が強すぎたために記録をしていない
 MARの例は実はMNARではないか?
9

Diggle and Kenward 1994は様々なメカニズムの設定で推定
を行えるソフトを開発
◦ 推定結果の信頼性は高いわけではない
◦ 欠測確率をロジスティック回帰で推定
◦ 欠測値を潜在変数(latent variable)として考えてモデルに組み込む

メカニズムを完全に同定するのは難しいが、可視化すること
である程度検討を付けることはできる
◦ Carpenter et al. 2002
 欠測群と非欠測群の分布をプロットする
10
11