PHREG: proportional hazard model+regression

1
PHREG:
proportional hazard model+regression
狩野 裕
2
目的
• ハザード関数(生存関数)の違いを共変量(独立
変数;性別,飲酒量,喫煙量…)で説明する
• 危険因子(共変量)の危険の程度を同定すること
でリスクの定量化に成功
• 社会科学でもつかえる
– 例:企業倒産の要因研究
– Honjo, Y., ``Business failure of new firms: An empirical analysis
using a multiplicative hazards model," International Journal of
Industrial Organization , 18, 557-574, May 2000
3
分析方法の比較
分析方法
重回帰分析
説明変数
従属変数
連続変数
連続変数
ロジスティック
二値変数
ニ値変数
回帰分析
名義変数
比例ハザード
二値変数の生起
モデル
時間+打ち切り
独立変数と従属
変数の関係
独立変数と従属
変数の平均値が
直線関係
独立変数と従属
変数のロジットが
直線関係
独立変数とハ
ザード比の対数
が
直線関係
4
平井氏の
研究より
S (t )
5
比例ハザードモデルとは_1
• S(t)の違いを共変量(独立変数)で説明する
– 生存関数が異なる理由は何か?
• S(t)をモデル化するのではなく,ハザード関数
(瞬間死亡率) h(t)をモデル化する
Prob(t  T  t  t | T  t )
t 0
t
d
  (log S (t ))
dt
t

S (t )  exp   h(t )dt 
 0

h(t )  lim
6
比例ハザードモデルとは_2
• ハザードh(t)の対数をモデル化
– 対数線形モデルといってよい
– h(t) はいつも非負
logh(t )  1x1   2 x2   0 x p
• 左辺が時間 t の関数,右辺が共変量 x の
関数...なんかへん
7
比例ハザードモデルとは_3
• そこで比を考える
h(t )
log
 1 x1   2 x2     0 x p
h0 (t )
• h0 (t ) はxの値がすべて0のときのハザード
– このことから切片項  0 がない理由がわかる
• 比は t に依存しないという仮定
⇒比例ハザードモデル
8
比例ハザードモデルとは_4
• ハザードのモデル化する際の仮定
– 共変量の線形性
1x1   2 x2   0 x p
– ハザードの対数をモデル化
– ハザードが比例関係にある
h(t )
log
 1 x1   2 x2     0 x p
h0 (t )
9
推定について
• ハザードh(t)を推定し回帰分析する
– 実際は同時に行っている
• ハザードの推定ではデータの順位を用いる
– イベント発生までの時間は用いない
– ノンパラメトリックな方法である
– 群間比較でのログランク検定の拡張
• 回帰モデルはパラメトリックなモデル
• 比例ハザードモデルはセミパラメトリック法と呼ば
れている
10
余談
• 比例ハザードモデルは英国の統計学者
D. R. Cox によって1972年に発表された
– 当時,「夢の統計的手法」と絶賛された
• 過去50年の数理科学史上最大の発展の
ひとつ
– 1990年にGM癌研究基金から20万ドルの賞金
• 英国王室からknightの称号
11
参考文献
• 中村剛(2001). Cox比例ハザードモデル.
朝倉書店.
• 丹後・山岡・高木(1996).ロジスティック
回帰分析.朝倉書店.