Non-Complier

見かけ上の non-complier が存在する場合の
平均因果効果の統計的推測
成蹊大学大学院理工学研究科
(博士前期課程2年)
佐野文哉
成蹊大学理工学部
岩崎 学
内容






背景と目的
平均因果効果
平均因果効果の存在範囲
見かけ上の non-complier
推定方法
まとめと今後の課題
1
背景と目的

背景
• 処置の効果を測るにあたって,様々な分野で実験研究が
行われている
•
•
•
実験研究では,処置の割り付け(指示)を行うが,割り付
け(指示)通りの処置を受けない人がいる
割り付け(指示)通りの処置を受けない人の中には,自分
の意志以外の理由で割り付け(指示)通りの処置を受け
ない人がいるかもしれない
目的
• 自分の意志以外の理由で割り付け(指示)通りの処置を
受けない人が存在する場合の,処置の効果を推定
2
薬の効果

ある人が病気にかかったので薬を飲んだ
病気は治った!



薬を飲まなかったとしたら...
実際には薬を
飲んだので
飲んでない場合に
病気が治ったかど
うかわからない
同じ人が,「薬を飲んだ場合」と「薬を飲まなかった場合」で比較し
たい
しかし,同じ人の「飲んだ場合」と「飲まなかった場合」の両方の結
果を知ることはできない
3
Potential outcome

Z:処置の割り付け変数 (Z = 0, 1)
Y:観測される結果変数 (Y = 0, 1)

Y(1), Y(0):potential outcome (Y(1), Y(0) = 0, 1)


Y(1) は処置を受けた場合の結果
Y(0) は処置を受けなかった場合の結果

Y(1) と Y(0) を両方同時に観測することはできない


観測される結果変数 Y は以下のように表わせる
Y = (1 – Z)Y(0)+ZY(1)
4
平均因果効果


個体の因果効果:Yi(1) – Yi(0)
平均因果効果 (Average Causal Effect) を
ACE = E[Y(1) – Y(0)] = E[Y(1)] – E[Y(0)]
で定義する
•
•

E[Y(1)]:母集団全体が処置を受けたときの結果の平均
E[Y(0)]:母集団全体が処置を受けなかったときの結果の平均
ランダム割り付けにより平均因果効果を推定
5
Non-complier

ランダム割り付けにより平均因果効果の推定
割り付けられ
た群
比較
割り付けられ
ない群
しかし,割り付け通りの処置を受けない人がいる!
Non-complier
例
• 割り付けられても処置を受けない人
• 割り付けられなかったが処置を受ける人

それぞれで効き目が違うと考えられる!
タイプに分ける!
6
4 種類のタイプの人

Z :処置の割り付け変数 (Z = 0, 1)
D :実際に受ける処置の変数 (D = 0, 1)

それぞれのタイプを以下のように定義する.





Complier (Z = D)
Never-Taker (Z によらず常に D = 0)
Always-Taker (Z によらず常に
D = 1)
ここで処置の割り
Defier (D = 1 – Z)付けはランダムに
行う
本研究では Defier は存在
しないと仮定
7
平均因果効果の存在範囲

Balke and Pearl (1997) における平均因果効果の存
在範囲 (Bound) の結果は以下のようである
p11.1  p00.0  1  ACE  1  p01.1  p10.0

Bound における確率 p
p11.1  P (Y  1, D  1 | Z  1), p00.0  P (Y  0, D  0 | Z  0)
p01.1  P (Y  0, D  1 | Z  1), p10.0  P (Y  1, D  0 | Z  0)
⇒この式では何を言っているのかわかりづらい!
8
変数の定義

Complier の割合:pC
Never-Taker の割合:pN
Always-Taker の割合:pA

Complier, Never-Taker, Always-Taker の有効率


RC (1)  P (Y  1 | Complier, D  1)
RC (0)  P (Y  1 | Complier, D  0)
RN (1)  P (Y  1 | NeverTaker, D  1)
RN (0)  P (Y  1 | NeverTaker, D  0)
R A (1)  P (Y  1 | AlwaysTaker, D  1)
R A (0)  P (Y  1 | AlwaysTaker, D  0)
9
平均因果効果の存在範囲



割合:pC, pN, pA
有効率:RC(1), RC(0), RN(1), RN(0), RA(1), RA(0)
平均因果効果は以下のように表せる
ACE  pC {RC (1)  RC (0)}
 pN {RN (1)  RN (0)}  p A {R A (1)  R A (0)}
処置を受け
なかった
NeverTaker
処置を受けた
○
?
処置を受け
なかった
?
処置を受けた
○
AlwaysTaker
Bound の上限では RN(1) = 1, RA(0) = 0
Bound の下限では RN(1) = 0, RA(0) = 1
10
例:成蹊大学における授業
授業1:1限と2限で同じ先生による同じ内容の授業
1限の授業
•
2限の授業
2限はうるさいから嫌
•
•
1限には起きられない
授業2が1限にあるので仕方なく
学籍番号奇数
学籍番号偶数
授業2:授業1とは別の先生が1限だけに行う授業
本来であれば授業1を1限目に受けていたので,never-takerと
処置の効果が同じであると考えるのは適当ではない
11
見かけ上の non-complier



すべての対象は complier と
non-complier である nevertaker,always-taker の 3 タイプ
に分けられる
しかし,non-complier とされた
対象のうち,偶然的な背景や何
らかの理由により割り付けに従
わない場合がある
このような対象を新しく見かけ上
の non-complier (complier2)
と呼ぶ
12
見かけ上の non-complier

見かけ上の non-complier がいるにもかかわらず,いな
いとして評価してしまうと・・・
モデル 1(真の構造)
40



モデル 2
30
9
10
4
40
40
13
モデル 1 では Rˆ N (0)  0.3,モデル 2 では Rˆ N (0)  0.325
Rˆ N (0) を過大評価してしまうことになる
Rˆ A (1) についても同様
13
見かけ上の non-complier



見かけ上の non-complier は complier の有効率と同
じとする
見かけ上の non-complier を complier2 と呼ぶ
平均因果効果は以下のように表わせる
ACE  pC {RC (1)  RC (0)}
 pN {RN (1)  RN (0)}  pA {RA (1)  RA (0)}
pC1 は通常の complier
の割合
ACE  ( pC1  pC 2 ){RC (1)  RC (0)}
 pN {RN (1)  RN (0)}  p A {R A (1)  R A (0)}
14
推定方法(モデル)
N1
N – N2
N3
N
N5
N
x
N4
N - N1
N6
N2
x
全体の半分の人数:N
Z = 1, D = 1 の人数:N1
Z = 1, D = 0 の人数:N – N1
Z = 0, D = 0 の人数:N2
Z = 0, D = 1 の人数:N – N2
Complier2 の人数(未知):x
Z = 1, D = 1, Y = 1 の人数:N3
Z = 1, D = 0, Y = 1 の人数:N4
Z = 0, D = 1, Y = 1 の人数:N5
Z = 0, D = 1, Y = 1 の人数:N6
15
推定方法

Rˆ C (1), Rˆ C (0), Rˆ N (0), Rˆ A (1) は以下のようになる
Rˆ C (1) 
N3  N5
N1  (N  N 2 )
Rˆ C (0) 
N6  N 4
N 2  (N  N1 )




1
N 4  Rˆ C (0)  x
N  N1  x
1
Rˆ A (1) 
N5  Rˆ C (1)  x
N  N2  x
Rˆ N (0) 


Rˆ C (1) と Rˆ C (0) は推定可能
Rˆ N (0) と Rˆ A (1) は実際の complier2 の人数 x が未
知であるため推定不可
16
推定方法

pˆC1, pˆC 2 , pˆ N , pˆ A は以下のようになる
pˆC1 

N1  N 2  x  N
N
pˆC 2 
x
N
pˆ N 
N  N1  x
N
pˆ A 
N  N2  x
N
平均因果効果は以下のようになる
N6  N 4 
 N  N 2  x  N x   N3  N5
ACE   1
 


N
N   N1  (N  N 2 ) N 2  (N  N1 ) 




N  N1  x 
1
ˆ

 RN (1) 
N 4  RC (0)  x 
N
N

N

x
1



N  N2  x 
1


N5  Rˆ C (1)  x  R A (0)
N
 N  N2  x


•
•
Bound の上限では RN(1) = 1, RA(0) = 0
Bound の下限では RN(1) = 0, RA(0) = 1

17
具体例

割合 pC1, pC2, pN, pA と有効率 RC(1), RC(0), RN(0),
RA(1) を設定する
•
•
pC1 = 0.5, pA = 0.1, RC(1) = 0.7, RC(0) = 0.4, RN(0) = 0.3,
RA(1) =0.6 として pC2 と pN を 0.1~0.3 の間で動かす
それぞれの場合で実際に施される処置の人数は固定
60
40
•
20
80
予想されうる complier2 の値を増やしていき,Bound
を評価する
18
推定値のバイアス
Complier2 が存在するにもかかわらず,存在しないと
仮定して推定を行うと・・・
RN(0)
•
•
RC(1) と RC(0) の推定に
バイアスは生じない
0.35
0.33
RN(0)
•
RN(0) と RA(1) の推定に
バイアスが生じる
Complier2 の人数が多
いと,バイアスが大きく
なってしまう
0.31
0.29
RN(0)
0.27
RN(0) 真値
0.25
0
5
10
15
20
予測される Complier2 の人数
RA(1)
0.7
0.6
RA(1)

0.5
0.4
RA(1)
0.3
RA(1) 真値
0.2
0.1
0
5
10
15
20
予測される Complier2 の人数
19
平均因果効果の Bound
PC1=0.5 PC2=0.1 PN=0.3 PA=0.1
PC1=0.5 PC2=0.2 PN=0.2 PA=0.1
0.6
0.6
0.5
0.5
0.4
0.3
upper
0.2
lower
0.1
BP upper
0
-0.1 0
5
10
15
20
complier2の真値
-0.2
-0.3
BP lower
ACE
ACE
0.4
0.3
upper
0.2
lower
0.1
BP upper
0
-0.1 0
20
30
BP lower
complier2の真値
-0.2
-0.3
予測される Complier2 の人数
10
予測される Complier2 の人数
PC1=0.5 PC2=0.3 PN=0.1 PA=0.1
0.6
0.5
ACE
0.4
0.3
upper
0.2
lower
0.1
BP upper
0
-0.1 0
10
20
30
40
complier2の真値
-0.2
-0.3
BP lower
■は Balke and Pearl (1997)
の Bound
縦軸:平均因果効果
横軸:Complier2 の人数
予測される Complier2 の人数
20
まとめと今後の課題





見かけ上の non-complier を含んだ新しいモデルを提
案し,平均因果効果の Bound を導出した
RC(1) と RC(0) は推定可能
見かけ上の non-complier を含んだモデルでは RN(0)
と RA(1) は推定不可
見かけ上の non-complier の比率に関する外部的な
情報があれば推定可能
中程度の標本における Bound のシミュレーションを用
いた推定精度の評価は現在作成中
21
参考文献


Balke, A. and Pearl, J. (1997) Bound on treatment
effects from studies with imperfect compliance.
Journal of the American Statistical Association, 92,
1171-1176.
Yamashita, H., Sano, F. and Iwasaki, M. (2012)
Influence of random non-compliance to
performance of estimation for a causal effect under
non-compliance. The 26th International Biometric
Conference (Kobe), 2012. 8.
22