ロジスティック変換によるパラメータ推定1

ロジスティック回帰分析
ロジスティック変換による推定
従属変数が比率のとき
• 製造工程における熱処理時間をxとする。
• xを1から7(秒)まで変化させて、各条件で
100個の製品を製造した結果
加熱時間(x)
1
2
3
4
5
6
7
良品数
97
94
79
54
23
9
3
不良品数
3
6
21
46
77
91
97
不良率(y)
3%
6%
21%
46%
77%
91%
97%
不良品率(y)
加熱時間と不良品率の関係
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0
2
4
加熱時間(x)
6
8
問題
• 不良品率を従属変数、加熱時間を独立変数
とする回帰式を求めなさい。
• 推定されたパラメータを用いて予測値を求め
なさい。
• 予測値と観測値をグラフに描きなさい。ただし
横軸を加熱時間(x)とする。
普通の回帰分析を適用
• 不良率(y)を従属変数
• 加熱時間(x)を独立変数
y  -0.23857 0.181429 x
不良品率(y)
不良率の予測値
110%
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
-10% 0
2
4
加熱時間(x)
6
8
予測値の問題点
x
1
2
3
4
5
6
7
予測値
-5.71%
12.43%
30.57%
48.71%
66.86%
85.00%
103.14%
ロジスティック回帰
• 不良品率を y とし独立変数 x とする。
1
yi 
1  exp    xi 
( +  xi)に関して解いた式
 yi 
    xi
log 
 1  yi 
左辺を対数オッズという。
対数オッズを従属変数とする普通の回
帰分析を行えばよい。
問題
• 対数オッズ(log(y/(1 - y)))を求めなさい。
• 対数オッズを従属変数とし、加熱時間を独立
変数とする回帰直線を求めなさい。
• 推定値を用いて、ロジスティック曲線を求めな
さい。(回帰直線を y について解きなさい。)
• ロジスティック曲線を用いて予測値を求めなさ
い。
対数オッズの算出
y
1-y
y/(1-y)
log(y/(1-y))
x
0.03
0.97
0.03
-3.48
1
0.06
0.94
0.06
-2.75
2
0.21
0.79
0.27
-1.32
3
0.46
0.54
0.85
-0.16
4
0.77
0.23
3.35
1.21
5
0.91
0.09
10.11
2.31
6
0.97
0.03
32.33
3.48
7
対数オッズを従属変数とする回帰分析
 yi 
  4.89  1.20  xi
log 
 1  yi 
1
yi 
1  exp 4.89  1.20  xi 
観測値と予測値
x
1
2
3
4
5
6
7
不良率
3.00%
6.00%
21.00%
46.00%
77.00%
91.00%
97.00%
予測値
2.43%
7.61%
21.43%
47.45%
74.93%
90.82%
97.04%
観測値と予測値
100%
90%
80%
70%
60%
50%
40%
観測値
予測値
30%
20%
10%
0%
0
1
2
3
4
5
6
7
8
問題
• シート「3-2」を使い、対数オッズを従属変数
とする回帰分析を行いなさい
• 求められたパラメータを使い推定されたロジ
スティック曲線を式で表しなさい
• 観測値と予測値を散布図に表しなさい。