ロジスティック変換によるパラメータ推定

ロジスティック回帰分析
ロジスティック変換による推定
1
準備
指数関数と対数関数
2
e という数
n
 1
e  lim 1    2.71828
n 
 n
3
e の累乗
e は累乗されて議論されることが多い
そのため、e の累乗を以下のように表す。
e  exp x 
x
4
exp(x)の値
exp(x)
x
e
値
exp(-2)
e-2=1/e2
0.135
exp(-1)
e-1=1/e
0.367
exp(0)
e0
1.000
exp(1)
e1=e
2.718
exp(2)
e2
7.389
5
指数関数と対数関数
y=e
x を x について解いた式を
x = log y
という記号で表す。
x を指数関数と呼び
y=e
x = log y を対数関数と呼ぶ
6
従属変数が比率のとき
• 製造工程における熱処理時間をxとする。
• xを1から7(秒)まで変化させて、各条件で
100個の製品を製造した結果
加熱時間(x)
1
2
3
4
5
6
7
良品数
97
94
79
54
23
9
3
不良品数
3
6
21
46
77
91
97
不良率(y)
3%
6%
21%
46%
77%
91%
97%
7
加熱時間と不良品率の関係
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0
1
2
3
4
5
6
7
8
8
問題
表を完成させなさい
i
x
y
x2
xy
1
2
3
4
5
6
7
合計
1
2
3
4
5
6
7
28
0.03
0.06
0.21
0.46
0.77
0.91
0.97
3.41
1
4
9
16
25
36
49
140
0.03
0.12
0.63
1.84
3.85
5.46
6.79
18.72
9
問題
a , b を求めなさい。
 x   y    x y  x 
n
a
n
2
i
i 1
n
i
i 1
n
i
i 1
n


2
n xi     xi 
i 1
 i 1

n
b
i
n
n
n
i 1
i 1
i 1
i 1
2
i
n xi yi    xi   yi 


n x     xi 
i 1
 i 1

n
n
2
2
i
10
普通の回帰分析を適用
• 不良率(y)を従属変数
• 加熱時間(x)を独立変数
y  -0.23857 0.181429 x
11
不良率の予測値
110%
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
-10% 0
1
2
3
4
5
6
7
8
12
予測値の問題点
x
1
2
3
4
5
6
7
予測値
-5.71%
12.43%
30.57%
48.71%
66.86%
85.00%
103.14%
13
ロジスティック回帰
不良品率を y を従属変数とし
加熱時間を x 独立変数とする。
1
yi 
1  exp  a  bxi 
14
問題
(a + b xi ) について解きなさい
1
yi 
1  exp  a  bxi 
 yi 
  a  bxi
log 
 1  yi 
15
(a + b xi)に関して解いた式
 yi 
  a  bxi
log 
 1  yi 
左辺を対数オッズという。
対数オッズを従属変数とする普通の回
帰分析を行えばよい。
16
対数オッズの算出
y
1-y
y/(1-y)
log(y/(1-y))
x
0.03
0.97
0.03
-3.48
1
0.06
0.94
0.06
-2.75
2
0.21
0.79
0.27
-1.32
3
0.46
0.54
0.85
-0.16
4
0.77
0.23
3.35
1.21
5
0.91
0.09
10.11
2.31
6
0.97
0.03
32.33
3.48
7
17
対数オッズを従属変数とする回帰分析
i
y
x
x2
xy
1
2
3
4
5
6
7
合計
-3.48
-2.75
-1.32
-0.16
1.21
2.31
3.48
-0.71
1
2
3
4
5
6
7
28
1
4
9
16
25
36
49
140
-3.48
-5.50
-3.97
-0.64
6.04
13.88
24.33
30.66
18
問題
対数オッズを従属変数とし、加熱
時間を独立変数として回帰直線を
求めなさい
 yi 
  4.89  1.20  xi
log 
 1  yi 
19
問題
以下の式を yi に関して解きなさい。
 yi 
  4.89  1.20  xi
log 
 1  yi 
1
yi 
1  exp   4.89  1.20  xi 
20
観測値と予測値
x
1
2
3
4
5
6
7
不良率
3.00%
6.00%
21.00%
46.00%
77.00%
91.00%
97.00%
予測値
2.43%
7.61%
21.43%
47.45%
74.93%
90.82%
97.04%
21
観測値と予測値
100%
90%
80%
70%
60%
50%
40%
観測値
予測値
30%
20%
10%
0%
0
1
2
3
4
5
6
7
8
22