Untitled - Cloudfront.net

製品名は IBM® SPSS® Statistics が正式な名称です。
本書を発行するにあたって、内容に誤りのないようできる限りの注意を払いましたが、
本書の内容を適用した結果生じたこと、また、適用できなかった結果について、著者、
出版社とも一切の責任を負いませんのでご了承ください。
IBM、IBM ロゴ、ibm.com、および SPSS は、世界の多くの国で登録された International Business Machines Corporation の商標です。他の製品名およびサービス名等は、
それぞれ IBM または各社の商標である場合があります。現時点での IBM の商標リス
トについては、www.ibm.com/legal/copytrade.shtml をご覧ください。
その他、本書に掲載されている会社名・製品名は一般に各社の登録商標または商標です。
はじめに
回帰分析は統計的方法の中でも、最も頻繁に、そして、さまざまな分野で
広く利用されている手法の一つで、研究上興味のある数値を予測するための
手法である。たとえば、新製品の売り上げに興味があるならば、その値を類
似製品の売り上げで、つまり、他の数値を使って予測するというような状況
で使われる。さらに、予測だけでなく、興味を持っている数値がばらつく要
因を見つけるのにも応用されている。
回帰分析は数値を予測するのに使われる手法であるが、数値を予測したい
のではなく、買うか買わないか、合格か不合格かを予測したいという状況も
頻繁にある。また、どういう人が買わないか、どういう人が不合格になるか
といった要因を見つけたいという状況もある。このように、予測したい項目
が数値では表せないが、カテゴリ(種類)としては表現できるというときに
使われるのがロジスティック回帰である。
ロジスティック回帰は計算式を知っていても、筆算で結果を出せるもので
はなく、統計ソフトと呼ばれる専門のツールが必要になる。本書では SPSS
と呼ばれる統計ソフトを利用している。本書は、ロジスティック回帰の使い
方と、ロジスティック回帰を SPSS で実施する方法を学んだいただくための
書籍である。
改訂版(第 2 版)にあたり
本書はロジスティック回帰の専門書なので、回帰分析の用語や基礎知識に
ついては改訂にあたり割愛した。
本書の構成はつぎの通りである。
第1章はロジスティック回帰の概要と基本を解説している。
第2章はロジスティック回帰の実践的例題を紹介している。
第3章は、数値で表現できないカテゴリ変数の扱い方、ロジスティック回
帰と関係の深いオッズ比の扱い方、変数同士の交互作用(組合せ効果)の扱
い方を取り上げて解説している。
第4章は、ロジスティック回帰において、重要な役割を果たす変数を統計
学的に選び出すための方法について紹介している。
iii
第5章は、ロジスティック回帰を実践する際に直面する課題を取り上げて
解説している。
第6章は、対応のあるデータの解析方法として、条件付きロジスティック回
帰を紹介している。
第7章は、予測したい項目の種類の数が 3 つ以上に分かれるようなときに
使う特殊なロジスティック回帰の手法として、多項ロジスティック回帰と順
序ロジスティック回帰を紹介している。
第8章ではロジスティック回帰を含んだ広範囲な手法として、一般化線型
モデルを紹介している。また、一般化推定方程式と呼ばれる反復測定のある
データに対するロジスティック回帰の方法も取り上げている。
第9章は傾向スコアを取り上げている。傾向スコアは交絡因子を調整する
方法で、傾向スコアの計算にロジスティック回帰が用いられている。
付録として、ロジスティック回帰にまつわる話題や関係の強い手法、また、
本文中では触れていない SPSS の操作方法を紹介している。
本書では SPSS を用いているが、このソフトウェアの正式名称は IBM
SPSS Statistics で、バージョンは 23 を使用している。なお、ロジスティッ
ク回帰を実行するには、基本システムのほかに IBM SPSS Regression とい
うオプションが必要になる。さらに、第 6 章で登場する Cox 回帰と呼ばれる
方法を使うには、IBM SPSS Advanced Statistics というオプションが必要
になる。
2016 年 1 月
内 田 治
iv
目 次
第 1 章 ロジスティック回帰入門
§1
目的変数が比率データのとき
1
2
1.1
例題 1 ………………………………………………………2
1.2
ロジスティック回帰分析の適用 …………………………4
1.3
ロジスティック曲線の性質 ……………………………10
1.4
SPSS の手順 ……………………………………………16
§2
目的変数がカテゴリデータのとき
19
2.1
例題 2………………………………………………………19
2.2
ロジスティック回帰分析の適用 ………………………20
第 2 章 ロジスティック回帰の実践
§1
基礎的解析
27
28
1.1
例題 3………………………………………………………28
1.2
視覚的解析 ………………………………………………30
1.3
数値的解析 ………………………………………………36
§2
ロジスティック回帰の実施
40
§3
単変量のロジスティック回帰
48
第 3 章 ロジスティック回帰の応用
§1
カテゴリ変数とダミー変数
51
52
1.1
例題 4………………………………………………………52
1.2
例題 5………………………………………………………57
v
§ 2 オッズ比
2.1
例題 6………………………………………………………61
2.2
オッズ比とロジスティック回帰 ………………………66
§ 3 交互作用
68
3.1
例題 7………………………………………………………68
3.2
交互作用のオッズ比 ……………………………………73
第 4 章 説明変数の選択
79
§ 1 総当たり法
80
§ 2 逐次変数選択法
85
第 5 章 ロジスティック回帰の留意点
§ 1 多重共線性
95
96
1.1
例題 8………………………………………………………96
1.2
例題 9………………………………………………………99
§ 2 完全分離
105
2.1
説明変数が数値変数の例 ………………………………105
2.2
説明変数がカテゴリ変数の例 …………………………111
§ 3 外れ値と影響度
115
§ 4 ROC 曲線
126
第 6 章 条件付きロジスティック回帰
vi
61
129
§ 1 対応のあるデータ
130
§ 2 条件付きロジスティック回帰の実際
132
2.1
例題 10 …………………………………………………132
2.2
多項ロジスティック回帰による方法 …………………133
2.3
Cox 回帰による方法……………………………………139
第 7 章 ロジスティック回帰の拡張
§1
多項ロジスティック回帰
143
144
1.1
例題 11 …………………………………………………145
1.2
SPSS の操作 ……………………………………………147
1.3
多項ロジスティック回帰の結果 ………………………149
1.4
ロジスティック回帰による分割表の解析 ……………151
§2
順序ロジスティック回帰
155
2.1
例題 12 …………………………………………………156
2.2
SPSS の操作 ……………………………………………158
2.3
順序ロジスティック回帰の結果 ………………………160
2.4
順序カテゴリを含んだ分割表の解析 …………………162
第 8 章 一般化線形モデル
§1
167
一般化線形モデルによるロジスティック回帰 168
1.1
一般線型モデルと一般化線型モデル …………………168
1.2
一般化線型モデルの実際 ………………………………169
1.3
SPSS の手順 ……………………………………………172
§2
一般化推定方程式によるロジスティック回帰 176
2.1
反復測定と一般化推定方程式 …………………………176
2.2
例題 13 …………………………………………………177
2.3
SPSS の手順 ……………………………………………178
第 9 章 傾向スコアとロジスティック回帰
§1
傾向スコアと変数の調整
183
184
1.1
交絡因子 …………………………………………………184
1.2
傾向スコア ………………………………………………185
§2
傾向スコアの使い方
186
2.1
例題 14 …………………………………………………186
2.2
傾向スコアによるマッチング …………………………192
vii
付 録
205
補記 1 相互検証法とリサンプリング法
viii
206
1
予測精度の検証 ……………………………………………206
2
回帰係数の検証 ……………………………………………208
補記 2 オッズ比と標準偏回帰係数
211
補記 3 二項ロジスティック回帰と
多項ロジスティック回帰
214
補記 4 ケース・コントロールのマッチング
220
補記 5 SPSS の操作手順
224
補記 6 相互検証法の手順
234
補記7 対数線型モデルとロジスティック回帰
239
参考文献
242
索 引
243
第
ロジスティック回帰入門
§ 1 目的変数が比率データのとき
1.1 例題 1
1.2 ロジスティック回帰分析の適用
1.3 ロジスティック曲線の性質
1.4 SPSS の手順
§ 2 目的変数がカテゴリデータのとき
2.1 例題 2
2.2 ロジスティック回帰分析の適用
ロジスティック回帰は、予測したい変数である目的変数がカ
テゴリ変数のときに用いられる手法である。また、目的変数が
比率(割合)のデータのときにも、利用することができる。そ
こで、ロジスティック回帰の基本的な考え方を、最初に比率の
データを目的変数とする例を取り上げて解説する。つぎに、ロ
ジスティック回帰の本来の使い方であるカテゴリ変数を目的変
数とした例を取り上げて、ロジスティック回帰による解析結果
の見方を解説する。
1章
第1章 ロジスティック回帰入門
§1 目的変数が比率データのとき
1.1 例題 1
製造工程における熱処理時間を x とする。x を 1 から 7(秒)まで変化させ
て、各条件で 100 個の製品を製造した結果、つぎのようなデータが得られた
とする。
x
良品数
不良数
合計
不良率 y
1
97
3
100
0.03
2
94
6
100
0.06
3
79
21
100
0.21
4
54
46
100
0.46
5
23
77
100
0.77
6
9
91
100
0.91
7
3
97
100
0.97
x から不良率 y を予測する式を考えよう。
■■ 散布図
x と y の散布図を作成する。曲線的に右上がりとなっている。
1.2
1
0.8
y
0.6
0.4
0.2
0
0
2
4
x
▲ x と y の散布図
2
6
8
§ 1 目的変数が比率データのとき
■■ 回帰分析の適用
不良率 y を目的変数、熱処理時間 x を説明変数とする単回帰分析を行うと
つぎのような回帰式が得られる。
y = − 0.2386 + 0.1814 x
この回帰式の寄与率 R 2 は 0.9591 と 1 に近く、直線によく当てはまっている
と考えてよさそうである。
1.2
1
0.8
y
0.6
0.4
y = - 0.2386 + 0.1814 x
R2 = 0.9591
0.2
0
0
−0.2
1
2
3
4
5
6
7
8
x
▲ 回帰直線
しかし、この回帰式で不良率 y を予測しようとすると、x の値が小さいと
ころ、あるいは、大きいところでの予測がうまくいかないのである。
x=1
のときの y の予測値=− 0.0572
x=7
のときの y の予測値= 1.0312
となり、y は不良率であるから 0 以上 1 以下の値でなければいけないのにも
かかわらず、負の値をとる不良率や 100 %を超える不良率が得られてしまう。
このように、比率が目的変数となるような予測式を作成するときには、通
常の回帰分析ではなく、ロジスティック回帰分析を適用するとよい。
3
第1章 ロジスティック回帰入門
1.2 ロジスティック回帰分析の適用
ロジスティック回帰では、比率 y と説明変数 x の間に、つぎのような関係
を想定する。
y=
1
1
=
1 + e{- ( b0 + b1x )} 1 + exp{-(b0 + b1 x )}
ln ÊË
y ˆ
= b0 + b1 x1
1- y¯
これは、
という回帰式を求めることと同じである。
y に対して、
ln ÊË
y ˆ
1- y ¯
なる変換を施すことをロジット変換といい、logit (y) とも表現する。
y
また、 1- y をオッズと呼んでいる。
1
0.8
y
0.6
0.4
0.2
0
0
1
2
3
4
5
x
▲ ロジスティック曲線
4
6
7
8
§ 1 目的変数が比率データのとき
■■ ロジスティック回帰の結果
ロジスティック回帰を適用すると、つぎのような結果が得られる。
[1]回帰式
回帰式は
Z = logit (y)= − 5.025 + 1.228 x
y = 1/(1+EXP (–Z))
と求められている。x の係数が正であるから、x の値が増えると、不良率も
高くなることがわかる。
[2]回帰式の有意性
この式の p 値は「モデル」の「有意確率」の数値から、0.000 となってお
り、通常用いられる有意水準 0.05 以下であるので、この回帰式には意味があ
ると判断できる。
[3]対数尤度と寄与率
通常の回帰分析における総平方和に相当する尤度は、n 個中に r 個の不良
があったとき、不良率 r/n を y とすると、
5
第1章 ロジスティック回帰入門
尤度 = y r (1− y) n–r
として求めることができる。この例題では、不良率 y = 341 / 700
尤度 = (341 / 700)
341
×(1− 341 / 700)
から、
700 − 341
したがって、
(− 2 ×対数尤度)=− 2 ×{341 ln (y) + (700 − 341) ln (1− y)}
= 969.943
となる。モデルが完全に適合しているとき、尤度は1、対数尤度は 0 となる。
【注】 この値を SPSS で出力させるには、[二項ロジスティック回帰]におけ
るダイアログボックスの[オプション]にある[反復の記述]にチェ
ックを入れると、以下のような結果が得られる。
回帰平方和に相当する(− 2 ×対数尤度)は、モデルの「カイ2乗」の値
として得られている 460.791 である。
残差平方和に相当する(− 2 ×対数尤度)は、969.943 − 460.791 として求
められ、この値が「モデル要約」にある「− 2 対数尤度」の値として得られ
ている 509.152 である。
寄与率は回帰平方和に相当する対数尤度と、総平方和に相当する対数尤度
の比として定義され、
R 2 = 460.791 / 969.943 = 0.475
として求められる。
この R 2 は SPSS の二項ロジスティックでは出力されないので、出力結果を
利用して筆算により、つぎのように求める。
6
§ 1 目的変数が比率データのとき
R 2 = 460.791 /(460.791 + 509.152) = 460.791 / 969.943 = 0.475
【注】 この値を SPSS で出力させるには、[多項ロジスティック回帰]のメニ
ューで二項ロジスティックを実施する。
「McFadden の R2 乗」として、
以下のように得られる。
[4]その他の寄与率
SPSS では、つぎの2種類の寄与率が提唱されている。
L( 0 )
Cox & Snell の寄与率 = 1 - ÈÍ L( B) ˘˙
Î
˚
2 n
L( 0 )
Ê
Nagelkerke の寄与率 = Ë1 - L( B)
2 n
[ ]
ˆ
¯
(1 - [ L(0)] )
2 n
ここで、
L(0) = EXP(総平方和に相当する尤度)
L(B) = EXP(残差平方和に相当する尤度)
n
= データの総数 (= 700)
ところで、ロジスティック回帰における寄与率(R 2、Cox & Snell の寄与
率、Nagelkerke の寄与率)は、通常の回帰分析における寄与率よりも小さ
めの値となることが多く、イメージと合わないことがある。そこで、比率デ
ータを目的変数とするロジスティック回帰のときには、回帰式により y の予
測値を計算して、(実際の比率)と(予測した比率)の相関係数を計算し、
その値を 2 乗した値を寄与率の代わりとして見るのも一つの方法である。こ
の例題では、つぎのように計算される。
7
第1章 ロジスティック回帰入門
実際の比率
予測した比率
0.03
0.0219
0.06
0.0712
0.21
0.2073
0.46
0.4718
0.77
0.7531
0.91
0.9124
0.97
0.9726
(実際の比率)と(予測した比率)の相関係数 = 0.9997
(寄与率の代用)=(相関係数)2 = 0.9997 2 = 0.9993
[5]回帰係数の有意性
回帰係数の有意性を見るための検定(帰無仮説 H0 :β= 0)には、Wald
の統計量が用いられる。これは通常の回帰分析におけるF 値に相当し、自由度
1のχ 2 分布に従う。有意性を評価するための値が、「有意確率」の列に表示
される。この値は「p 値」と呼ばれる。事前に決めた有意水準α(通常 0.05)
以下のときに、有意と判定する。この例では 0.000 であるから、有意である。
[6]正解率
ロジスティック回帰式を用いた的中率(この例題では良品か不良品かを当
てる確率)を見るには、つぎの分類テーブルを見るとよい。
8
§ 1 目的変数が比率データのとき
ただし、比率データに適用するときには、この表の吟味に注意が必要であ
る。たとえば、つぎのように常に 0.5 以下の不良率であるような場合である。
x
良品数
不良数
合計
不良率 y
1
97
3
100
0.03
2
94
6
100
0.06
3
79
11
100
0.11
0.21
4
54
21
100
5
23
28
100
0.28
6
9
35
100
0.35
7
3
41
100
0.41
不良率が 0.5 未満ならば、良品の確率のほうが高いので、常に良品と判定
すればよいことになり、以下のような分類テーブルになる。
9
第1章 ロジスティック回帰入門
1.3 ロジスティック曲線の性質
■■ 曲線の形
ロジスティック回帰式として
logit (y) = β 0 +β 1 x
を想定したときに、β 0 とβ 1 の変化に応じて、ロジスティック曲線がどの
ように変化するかを紹介する。
最初に、β 0 を− 4 に固定して、β 1 を 0.6、0.8、1、1.5、2 と変化させたと
きのロジスティック曲線を表示する。横軸が x で、縦軸が比率 y である。β 1
が大きくなるにつれて、ロジスティック曲線が立ってくることがわかる。ま
た、対数オッズ ln (y/(1–y)) を縦軸にすると、曲線が直線となることがわか
る。この直線もβ 1 が大きくなるにつれて、立ってくる。
確 1
率
0.9
π
0.8
b 0 = - 4, b 1 = 2
b 0 = - 4, b 1 = 1.5
0.7
0.6
b 0 = - 4, b 1 = 1
0.5
b 0 = - 4, b 1 = 0.8
b 0 = - 4, b 1 = 0.6
0.4
0.3
0.2
0.1
0
0
2
4
6
8
x
▲ ロジスティック曲線
10
10
§ 1 目的変数が比率データのとき
20
対
数
オ
15
ッ
ズ
b 0 = - 4, b 1 = 2
b 0 = - 4, b 1 = 1.5
b 0 = - 4, b 1 = 1
10
b 0 = - 4, b 1 = 0.8
b 0 = - 4, b 1 = 0.6
5
0
0
2
4
6
8
10
12
-5
x
▲ ロジット変換
一方、β 1 を 1 に固定して、β 0 を− 4、− 5、− 6、− 7、− 8 と変化させ
たときのロジスティック曲線を表示する。β 1 が変わらないときには、平行
になっていることがわかる。
確 1
率
0.9
π
0.8
b 0 = - 8, b 1 = 1
0.7
b 0 = - 7, b 1 = 1
0.6
b 0 = - 6, b 1 = 1
0.5
b 0 = - 5, b 1 = 1
b 0 = - 4, b 1 = 1
0.4
0.3
0.2
0.1
0
0
2
4
6
8
10
12
x
▲ ロジスティック曲線
11
第1章 ロジスティック回帰入門
8
対
数
オ
ッ
ズ
6
4
b 0 = - 8, b 1 = 1
2
b 0 = - 7, b 1 = 1
0
b 0 = - 5, b 1 = 1
b 0 = - 6, b 1 = 1
0
2
4
6
8
10
12
–2
b 0 = - 4, b 1 = 1
–4
–6
–8
x
▲ ロジット変換
■■ 対数オッズと正規分布近似
ここで、比率データの分布について、解説しておこう。
いま、母集団における注目事象の発生比率をπとし、この母集団から抜き
)
取ったサンプルにおける発生比率を p とする。サンプルの大きさを n、注目
)
事象の発生数を r とすると、 p = r/n である。
一方、注目事象が j 回発生する確率 f (j) はつぎのように計算される。
f (j) = nCj ×π j ×(1 −π) n–j
( j=0∼n )
これから注目事象の発生数 r の確率分布は、n = 20、π= 0.6 としたとき、
つぎのようになる。
確
率
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
発生数
12
§ 1 目的変数が比率データのとき
発生数が n π= 20 × 0.6 = 12 のとき、最も大きな確率となっている。
発生比率 の確率分布は横軸を n で割った値となり、つぎのようになる。
確
率
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
0.1
0.2
0.3
0.4
0.5
)
p
0.6
0.7
0.8
0.9
1
このような確率分布を二項分布という。二項分布は正規分布とは異なる分
布であるが、これを正規分布とみなしてしまうことを直接正規近似と呼んで
いる。
一般に、n π≧ 5、n (1 −π)≧ 5 が成立しているとき、正規分布とみなして
よいと言われている。
)
)
つぎに、オッズ p /(1 − p ) の分布を考えると、それはつぎのようになり、
正規分布とはかなり異なる形になる。
確
率
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
オッズ
13
第1章 ロジスティック回帰入門
)
)
ここで、ロジット変換した値、すなわち、オッズの対数 ln( p /(1 − p ))
の分布を考えると、つぎのようになり、正規分布に近い形となる。
0.2
確
率
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
–4
–3
–2
–1
0
1
2
3
4
ln(オッズ)
これを正規分布とみなしてしまうことをロジット変換による正規近似と呼
んでいる。
)
)
)
p と対数オッズ ln( p /(1 − p ))の関係は右のようなグラフに表現する
ことができる。
4
対
数
オ
ッ
ズ
3
2
1
0
0
0.1
0.2
0.3
0.4
0.5
–1
–2
–3
–4
14
)
p
0.6
0.7
0.8
0.9
1
§ 1 目的変数が比率データのとき
)
ところで、 p が 0 または 1 のとき、対数オッズ は計算できなくなる。そこ
)
で、 p を r / n で計算せずに、(r + 0.5)/(n + 1)として計算する方法が
ある。これは正規分布に近づけるときの近似精度もよくする。
■■ 角変換と正規分布近似
)
参考までに、角変換による正規近似方法もあることを紹介しておく。 p
)
-1
に対して sin ( p ) の値を求めることを角変換と呼んでいる。角変換した値
の分布は以下のようになり、正規分布に近い形となると同時に、分散を安定
化することもできる。
確
率
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
0.1 0.2 0.3
0.4
0.5
0.6
0.7 0.8
0.9
1
1,1 1,2
1,3
1,4 1,5
)
sin -1 ( p )
15
第1章 ロジスティック回帰入門
1.4 SPSS の手順
① データの入力
② 度数変数の宣言
変数「度数」は度数変数であることを宣言する。
このためには、メニューから[データ]→[ケースの重み付け]と選択する。
16
§ 1 目的変数が比率データのとき
[度数変数]に「度数」を投入する。
[OK]をクリックする。
③ ロジスティック回帰の実行
メニューから[分析]→[回帰]→[二項ロジスティック]と選択する。
17
第1章 ロジスティック回帰入門
④ 目的変数と説明変数の設定
[従属変数]に目的変数となる y
[共変量]に説明変数となる x
を投入する。
[OK]をクリックする。
18
§ 2 目的変数がカテゴリデータのとき
§2 目的変数がカテゴリデータのとき
2.1 例題 2
つぎのデータは、何らかの病気や怪我で介護を受けている 20 人の患者に
アンケート調査を実施して得た結果を一覧表に整理したものである。
x は年齢、y は介護に満足か不満かを答えている。ここで、目的変数を y、
説明変数を x とするロジスティック回帰を実施する。
■ データ表(1)
1
61
満足
2
63
満足
3
60
満足
4
50
満足
5
57
満足
6
54
満足
7
67
満足
8
55
満足
9
72
満足
10
54
満足
11
78
不満
12
71
不満
13
81
不満
14
77
不満
15
69
不満
16
75
不満
17
76
不満
18
89
不満
19
67
不満
20
86
不満
先ほどの例題 1 は、目的変数が比率データであった。比率の値は集計済み
のデータということになる。この例題は、20 人分のデータであり、集計前
のデータである。
19
第1章 ロジスティック回帰入門
2.2 ロジスティック回帰分析の適用
■■ データのグラフ表現
このような事例では、層別ドットプロットや散布図が有効である。不満群
のほうが x の値が大きい、すなわち、年齢が高いことがわかる。
満
足
y
不
満
50
60
70
80
90
x
▲ 層別ドットプロット
90
x
80
70
60
50
1
2
y
▲ 散布図によるグラフ化
【注】y = 1 ならば不満、y = 2 ならば満足
20
§ 2 目的変数がカテゴリデータのとき
■■ ロジスティック回帰の結果
ロジスティック回帰を適用すると、つぎのような結果が得られる。
この表は、不満ならば y = 0、満足ならば y = 1 として、SPSS が処理して
いることを示している。これは式を解釈するときに重要な情報となる。
[1]回帰式
回帰式は
Z = logit(y)= 28.576 − 0.419 x
y = 1/(1+EXP(–Z))
と求められている。x の係数が負であるから、x の数値が増えると、満足
(内部コードで満足を 1 としている)の確率 y は小さくなることがわかる。
[2]回帰式の有意性
この式の p 値は「モデル」の「有意確率」の数値から、0.000 となってお
り、通常用いられる有意水準 0.05 以下であるので、この回帰式には意味があ
ると判断できる。
21
第1章 ロジスティック回帰入門
[3]対数尤度と寄与率
Cox & Snell の寄与率と Nagelkerke の寄与率から、この回帰モデルの寄与
率は 0.613 ∼ 0.817 と考えられる。
[4]回帰係数の有意性
x の p 値は 0.045 となっており、有意である。
[5]的中率
ロジスティック回帰式を用い的中率(この例題では満足か不満かを当てる
確率)を見るには、つぎの分類テーブルを見るとよい。この分類テーブルは、
以下の判別規則を作り、判別した結果である。
満足となる確率> 0.5 のとき、その人は満足と判別
満足となる確率< 0.5 のとき、その人は不満と判別
不満の人の 90 %、満足の人の 90 %、全体の 90 %を的中させていることが
わかる。
22