c) 確率分布

第5章 回帰分析入門
統計学 2006年度
Ⅰ 経済の統計的分析
a) 経済学における統計学の役割
b) 相関関係と因果関係
c) 計量経済分析とは
Ⅱ 記述統計としての回帰分析
a) 回帰係数の導出
1) 最小2乗法
2) 予測値と残差
b) 決定係数
Ⅲ 回帰分析の統計的推論
a) 回帰係数の区間推定
b) 回帰係数の有意性検定
Ⅰ 経済の統計的分析
a) 経済学における統計学の役割
経済学における統計学の果たす役割としては主に2つある。
• 統計データによる現実経済の理解
– 各世帯の貯蓄額をヒストグラムであらわす
– 失業率の誤差がどの程度か考える
– 目標精度にあわせた標本調査の設計
• 経済理論の検証
– 経済理論における因果関係の分析
記述統計、推測統計ともに経済学に貢献をしている。
b) 相関関係と因果関係
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
所得(X ) 消費(Y)
212
173
217
181
223
187
228
192
234
198
243
205
248
214
259
225
271
236
280
246
290
252
296
257
300
260
306
265
314
271
322
279
320
280
321
278
左の表は日本の実質家計可処分所得
(所得(X)と記述)と、実質家計最終消
費支出 (消費(Y)と記述)の、1981年か
ら1998年までのデータである。
このデータを横軸に所得、縦軸に消費
をとった散布図であらわすと、下の図
のようになる。
所得と消費
300
280
260
消費
年
240
220
200
180
160
200
220
240
260
280
所得
300
320
340
<参考> 「第1章 記述統計の復習」より
正の相関(r>0)
負の相関(r<0)
•Xが大きな値をとる
ほど、Yも大きな値を
とる。
•Xが大きな値をとる
ほど、Yは小さな値を
とる。
無相関(r=0)
•Xの値とYの値に一
定の傾向がみられな
い。
所得と消費の散布図を見ると、「所得と消費の間には正の相関があ
る」といえる。
– 所得が多くなれば、消費も多くなる。
– 所得が少なくなれば、消費も多くなる。
• 所得と消費の関係は相関関係だけではなく、所得を原因、消費を結
果とする因果関係が成り立っている。
• 因果関係
– 一方が原因となって、もう一方が結果となる関係。原因と結果を
反対にすることはできない。
(例)所得が高い(原因)⇒消費が多い(結果)
相関関係
因果関係
※ 風が吹くと桶屋が儲かる
風が吹くと砂ぼこりが立つ
→ 砂ぼこりで目を痛めて失明する人が増える
→ 失明した人はよく三味線を弾くのでその需要が増える
→ 三味線には猫の皮を張るので猫が捕獲されて数が減る
→ するとねずみが増えるので桶がたくさんかじられる
→ だから桶屋が儲かる
最終的には
風が吹く(原因) ⇒ 桶屋が儲かる(結果)
c) 計量経済分析とは
• 経済理論はこのような因果関係の積み重ねである。
(例) 「利子率を下げると消費が拡大し、需要が喚起される」
このような論理の積み重ねによって、経済の現状把握・予測
をおこなうことを定性的分析という。
• これから一歩踏み込んで、
「利子率を○%下げると消費が拡大し、○○円程度の需要が喚起される」
というように、数量的な把握をするものが定量的分析である。
• このような定量的分析をおこなうために、統計データが用い
られる。
(例) 風速○メートルの風が吹けば、失明する人が○人増えて (中略)
桶屋が○○円儲かる。
• 統計データを用いた定量的分析のことを、計量分析という。
経済分析における計量分析が計量経済分析である。
• 計量経済分析をおこなうことによって、経済理論が現実経済
に合致しているかどうかのチェックをおこなうことができる。
• 因果関係の定量的分析には回帰分析という統計手法がよく
用いられる。
Ⅱ 記述統計としての回帰分析
a) 回帰係数の導出
1) 最小2乗法
• Xが原因で、Yが結果であるという因果関係が成り立って
いる場合、数式の形(回帰モデルという)で表し、分析をお
こなう。
• 回帰モデルの例
(どのような式が最適かは、散布図や経済理論などから総合的に判断
される)
Y=a+bX
Y=a+bX2
Y=a/(X+b)
Xを独立変数(説明変数)とよび、Yを従属変数(被説明変数)とよぶ。
• 回帰係数の推定値は最小2乗法という方法で求めることがで
きる。
• 最小2乗法はデータの各点と直線との距離(これを残差とい
う)の2乗和が最小となるように直線を引く方法である。
推定値は次のような式
で求められる。
11
10
9
ˆb = n XY2-  X 2Y
8
n  X - ( X )
7
6
5
4
3
6
9
12
15
2

 Y -  X  XY
X
ˆa =
2
2
n X - ( X )
2) 予測値と残差
• あるXに対応する直線上の点を予測値(または理論値)といい、
Yˆ であらわす。
• 予測値は、すべてのデータが推定された回帰直線上にある
とした場合に、あるXに対応したYの値であり、データとして現
有していないXに対するYの値の予測となる。
11
Y
Yˆ
10
残差はYから Yˆ を引い
たものである。
9
8
7
6
5
4
3
6
9
12
15
• 所得と消費の例ではY=a+bXという線形のモデルを考える。
このモデルはケインズ型消費関数といわれるモデルである。
回帰係数の推定値は
所得と消費
bˆ = 0. 945
aˆ = -23.21
280
260
消費
となる。
1981年のXは212なので、
-23.21+0.945×212=177.13
が予測値となる。
残差は
173 - 177.13 = -4.13
である。
300
240
220
200
180
160
200
220
240
260
280
所得
300
320
340
b) 決定係数
• 決定係数は回帰モデルのあてはまり具合を示す尺度である。
次のような数値例を考えてみよう。
例1
X
例2
X
Y
10
8
13
9
11
14
6
4
12
7
5
8.1
7.1
9.5
7.5
8.4
10
6
5
9
6.4
5.5
Y
10
8
13
9
11
14
6
4
12
7
5
9.3
8.3
8.2
7.5
7.1
10.7
6.7
5.7
9.7
5.1
4.2
• この2つの例に回帰分析を適用すると、ともにY=3+0.5X とい
う回帰直線が導出される。ところで、散布図に回帰直線を書き
入れたものが下図である。
11
11
10
10
9
9
8
8
7
7
6
6
5
5
4
3
6
9
12
15
4
3
6
9
12
15
• この2つの図を比べると、データに対する回帰直線のあては
まりが異なることがわかる。それを数値で表したものが決定
係数R2であり、左はR2=0.998、右はR2=0.685である。
• 決定係数は、
回帰によって説明される変動
R =
Yの全変動
2
と解釈することができ、0と1の間の値をとる。決定係数が1に
近いほど回帰直線のあてはまりはよく、決定係数の値が小さ
い場合(0.5とか0.6以下の場合)には、分析の妥当性を検討す
る必要がある。
• 具体的には、すべての点のYの平均の線を引き、各点と平均
の差の2乗和と、回帰直線上の点(予測値)と平均の差の2乗
和の比をとったものである。
11
10
9
8
7
6
5
4
3
6
9
12
15
— Yの平均の線
} 各点と平均の差、これの2乗和がY
の全変動となる。
{ 回帰直線上の点(予測値)と平均の
差、この2乗和が回帰によって説明さ
れる変動となる。
この2つの比が決定係数R2となる。
決定係数の式は次のようになる。
R
2
 (Yˆ - Y ) 2
=
 (Y - Y ) 2
Ⅱ 回帰分析における統計的推論
母集団(個体数 N)
標本(個体数 n)
× ×
×
×
×
× ×
× ×
× × ×
Y=a+bX
真の回帰関係
推論
Yˆ= aˆ+ ˆb X
推定された回帰式
Y
推定された回帰式(その2)
真の回帰式 Y=a+bX
推定された回帰式(その1)
X
a) 回帰係数の区間推定
各点における残差を
ei = Yi - Yˆi
とし、
2
2
+
e
e
L
n
s2 = 1
n-2
を考えると、
t=
bˆ - b
s 2 ( x12 + L + xn2 )
が自由度n-2のt分布にしたがう。
よって、回帰係数bを信頼係数95%で区間推定すると、信頼区
間は
2
s2
s
, bˆ + t0.95
)
2
2
2
2
( x1 + L + xn )
( x1 + L + xn )
(bˆ - t0.95
となる。
(ここで、t0.95は自由度n-2のt分布の95%点)
b) 回帰係数の有意性検定
• 回帰係数の推定値 aˆ , bˆ は、最小2乗法によって求めるこ
とは、計算式に当てはめれば簡単に求めることができる。
• しかし、定数項や説明変数が回帰式の中で本当に意味
を持つものであるかどうか、検定する必要がある。
• 良くおこなわれる検定は次の2つである。
1 H0: a=0 vs. H1: a≠0 の検定
定数項が0であるかどうかの検定。
H0が成り立つとき、X=0の時のYは0となる。この場合、回帰線
は原点を通る。
消費関数でH0が成り立てば、所得が0の時の消費は0となる。こ
の検定は経済理論の検証の場合が多い。
2 H0: b=0 vs. H1: b≠0 の検定
Y=a+bXにおいてH0: b=0 が成立した場合、この回帰式はY=a
となる。
この式は、「Yの大きさはXの値にかかわらず一定値aをとる」と
いうことを表している。
回帰分析は、Xの大きさが大きくなることが原因となってYが大
きくなる(または小さくなる)ときに行う分析であるので、 H0が採
択された場合には、「この分析は行う意味がなかった」ということ
になってしまう。
Y
Y= a
a
X
• H0: b=0の検定について、
bˆ - b
bˆ
=
t= 2 2
s ( x1 + L + xn2 )
s2 ( x12 + L + xn2 )
という統計量を考えると、tは自由度n-2のt分布にしたがう。
よって、
-t 0.95  t  t 0.95 のとき、H0 を採択
t < -t 0.95またはt > t0.95のとき、H0 を棄却
• またH0: a=0 の検定には
aˆ - a
t=
2
1
X
s ( + 2
2)
n x1 + L + xn
が自由度n-2のt分布に従うという性質を用いればよい。
2