第 6 回 不均一分散

第 6 回 不均一分散
村澤 康友
2015 年 5 月 15 日
目次
1
古典的線形回帰モデル(p. 45)
1
2
不均一分散(p. 65)
2
3
標準誤差の修正
2
4
不均一分散の検定(p. 67)
3
5
一般化(加重)最小 2 乗法(p. 70)
3
6
エンゲル係数
4
7
今日の課題
4
1 古典的線形回帰モデル(p. 45)
X を説明変数,Y を被説明変数とする.
定義 1. 線形回帰モデルは
E(Y |X) = α + βX
定義 2. 古典的線形回帰モデルは
E(Y |X) = α + βX
var(Y |X) = σ 2
注 1. すなわち Y の平均は X に依存するが,分散は X に依存しない.
定理 1 (ガウス=マルコフ定理). 古典的線形回帰モデルの回帰係数の OLS 推定量は最良線形不偏推定量
(Best Linear Unbiased Estimator, BLUE).
1
2 不均一分散(p. 65)
定義 3. 不均一分散をもつ線形回帰モデルは
E(Y |X) = α + βX
var(Y |X) = f (X)
注 2. 不均一分散の問題点
1. OLS の標準誤差・t 値の修正が必要.
2. OLS は BLUE ではない.
練習 1. 不均一分散の例を以下の手順で作成し,X と Y の散布図を描きなさい(p. 67,図 4-1).
1. 観測数 50 のデータセットを作成.
2. インデックス変数を説明変数 X とする.
3. 区間 (−1, 1) の一様乱数 V を生成し,誤差 U := XV を作成.
4. 被説明変数 Y := 1 + 0.5X + U を作成.
練習 2. c41B.gdt(gretl のサンプル・ファイル engel と同じ)はベルギーの家計の横断面データであり,以
下の 2 つの変数をもつ.
1. income(世帯所得)
2. foodexp(食費)
2 変数の関係を散布図で示しなさい.また log(income) と log(foodexp) の関係を散布図で示しなさい.
3 標準誤差の修正
不均一分散が懸念される場合は,以下の手順で OLS を実行する.
1. メニューから「モデル」→「最小二乗法」を選択.
2.「従属変数」を 1 つ選択.
3.「説明変数(回帰変数)」を選択.
4.「頑健標準誤差を使用する」をチェック.
5.「OK」をクリック.
不均一分散がなくても頑健標準誤差は正しいので,こちらを使う方が安全.
練習 3. c41B.gdt のデータを用いて通常の回帰分析を行いなさい(p. 68,図 4-2).
練習 4. c41B.gdt のデータを用いて標準誤差を修正した回帰分析を行いなさい.
2
4 不均一分散の検定(p. 67)
次の検定問題を考える.
H0 : 不均一分散なし
vs H1 : 不均一分散あり
gretl では以下の手順で不均一分散の有無を検定できる.
1. OLS を実行した画面のメニューから「検定」→「不均一分散」を選択.
2. 検定手法を選択.
p 値が有意水準(通常は 0.05)以下なら H0 を棄却.
練習 5. c41B.gdt のデータを用いて White の不均一分散の検定を行いなさい(p. 69,図 4-4).
練習 6. c41B.gdt のデータを用いて Breusch–Pagan の不均一分散の検定を行いなさい.
5 一般化(加重)最小 2 乗法(p. 70)
誤差 U = XV とすると,次のモデルは不均一分散をもつ.
Y = α + βX + U
このとき OLS は BLUE ではない.
モデルは次のように変形できる.
Y
1
X
=α +β +V
X
X
X
V の分散が均一なら古典的線形回帰モデルとなり,変換したデータの OLS は BLUE.
gretl では以下の手順で加重最小 2 乗法を実行できる.
1. メニューから「モデル」→「その他の線形モデル」→「加重最小二乗法」を選択.
2.「従属変数」を 1 つ選択.
3.「ウェイト変数」を選択.
4.「説明変数(回帰変数)」を選択.
5.「OK」をクリック.
ウェイト変数を自動的に作成する方法もある.手順は以下の通り.
1. メニューから「モデル」→「その他の線形モデル」→「不均一分散を修正した推定」を選択.
2.「従属変数」を 1 つ選択.
3.「説明変数(回帰変数)」を選択.
4.「OK」をクリック.
練習 7. c41B.gdt のデータを用いて加重最小 2 乗法で回帰分析を行いなさい(p. 71,図 4-6).
3
6 エンゲル係数
定義 4. 家計の消費支出に占める食費の割合をエンゲル係数という.
定義 5. 家計の所得が高いとエンゲル係数が低くなる関係をエンゲルの法則という.
練習 8. c41B.gdt のデータを用いて以下の分析を行いなさい.
1. エンゲル係数 engel:=foodexp/income を作成し,log(income) と engel の関係を散布図で示しなさい.
2. 説明変数を log(income),被説明変数を engel として回帰分析を行い,エンゲルの法則を確かめなさい.
3. White と Breusch–Pagan の不均一分散の検定を行いなさい.
7 今日の課題
練習 1–8 の実行結果をワードに貼り付けて My Konan で提出しなさい.
4