Document

統計学入門
計量経済分析
確率分布
•
確率分布:確率変数 X が従う確率法則。
•
確率分布を定める
•
密度関数は分布全体の特徴を表す関数。
確率(密度)関数を定める。
期待値(平均)
•
例:サイコロの出た目の確率分布
P(X=1)= P(X=2)=…= P(X=6)=1/6
•
出た目の平均は
1x1/6 + 2x1/6 + 3x1/6 + 4x1/6 + 5x1/6 + 6x1/6 = 3.5
標本空間の
標本空間のそ
出た目が1で 出た目が2で
一番小さい値 の次小さい値
ある確率
ある確率
標本空間の
一番大きい値
出た目が6で
ある確率
離散確率変数の期待値
•
X:離散確率変数
•
Ω = {x1 , x2 ,..., xK }
K
E [ X ] = ∑ xk × P(X = xk )
k=1
を X の期待値(平均)と言う。
•
X が平均的に取る値。
•
確率変数による加重平均。
連続確率変数の期待値
•
X:離散確率変数
∞
E [X] =
∫ sf (s)ds
x
−∞
を X の期待値と言う。
•
X が平均的に取る値。
•
積分は加重平均を意味するくらいの理解でよい。
期待値に関する公式
•
X1 ,..., Xn:確率変数
•
x1 ,..., xn:実現値
•
1.
2.
a1 ,...,an:定数
E [ X1 + ...+ Xn ] = E [ X1 ] + ...+ E [ Xn ]
E [ a1 X1 + ...+ an Xn ] = a1E [ X1 ] + ...+ an E [ Xn ]
例題:期待値に計算
•
X1 ,..., Xn は i.i.d.(同一分布に従い、互いに独立 である)で期待値
を持つ分布に従う。
E [ X1 ] = ... = E [ X n ] = µ
n
•
1
その時標本平均 の期待値は?
X = ∑ Xi
n i=1
•
答え:
!1
$
!
#
公式を用いると E " X $ = E # ( X1 + ...+ X n )&
"n
%
1
1
= E [ X1 ] + ...+ E [ Xn ]
n
n
1
= n× µ
n
=µ
µ
分散
•
•
X :確率変数
µ X = E [ X ] とする。
2$
"
V [ X ] = E #( X − µ x ) %
を X の分散、その正の平方根
D[X] = V (X)
を X の標準偏差という。
分散・標準偏差
2#
!
V [ X ] = E "( X − µ x ) $,
D[X] = V [X]
•
期待値からの乖離の期待値。
•
期待値からのばらつき具合の指標:
•
ばらつき大 分散大
•
ばらつき小 分散小
•
標準偏差は単位が X と同じ。
Density
.04
0
0
.02
.02
Density
.04
.06
.06
.08
.08
期待値
20
30
40
50
µ X = 40
D [ X ] = σ X = 10
60
10
20
30
40
µ X = 30
D [ X ] = σ X = 10
50
Density
.04
0
0
.02
.02
Density
.04
.06
.06
.08
.08
標準偏差
20
30
40
50
60
0
20
40
60
µ X = 40
µ X = 40
D [ X ] = σ X = 10
D [ X ] = σ X = 20
80
分散に関する公式
•
aとbは定数とする。
2
X
2
2
1. V [ X ] = σ = E[X ]− E [ X ] = E[X 2 ]− µ X2
2
2. V [ aX ] = σ aX
= a 2V [ X ] = a 2σ X2
2
3. V [ aX + b ] = σ aX+b
= a 2V [ X ] = a 2σ X2
•
XとYが独立の時
2
4. V [ X +Y ] = σ X+Y
= V [ X ] +V [Y ] = σ X2 + σ Y2
2
5. V [ aX + bY ] = σ aX+bY
= a 2V [ X ] + b 2V [Y ] = a 2σ X2 + b 2σ Y2
•
X1 , X 2 ,..., X n
a1 ,a2 ,...,an
を定義とする。 がお互いに独立の時
V [ a1 X1 + ...+ an Xn + b ] = σ a21X1+...+an Xn +b = a12V [ X1 ] + ...+ an2V [ Xn ] = a12σ X21 + ...+ an2σ X2 n
例題1:期待値と分散の計算
•
•
サイコロを2回投げるゲームをする。
-
X1
:1回目投げた時に出た目
-
X
:2回目投げた時に出た目
2
2
X1
µ X1 = 3.5, V [ X] = σ = 3.5
µ X2 = 3.5, V [ X] = σ
2
X2
= 3.5
サイコロを2回投げたときの合計得点をあらわす確率変数の期待値と
分散は次のよう:
E [ X1 + X2 ] = µ X1+X2 = E [ X1 ] + E [ X2 ] = µ X1 + µ X2 = 3.5 + 3.5 = 7
V [ X1 + X2 ] = σ
2
X1+X2
2
X1
= V [ X1 ] +V [ X2 ] = σ + σ
2
X2
= 3.5 + 3.5 = 7
例題2:期待値と分散の計算
•
国語と数学しかない入学試験がある。
-
-
•
X1
:国語の点数
X
:数学の点数
2
µ X1 = 70, σ X21 = 25
µ X2 = 83, σ
2
X2
= 12
ただ、この大学は数学をより重視するので数学につけるウェイ
トは国語につけるウェイトの3倍。
•
合計点数をあらわす確率変数の期待値と分散は:
E [ X1 + 3X2 ] = µ X1+3X2 = E [ X1 ] + E [ 3X2 ] = µ X1 + µ 3X2 = 70 + 3× 83 = 319
V [ X1 + 3X2 ] = σ X21+3X2 = V [ X1 ] + 32 V [ X2 ] = σ X21 + 9σ X2 2 = 25 + 9 ×12 = 133
例題2:期待値と分散の計算
•
このように計算された合計点数は分かりづらいから
満点を100点にしたい。そうした合計点数の期待
値と分散を計算すると
!1
$1
1
E # ( X1 + 3X2 )& E [ X1 + 3X2 ] = 319 = 79.75
"4
%4
4
2
2
!1
$ '1 * 2 ' 3* 2
1
9
V # ( X1 + 3X2 )& = ) , σ X1 + ) , σ X2 = 25 + 12 = 8.3125
"4
% (4+
(4+
16
16
になる。
正規分布
•
連続確率変数 X が
2%
"
x − µ)
1
(
'
fX ( x) =
exp $$−
2
'
2
2
σ
2 πσ
#
&
µ
という密度関数を持つとき、X の分布を期待値m
2
(ミュー)、分散 σ (シグマ2乗)の正規分布と言
N (µ , σ
い、 2
) と書く。
正規分布
.4
Normal Distribution
µ=0
2
.3
σ =1
.2
µ =1
2
µ=0
σ =2
2
0
.1
σ =3
-10
-8
-6
-4
-2
0
2
4
6
8
10
正規分布
•
•
•
E
[ X ] = µ ,V [ X ] = σ
2
2
µ と分散 期待値 σ が決まれば、正規分布が定まる。
(
N µ,σ
X が 2
X ~ N (µ , σ ) と書く。 ) に従う時、 2
2
•
µ
= 0, σ = 1
の時標準正規分布と言う。
•
計量経済学で登場する多くのデータの分布は正規分布
で近似できる。
正規分布の性質
(
2
)
~ N µ,σ
1. X の時、
X −µ
Z=
∼ N ( 0,1)
σ
X から Z を求める操作を基準化と言う。
X1 , X2 ,..., Xn
2. a
1 ,a2 ,...,an ,cは定数、 が正規分布に従う時に
a1 X1 + ...+ an Xn + c
の分布も正規分布(正規分布の再生性)。
演習
•
X1 , X2 ,..., Xn
N (1,1)
問題: が
i.i.d. で正規分布 に従う
とする
Y = a1 X1 + ...+ an Xn + c
はどのような正規分布に従うか?
✦
正規分布は期待値と分散が定まれば決まるので、期
待値と分散を求めればよい。
解答
•
まずは
µ
µ = E [Y ]
= E [ a1 X1 + ...+ an Xn + c]
= a1E [ X1 ] + ...+ an E [ Xn ] + c
= a1 + ...+ an + c
•
そして、σ
2
σ 2 = V [Y ]
= V [ a1 X1 + ...+ an Xn + c]
= a12V [ X1 ] + ...+ an2V [ Xn ]
= a12 + ...+ an2
•
µ = a1 + ...+ an + c, σ 2 = a12 + ...+ an2 とおいた時に
Y ∼ N ( a1 + ...+ an + c,a12 + ...+ an2 )
2
χ
(カイ2乗)分布
•
2
2
Y = X の従う分布を自由度1の χ 分布
X
~ N ( 0,1)の時 2
χ (1)
と言い、 と書く。
•
X
N ( 0,1) に従う時、
が
i.i.d. で 1 , X 2 ,..., X n
2
1
2
2
Y = X + X + ...+ X
2
2
n
2
χ (n) と書く。
χ 分布と言い、 の従う分布を自由度 n の 2
χ
分布の性質
•
2
2
χ
χ ( n ) の期待値、分散は
自由度 n の 分布 E [Y ] = n,
•
V [Y ] = 2n
で、負の値は取らない。
Y ≥0
2
.25
χ 分布
Density
.1
.15
.2
自由度1
自由度5
0
.05
自由度10
0
5
10
Chi2
15
t 分布
•
X ~ N ( 0,1) , Y ~ χ ( n ) , X と Y が独立の時
2
X
t=
Y n
t ( n ) と書く。
の従う分布を自由度 n の t 分布と言い、 t(n) 分布の性質
•
n
E [t ] = 0, V [t ] =
(n > 2)
n−2
•
密度関数の形は正規分布に似ている。
➡
n → ∞で標準正規分布に漸近する。
.4
t(n) 分布の性質
自由度10
.3
自由度5
0
.1
Density
.2
自由度1
-5
0
t
5
t(n) 分布の性質
密度関数は原点対称
•
:分布関数
F ( x ) = P (t < x )
tα :t ( n ) 分布の上側 α点
•
F (−tα ) = 1− F (tα ) = α
⇔ P (t < −tα ) = P (t > tα )
⇔ t1−α = −tα
0
.1
➡
Density
.2
.3
•
-5
−tα
0
t
tα
5
F 分布
•
2
2
X ~ χ ( m ) , Y ~ χ ( n ) , X と Y が独立の時
X m
F=
Y n
F ( m,n )と
の従う分布を自由度 (m,n) の F 分布と言い、 書く。
F 分布の性質
•
で、負の値は取らない。
F≥0
•
期待値、分散なども計算できるが覚えなくて良い。
2.5
F 分布の性質
Density
1
1.5
2
自由度1
.5
自由度10
0
自由度5
0
1
2
3
F
4
5
標本分布のまとめ
•
標本分布はほかにもいろいろあるが、さしあたり正規分
布、 分布、t 分布、F 分布を知っていれば十分である。
•
密度関数や期待値、分散の値などは覚える必要はない。
•
しかし、それぞれの分布の定義と特徴はきちんと頭に入
れておく必要がある。
•
これらの分布は後で学習する推定係数の仮説検定の場面
で本質的に重要な役割を果たす。