統計学入門 計量経済分析 確率分布 • 確率分布:確率変数 X が従う確率法則。 • 確率分布を定める • 密度関数は分布全体の特徴を表す関数。 確率(密度)関数を定める。 期待値(平均) • 例:サイコロの出た目の確率分布 P(X=1)= P(X=2)=…= P(X=6)=1/6 • 出た目の平均は 1x1/6 + 2x1/6 + 3x1/6 + 4x1/6 + 5x1/6 + 6x1/6 = 3.5 標本空間の 標本空間のそ 出た目が1で 出た目が2で 一番小さい値 の次小さい値 ある確率 ある確率 標本空間の 一番大きい値 出た目が6で ある確率 離散確率変数の期待値 • X:離散確率変数 • Ω = {x1 , x2 ,..., xK } K E [ X ] = ∑ xk × P(X = xk ) k=1 を X の期待値(平均)と言う。 • X が平均的に取る値。 • 確率変数による加重平均。 連続確率変数の期待値 • X:離散確率変数 ∞ E [X] = ∫ sf (s)ds x −∞ を X の期待値と言う。 • X が平均的に取る値。 • 積分は加重平均を意味するくらいの理解でよい。 期待値に関する公式 • X1 ,..., Xn:確率変数 • x1 ,..., xn:実現値 • 1. 2. a1 ,...,an:定数 E [ X1 + ...+ Xn ] = E [ X1 ] + ...+ E [ Xn ] E [ a1 X1 + ...+ an Xn ] = a1E [ X1 ] + ...+ an E [ Xn ] 例題:期待値に計算 • X1 ,..., Xn は i.i.d.(同一分布に従い、互いに独立 である)で期待値 を持つ分布に従う。 E [ X1 ] = ... = E [ X n ] = µ n • 1 その時標本平均 の期待値は? X = ∑ Xi n i=1 • 答え: !1 $ ! # 公式を用いると E " X $ = E # ( X1 + ...+ X n )& "n % 1 1 = E [ X1 ] + ...+ E [ Xn ] n n 1 = n× µ n =µ µ 分散 • • X :確率変数 µ X = E [ X ] とする。 2$ " V [ X ] = E #( X − µ x ) % を X の分散、その正の平方根 D[X] = V (X) を X の標準偏差という。 分散・標準偏差 2# ! V [ X ] = E "( X − µ x ) $, D[X] = V [X] • 期待値からの乖離の期待値。 • 期待値からのばらつき具合の指標: • ばらつき大 分散大 • ばらつき小 分散小 • 標準偏差は単位が X と同じ。 Density .04 0 0 .02 .02 Density .04 .06 .06 .08 .08 期待値 20 30 40 50 µ X = 40 D [ X ] = σ X = 10 60 10 20 30 40 µ X = 30 D [ X ] = σ X = 10 50 Density .04 0 0 .02 .02 Density .04 .06 .06 .08 .08 標準偏差 20 30 40 50 60 0 20 40 60 µ X = 40 µ X = 40 D [ X ] = σ X = 10 D [ X ] = σ X = 20 80 分散に関する公式 • aとbは定数とする。 2 X 2 2 1. V [ X ] = σ = E[X ]− E [ X ] = E[X 2 ]− µ X2 2 2. V [ aX ] = σ aX = a 2V [ X ] = a 2σ X2 2 3. V [ aX + b ] = σ aX+b = a 2V [ X ] = a 2σ X2 • XとYが独立の時 2 4. V [ X +Y ] = σ X+Y = V [ X ] +V [Y ] = σ X2 + σ Y2 2 5. V [ aX + bY ] = σ aX+bY = a 2V [ X ] + b 2V [Y ] = a 2σ X2 + b 2σ Y2 • X1 , X 2 ,..., X n a1 ,a2 ,...,an を定義とする。 がお互いに独立の時 V [ a1 X1 + ...+ an Xn + b ] = σ a21X1+...+an Xn +b = a12V [ X1 ] + ...+ an2V [ Xn ] = a12σ X21 + ...+ an2σ X2 n 例題1:期待値と分散の計算 • • サイコロを2回投げるゲームをする。 - X1 :1回目投げた時に出た目 - X :2回目投げた時に出た目 2 2 X1 µ X1 = 3.5, V [ X] = σ = 3.5 µ X2 = 3.5, V [ X] = σ 2 X2 = 3.5 サイコロを2回投げたときの合計得点をあらわす確率変数の期待値と 分散は次のよう: E [ X1 + X2 ] = µ X1+X2 = E [ X1 ] + E [ X2 ] = µ X1 + µ X2 = 3.5 + 3.5 = 7 V [ X1 + X2 ] = σ 2 X1+X2 2 X1 = V [ X1 ] +V [ X2 ] = σ + σ 2 X2 = 3.5 + 3.5 = 7 例題2:期待値と分散の計算 • 国語と数学しかない入学試験がある。 - - • X1 :国語の点数 X :数学の点数 2 µ X1 = 70, σ X21 = 25 µ X2 = 83, σ 2 X2 = 12 ただ、この大学は数学をより重視するので数学につけるウェイ トは国語につけるウェイトの3倍。 • 合計点数をあらわす確率変数の期待値と分散は: E [ X1 + 3X2 ] = µ X1+3X2 = E [ X1 ] + E [ 3X2 ] = µ X1 + µ 3X2 = 70 + 3× 83 = 319 V [ X1 + 3X2 ] = σ X21+3X2 = V [ X1 ] + 32 V [ X2 ] = σ X21 + 9σ X2 2 = 25 + 9 ×12 = 133 例題2:期待値と分散の計算 • このように計算された合計点数は分かりづらいから 満点を100点にしたい。そうした合計点数の期待 値と分散を計算すると !1 $1 1 E # ( X1 + 3X2 )& E [ X1 + 3X2 ] = 319 = 79.75 "4 %4 4 2 2 !1 $ '1 * 2 ' 3* 2 1 9 V # ( X1 + 3X2 )& = ) , σ X1 + ) , σ X2 = 25 + 12 = 8.3125 "4 % (4+ (4+ 16 16 になる。 正規分布 • 連続確率変数 X が 2% " x − µ) 1 ( ' fX ( x) = exp $$− 2 ' 2 2 σ 2 πσ # & µ という密度関数を持つとき、X の分布を期待値m 2 (ミュー)、分散 σ (シグマ2乗)の正規分布と言 N (µ , σ い、 2 ) と書く。 正規分布 .4 Normal Distribution µ=0 2 .3 σ =1 .2 µ =1 2 µ=0 σ =2 2 0 .1 σ =3 -10 -8 -6 -4 -2 0 2 4 6 8 10 正規分布 • • • E [ X ] = µ ,V [ X ] = σ 2 2 µ と分散 期待値 σ が決まれば、正規分布が定まる。 ( N µ,σ X が 2 X ~ N (µ , σ ) と書く。 ) に従う時、 2 2 • µ = 0, σ = 1 の時標準正規分布と言う。 • 計量経済学で登場する多くのデータの分布は正規分布 で近似できる。 正規分布の性質 ( 2 ) ~ N µ,σ 1. X の時、 X −µ Z= ∼ N ( 0,1) σ X から Z を求める操作を基準化と言う。 X1 , X2 ,..., Xn 2. a 1 ,a2 ,...,an ,cは定数、 が正規分布に従う時に a1 X1 + ...+ an Xn + c の分布も正規分布(正規分布の再生性)。 演習 • X1 , X2 ,..., Xn N (1,1) 問題: が i.i.d. で正規分布 に従う とする Y = a1 X1 + ...+ an Xn + c はどのような正規分布に従うか? ✦ 正規分布は期待値と分散が定まれば決まるので、期 待値と分散を求めればよい。 解答 • まずは µ µ = E [Y ] = E [ a1 X1 + ...+ an Xn + c] = a1E [ X1 ] + ...+ an E [ Xn ] + c = a1 + ...+ an + c • そして、σ 2 σ 2 = V [Y ] = V [ a1 X1 + ...+ an Xn + c] = a12V [ X1 ] + ...+ an2V [ Xn ] = a12 + ...+ an2 • µ = a1 + ...+ an + c, σ 2 = a12 + ...+ an2 とおいた時に Y ∼ N ( a1 + ...+ an + c,a12 + ...+ an2 ) 2 χ (カイ2乗)分布 • 2 2 Y = X の従う分布を自由度1の χ 分布 X ~ N ( 0,1)の時 2 χ (1) と言い、 と書く。 • X N ( 0,1) に従う時、 が i.i.d. で 1 , X 2 ,..., X n 2 1 2 2 Y = X + X + ...+ X 2 2 n 2 χ (n) と書く。 χ 分布と言い、 の従う分布を自由度 n の 2 χ 分布の性質 • 2 2 χ χ ( n ) の期待値、分散は 自由度 n の 分布 E [Y ] = n, • V [Y ] = 2n で、負の値は取らない。 Y ≥0 2 .25 χ 分布 Density .1 .15 .2 自由度1 自由度5 0 .05 自由度10 0 5 10 Chi2 15 t 分布 • X ~ N ( 0,1) , Y ~ χ ( n ) , X と Y が独立の時 2 X t= Y n t ( n ) と書く。 の従う分布を自由度 n の t 分布と言い、 t(n) 分布の性質 • n E [t ] = 0, V [t ] = (n > 2) n−2 • 密度関数の形は正規分布に似ている。 ➡ n → ∞で標準正規分布に漸近する。 .4 t(n) 分布の性質 自由度10 .3 自由度5 0 .1 Density .2 自由度1 -5 0 t 5 t(n) 分布の性質 密度関数は原点対称 • :分布関数 F ( x ) = P (t < x ) tα :t ( n ) 分布の上側 α点 • F (−tα ) = 1− F (tα ) = α ⇔ P (t < −tα ) = P (t > tα ) ⇔ t1−α = −tα 0 .1 ➡ Density .2 .3 • -5 −tα 0 t tα 5 F 分布 • 2 2 X ~ χ ( m ) , Y ~ χ ( n ) , X と Y が独立の時 X m F= Y n F ( m,n )と の従う分布を自由度 (m,n) の F 分布と言い、 書く。 F 分布の性質 • で、負の値は取らない。 F≥0 • 期待値、分散なども計算できるが覚えなくて良い。 2.5 F 分布の性質 Density 1 1.5 2 自由度1 .5 自由度10 0 自由度5 0 1 2 3 F 4 5 標本分布のまとめ • 標本分布はほかにもいろいろあるが、さしあたり正規分 布、 分布、t 分布、F 分布を知っていれば十分である。 • 密度関数や期待値、分散の値などは覚える必要はない。 • しかし、それぞれの分布の定義と特徴はきちんと頭に入 れておく必要がある。 • これらの分布は後で学習する推定係数の仮説検定の場面 で本質的に重要な役割を果たす。
© Copyright 2024 ExpyDoc