スライド

平成 27 年度 経済統計分析入門
.
第 9 回 「確率分布とその特性値」
原 尚幸
.
新潟大・経済
http://www.econ.niigata-u.ac.jp/˜hara/G-stat/
[email protected]
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
1 / 24
確率分布とその特性値
確率分布:確率変数 X がしたがう確率法則
確率分布を定める ⇔ 確率 (密度) 関数を定める
確率 (密度) 関数
⇒ 分布全体の特徴をあらわす関数
確率分布の特性値
確率分布を特徴付ける数値
期待値 (平均)
分散・標準偏差
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
2 / 24
期待値
(例) サイコロの出た目の確率分布
P (X = 1) = · · · = P (X = 6) = 1/6
出た目の平均は
1
1
1
1
1
1
1 × + 2 × + 3 × + 4 × + 5 × + 6 × = 3.5
6
6
6
6
6
6
何度もサイコロを振ると出た目の平均は
3.5 に近づく
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
3 / 24
期待値
(例) ある会社の株価
今の価格は 1000 円
1ヶ月後に 1500 円となる確率が 30%
1ヶ月後に 500 円となる確率が 70%
1ヶ月後の株価は平均的に
1500 × 0.3 + 500 × 0.7 = 800
確率変数が平均的に取る値のことを期待値という
確率試行を何度も繰り返したときの値の平均
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
4 / 24
期待値
離散確率変数の期待値
X : 離散確率変数
Ω = {x1 , . . . , xK }
E[X] :=
K
∑
xk · P (X = xk )
k=1
.
を X の期待値と言う
期待値は「平均」とほぼ同義だと考えてよい
X が平均的に取る値
確率関数による加重平均
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
5 / 24
連続確率変数の期待値
連続確率変数の期待値
X : 連続確率変数
∫
∞
E[X] =
−∞
sfX (s)ds,
を X の期待値と言う
.
上の定義は忘れてよい
(実はこの定義も加重平均とみなすことができる)
要するに X が連続であっても E[X] は X が
.
平均的にとる値
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
6 / 24
期待値に関する公式 (重要)
X1 , . . . , Xn : 確率変数
a : 定数
1
2
3
E[aXi ] = aE[Xi ]
E[X1 + · · · + Xn ] = E[X1 ] + · · · + E[Xn ]
E[aX1 + · · · + aXn ] = aE[X1 ] + · · · + aE[Xn ]
.
.
.
.
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
7 / 24
演習:期待値の計算
演習 1
X1 , . . . , Xn は i.i.d. で期待値 µ を持つ分布に従う
E[X1 ] = · · · = E[Xn ] = µ
1∑
そのとき X̄ =
Xi の期待値は?
n i=1
n
.
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
8 / 24
解答例
公式を用いると
[
]
1
E[X̄] = E
(X1 + · · · + Xn )
n
1
1
= E[X1 ] + · · · + E[Xn ]
n
n
=µ
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
9 / 24
連続確率変数の分散・標準偏差
3 つの確率密度関数
3 つとも期待値は 0
左の方が分布が中心に集中
右の方が分布がばらつきが大きい
ばらつきの定量化:分散・標準偏差
0
H. Hara (Niigata U.)
0
確率分布とその特性値
0
June 17, 2015
10 / 24
分散
分散
X : 確率変数
µX := E[X] と書くことにする
V [X] := E[(X − µX )2 ]
を X の分散 という
.
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
11 / 24
確率変数の標準偏差
標準偏差
X : 確率変数
X の分散の正の平方根を
D(X) =
√
V (X)
を X の標準偏差という
.
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
12 / 24
分散・標準偏差の性質
分散・標準偏差
V [X] = E[(X − µX )2 ],
D[X] =
√
V [X]
「平均からの乖離 (かいり)」の平均
平均からのバラツキ具合の指標
バラツキ大 ⇒ 分散大
バラツキ小 ⇒ 分散小
標準偏差は単位が X と等しい
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
13 / 24
連続確率変数の分散・標準偏差
0
0
0
分散小
分散中
分散大
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
14 / 24
分散に関する公式 (重要)
a, b は定数とする
1
.
.
2
3
.
.
.
.
.
4
5
V [X] = E[X 2 ] − µ2X
V [aX] = a2 V [X]
V [aX + b] = a2 V [X]
X と Y が独立のとき
V [X + Y ] = V [X] + V [Y ]
V [aX + aY ] = a2 V [X] + a2 V [Y ]
X1 , . . . , Xn が互いに独立のとき
V [aX1 + · · · + aXn ] = a2 (V [X1 ] + · · · + V [Xn ])
.
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
15 / 24
演習:分散の計算
演習 2
X1 , . . . , Xn は i.i.d. で分散 σ 2 を持つ分布に従う
V [X1 ] = · · · = V [Xn ] = σ 2
1∑
そのとき X̄ =
Xi の分散は?
n i=1
n
.
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
16 / 24
解答例
公式を用いると
[
V [X̄] = V
[
n
1∑
n
]
Xi
]
[
]
1
1
=V
X1 + · · · + V
Xn
n
n
1
= 2 (V [X1 ] + · · · + V [Xn ])
n
σ2
=
n
H. Hara (Niigata U.)
i=1
確率分布とその特性値
June 17, 2015
17 / 24
共分散・相関係数
共分散・相関係数
X, Y : 確率変数
共分散 Cov(X, Y )
Cov(X, Y ) = E[(X − µX )(Y − µY )]
相関係数 Cor(X, Y )
Cov(X, Y )
Cov(X,
Y)
.
Cor(X, Y ) = √
=
V (X)V (Y ) D(X)D(Y )
2 つの確率変数の相関関係をあらわす指標
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
18 / 24
共分散・相関係数の性質
1
2
3
X が大きいときに Y も大きい傾向 (比例的)
→ Cov(X, Y ) > 0, Cor(X, Y ) > 0
→ 正の相関がある
X が大きいときに Y が小さくなる傾向
(反比例的)
→ Cov(X, Y ) < 0, Cor(X, Y ) < 0
→ 負の相関がある
無相関
→ Cov(X, Y ) = 0, Cor(X, Y ) = 0
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
19 / 24
共分散・相関係数の性質
4
5
6
−1 ≤ Cor(X, Y ) ≤ 1
X = aY + b とする
a > 0 ⇔ 正比例 ⇔ Cor(X, Y ) = 1
a < 0 ⇔ 反比例 ⇔ Cor(X, Y ) = −1
X と Y が独立
⇒ Cor(X, Y ) = Cov(X, Y ) = 0
(注意:逆は一般には成立しない )
無相関だからと言って独立とは限らない
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
20 / 24
確率分布の例:正規分布
正規分布 N (µ, σ 2)
連続確率変数 X が
(
(x − µ)2
fX (x) = √
exp −
2σ 2
2πσ 2
1
)
という密度関数を持つとき, X の分布を平均 µ
(ミュー), 分散 σ 2 (シグマ 2 乗) の正規分布と言い ,
N (µ, σ 2 ) と書く
.
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
21 / 24
確率分布の例:正規分布
正規分布の密度関数
(
(x − µ)2
fX (x) = √
exp −
2σ 2
2πσ 2
1
)
黒:µ = 0, σ 2 = 1
赤:µ = 0, σ 2 = 3
青:µ = 1, σ 2 = 2
釣鐘型できれいな形の
密度関数
0.4
0.3
0.2
0.1
0.0
−4
−2
0
H. Hara (Niigata U.)
2
4
確率分布とその特性値
June 17, 2015
22 / 24
確率分布の例:正規分布
正規分布の密度関数
(
(x − µ)2
fX (x) = √
exp −
2σ 2
2πσ 2
1
)
黒:µ = 0, σ 2 = 1
赤:µ = 0, σ 2 = 3
青:µ = 1, σ 2 = 2
釣鐘型できれいな形の
密度関数
0.4
0.3
0.2
0.1
0.0
−4
−2
0
H. Hara (Niigata U.)
2
4
確率分布とその特性値
June 17, 2015
22 / 24
確率分布の例:正規分布
正規分布の密度関数
(
(x − µ)2
fX (x) = √
exp −
2σ 2
2πσ 2
1
)
黒:µ = 0, σ 2 = 1
赤:µ = 0, σ 2 = 3
青:µ = 1, σ 2 = 2
釣鐘型できれいな形の
密度関数
0.4
0.3
0.2
0.1
0.0
−4
−2
0
H. Hara (Niigata U.)
2
4
確率分布とその特性値
June 17, 2015
22 / 24
確率分布の例:正規分布
正規分布の密度関数
(
(x − µ)2
fX (x) = √
exp −
2σ 2
2πσ 2
1
)
E[X] = µ, V [X] = σ 2
平均 µ と 分散 σ 2 が決まれば正規分布が定まる
X が N (µ, σ 2 ) に従うとき, X ∼ N (µ, σ 2 ) と書く
µ = 0, σ 2 = 1 のとき標準正規分布と言う.
多くのデータの分布は正規分布で近似できる
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
22 / 24
正規分布の再生性
正規分布の再生性
a : 定数
X1 , . . . , Xn : 正規分布にしたがう n 個の確率変数
そのとき
a(X1 + · · · + Xn )
の分布も正規分布にしたがう.
この性質を正規分布の再生性という
H. Hara (Niigata U.)
確率分布とその特性値
.
June 17, 2015
23 / 24
演習
問題
X1 , . . . , Xn が i.i.d. で正規分布 N (µ, σ 2 ) に従うと
する. このとき X̄
n
1∑
Y =
Xi
n i=1
.
はどのような正規分布に従うか?
正規分布は平均と分散が定まれば決まるので ,
平均と分散を求めればよい
E[Xi ] = µ, V [Xi ] = σ 2 , i = 1, . . . , n
H. Hara (Niigata U.)
確率分布とその特性値
June 17, 2015
24 / 24