数理統計学(第ニ回) 期待値と分散

数理統計学(第ニ回)
期待値と分散
浜田知久馬
数理統計学第2回
1
確率変数の特性量
期待値E[X]:Xがしたがう確率分布の平均
分散V[X]:Xのバラツキ度合
標準偏差:√分散
これらは,どのように計算し,どのような意味を
持つのだろうか.
数理統計学第2回
2
年末ジャンボ宝くじの期待値
1枚300円×1000万本=30億円
1等:2億円×2本=4億円
1等前後賞:5千万円×4本=2億円
1等組違い賞:10万円×198本=1980万円
2等:1千万円×3本=3千万円
3等:100万円×40本=4千万円
4等:1万円×1000本=1000万円
5等:3000円×10万本=3億円
6等:300円×100万本=3億
さよなら20世紀賞:5万円×3千本=1億5千万円
賞金合計総額:14億4980万円。
数理統計学第2回
期待値: 14億4980万円/1000万=144.98円
3
数理統計学第2回
4
期待値計算の操作
1枚くじをかったときの賞金金額(確率変数)
n本の宝くじ,a通りの起こり得る場合(賞金)
度数
f1 f2 ・・・
fa
賞金
x1 x2 ・・・ xa
相対度数 p1 p2 ・・・ pa xi/n
a
E[ X ] 
x
i 1
n
i
fi
xa f a
x1 f1 x 2 f 2



n
n
n
a
  xi pi  x1 p1  x 2 p 2    x a p a
i 1
数理統計学第2回
5
確率変数Xの期待値
E[X]:期待値(expected value)
Σx・p(x)
離散分布
E[X]=
∫x・f(x)dx
連続分布
期待値の公式
E[a1X1+ a2X2+・・・+ anXn]
=a1 E[X1]+ a2 E[X2]+・・・+ an E[Xn]
宝くじを5枚買ったときの期待値は?
数理統計学第2回
6
人はなぜ宝くじを
買うのだろうか?
夢を買うため?
2本に1本300円当たる宝くじを買う人が
いるだろうか?
一攫千金狙い
期待値は145円だが,SDは95053円
300円で10万円弱のバラツキの期待感
数理統計学第2回
7
宝くじの購入理由
http://www.takarakuji.nippon-net.ne.jp/data2.html#4
数理統計学第2回
8
分散
平均値μ=E[X]からどれくらい離れた点にばら
つくか?
(X-μ)2 の期待値:V[X]=E[(X-μ)2]
=E[X2]-2μE[X]+μ2 = E[X2]-μ2
Σ(x-μ)2・p(x) 離散分布
V [X]=
∫(x-μ)2・f(x)dx 連続分布
数理統計学第2回
9
期待値の計算例(二項分布)
B(n, p ) : p( x) n C x p (1  p)
x
n x
n
n!
x
n x
E[ x]   x 
p (1  p )
x!(n  x)!
x 0
n

x 0
n  (n  1)!
x 1
n x
 p  p (1  p)
( x  1)!(n  x)!
(n  1)!
x 1
n x
 np
p (1  p )  np
x 1 ( x  1)!( n  x )!
n
数理統計学第2回
10
疑問点
Σは0からnまでのはず,1からnまででいいの
か?
二項分布(4,p)の場合
0・4C0p0(1-p)4
0
+1・4C1p1(1-p)3
+ 4p1(1-p)3
E[X]= +2・4C2p2(1-p)2 = +12p2(1-p)2
+3・4C3p3(1-p)1
+12p3(1-p)1
+4・4C4p4(1-p)0
+ 4p4(1-p)0
数理統計学第2回
11
疑問点の続き
4p・ p0(1-p)3
4p・3C0p0(1-p)3
E[X]=+ 4p・3p1(1-p)2 = + 4p・3C1p1(1-p)2
+ 4p・3p2(1-p)1
+ 4p・3C2p2(1-p)1
+ 4p・ p3(1-p)0
+ 4p・3C3p3(1-p)0
=4p
期待値計算にはx=0の項は寄与しない.
黒字は{p+(1-p)}3なので1
数理統計学第2回
12
分散の計算例(二項分布)
V [ X ]  E[ X 2 ]   2   x 2 p ( x )  ( np) 2
2
x
 p( x)   x( x  1) p( x)   x p( x)
n!
x
n x
x
(
x

1
)
p
(
x
)

x
(
x

1
)
p
(
1

p
)


x!( n  x )!
n( n  1)(n  2)! 2 x  2

p p (1  p ) n  x
( x  2)!( n  x)!
( n  2)!
2
x2
n x
 n( n  1) p 
p (1  p )
( x  2)!( n  x)!
 n( n  1) p 2
2
2
V [ X ]  n( n  1) p 2  np

n
p
 np(1  p )
数理統計学第2回
13
期待値・分散の計算例(一様分布)
f(x)=1
(0≦x≦1)
=0
(x<0, x>1)
E[X]=∫xf(x) dx= ∫01xdx=[x2/2] 01
=1/2-0=1/2
V[X]=E[X2]-μ2 =∫x2dx-1/4
=[x3/3] 01-1/4
= 1/3-0-1/4=1/12
数理統計学第2回
14
モーメント
原点周りのk次のモーメントμ(ミュー)
離散分布:μk=Σxk・p(x)
連続分布:μk=∫xk・f(x)dx
平均周りのk次のモーメントν(ニュー)
離散分布:ν k=Σ(x- μ1)k・p(x)
連続分布:νk=∫(x- μ1)k・f(x)dx
数理統計学第2回
15
代表的なモーメント統計量
μ1 :平均
ν2 :分散
β1 = ν3/σ3:歪度(ワイド) skewness
β2 = ν4/σ4 -3 :尖度(センド) kurtosis
正規分布: μ1=μ, ν2= σ2 , β1=0, β2=0
二項分布: μ1=nπ, ν2=nπ(1ーπ)
数理統計学第2回
16
積率母関数
モーメント統計量を求めることは簡単ではない.
積率母関数M(θ):moment generating function
モーメントを計算するための道具
離散分布: M(θ)=E[eθx]= Σ eθx・p(x)
連続分布: M(θ)=E[eθx]= ∫ eθx・f(x)dx
数理統計学第2回
17
マクローリン展開
関数 f(x) の x=a におけるテイラー展開
f (a)(x  a)
f ( x)  f (a)  f (a)(x  a) 
2!
k
k
f (a)(x  a)


k!
k
k

f (a)(x  a)

k!
k 0
数理統計学第2回
2
18
テイラー展開において、特に a=0 とし
たときの級数をマクローリン展開という。
f (0) x
f ( x)  f (0)  f (0) x 
2!
k
k
f (0) x


k!
k
k

f (0) x

k!
k 0
数理統計学第2回
2
19
f(x)= eθxの微分
f(x)= eθx
⇒ f(0)= e0 =1
f'(x)=θeθx ⇒ f'(0)=θe0=θ
f''(x)=θ2eθx ⇒ f''(0)=θ2e0=θ2
・・・
fk(x)=θk eθx ⇒ fk(0)=θke0=θk
数理統計学第2回
20
積率母関数とモーメント
3 3
2 2
x

x

x


e  1  x 
3!
2!
3
3
2
2
 E[ X ]  E[ X ]
x


M ( )  E (e )  1  E[ X ] 
3!
2!
2
d M ( )
dM ( )
2
  0  E[ X ]
  0  E[ X ]
2
d
d
k
d M ( )
k
  0  E[ X ]
k
d
数理統計学第2回
21
積率母関数
(1)M(θ)を1階微分してθ=0とすると,
E[X](期待値)が得られる.
(2)M(θ)を2階微分してθ=0とすると,
E[X2]が得られる.
(3)M(θ)をk階微分してθ=0とすると,
E[Xk]が得られる.
積率母関数を用いれば,原点周りのモーメントが
容易に計算できる.
数理統計学第2回
22
正規分布の例
1
f ( x) 
2 2
 x   
exp

2

2

M ( )  E[e ] 
x




1
2
2
1
2 2
e
x
2




f ( x) dx
 x    2


exp



x
dx
2


2



  x   2  2 2x 

exp

dx
2


2

 数理統計学第2回
23
正規分布の例

2
2
2

1
x  2x    2 x 
dx
exp 
2
2
2
2



 ( x  (     ))  2     
dx
exp 
2
2
2
2


1
2
2
2
4
2
 2 2   4 2 
 ( x  (    2 ))2 
1
 
dx
 exp
exp 
2
2
2
2

 2 2


2 2
 exp(    / 2)
数理統計学第2回
24
正規分布のモーメント
M(θ)=exp(μθ+σ2θ2/2)
M’(θ)=(μ+ σ2θ) exp(μθ+σ2θ2/2)
M’(0)= E[X]=μ
M’’(θ)= σ2 exp(μθ+σ2θ2/2)
+ (μ+σ2θ) 2exp(μθ+σ2θ2/2)
M’’(0)= E[X2]=σ2 +μ2
V[X]=E[X2]- E[X] 2 = σ2 +μ2 - μ2 = σ2
数理統計学第2回
25
2項分布の例
p ( x) n C x p (1  p )
x
n x
M ( )  E[e ]  e  n C x p (1  p)
x
x
  n C x ( pe ) (1  p )


 ( pe  1  p )

x
x
n x
n x
n

M ' ( )  npe ( pe  1  p)
n 1
M ' (0)  E[ x]  np
数理統計学第2回
26
2項分布の例


M ' ( )  npe ( pe  1  p )


n 1
M ' ' ( )  npe ( pe  1  p )



n 1
 n(n  1) pe pe ( pe  1  p )
n2
M ' ' (0)  E[ X ]
2
 n( n  1) p  np
2
V [ X ]  E[ X ]  E[ X ]
2
2
 n( n  1) p  np  n p  np(1  p )
2
2
数理統計学第2回
2
27
演習問題1
Xが1,2,・・・,10までの値を等しく0.1の確
率でとる確率変数であるとする.
1)確率関数
2)累積分布関数
3)期待値
4)原点周りの2次のモーメント
5)分散
6)標準偏差
7)メディアン
を求めよ.
数理統計学第2回
28
演習問題2
1.Y=X 2 は確率変数と考えられるか.
2.Yの確率関数と分布関数を示すこと
3.Yの期待値,分散,標準偏差は?
4.E[Y]をXの特性量を用いて 表すと
確率変数の関数はまた確率変数となる
数理統計学第2回
29
SASでのサイコロの目の発生
一様分布を用いてもいいが,
RANTBL(seed,p1,..pi,..pn)
returns a random variate from a tabled
probability
数理統計学第2回
30
サイコロの目の発生プログラム例
data data;
do i=1 to 1000;
y=rantbl(4989,1/6,1/6,1/6,1/6,1/6,1/6);
output;
end;
proc freq;tables y;
run;
数理統計学第2回
31
データの平均と分布の平均
• 平均
– データの平均 x = (x1 + x2 +…+ xn)/n
– 分布の平均
x f(x) dx
– 平均という統計量X = (X1 + X2 + … + Xn) / n
• 経験分布(nが大きい世界で,母集団分布を
データの分布で近似する)という概念を導入
すると上の二つは同じになる.3番目はその
統計量版(確率変数版)
数理統計学第2回
32