統計解析 第9回 第9章 正規分布、第11章 理論分布

統計解析 第9回
第9章 正規分布、第11章 理論分布
今日学ぶこと
•正規分布
•連続分布
•一様分布
•中心極限定理
二項分布の復習
2択の問題、てきとーに答えれば当たる確率は1/2
全部で100問。
全部で10問。
全部で4問。正解回数の確率分布は?
0.3
0.09
0.4
3 11 4
5 22 6
7 33 8
9 44 10
98
1 00 2
91
0
84
00
77
0.01
0
0
70
0.0625
63
4
0.1
0.1
0.02
0.05
0.05
0.05
56
0.25
49
3
42
0.375
35
2
0.04
0.15
0.1 0.15
0.03
28
0.25
14
21
1
0.25
0.25
0.05
0.15 0.2
0.2
7
0.0625
0
0
0.08 0.4
0.25 0.35
0.07 0.35
0.3
0.3
0.2
0.06
対称でない二項分布
4択の問題。てきとーに答えれば当たる確率は1/4
98
10
91
94
84
8
77
70
73
63
6
56
25
49
4
42
13
28
2
14
21
0 01
7
何かに近づいて
いきそう。
0
問題数が多ければ、
確率分布の形は
似てくる。
0.1
0.3
0.45
0.09
0.4
0.25
0.08
0.35
0.07
0.2
0.3
0.06
0.25
0.15
0.05
0.2
0.04
0.1
0.15
0.03
0.1
0.02
0.05
0.05
0.01
000
35
全部で100問。
全部で10問。
全部で4問。正解回数の確率分布は?
正規分布と確率密度関数
•x = μに関して対称
•x = μで最大値
•x→±∞のとき、f(x)→0
•曲線下の面積 = 1
正規分布(ガウス分布)
e
μとσに適切な値を設定すると
以下の曲線を表す関数になる
μ:平均
σ:標準偏差
0.09
98
91
x
84
98
91
84
77
70
63
56
49
42
35
28
14
21
7
0
77
0.01
70
0.02
63
0.03
56
0.04
49
0.05
42
0.06
35
0.07
28
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0.08
0
f(x)
X~N(μ,σ2)であらわす
14
21
2
2
2 2
7
1
0
f x  

x   2

確率密度関数と確率
P6  X  8   f x dx  
この計算は大変!

x   2

8
8
1
6
6
2
2
2 2
e
dx
0.3
0.25
6から8
の値をとる
確率
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
9
10
正規化
X~N(μ,σ2)とする一般に
F  x   P X  x   
x

の計算は大変なので
PZ  z   F z   
f x dx  
z
x
z
1

2

2
e
z2

2
x
1

2

x   2

2
e
2 2
とすると dz 
 dz  
z

Zを標準化変量と呼ぶ。
となる。この計算の結果は正規分布表として
教科書の表A1(P294,295)で与えられている。
1
e
2
dx
dx

z2

2
より
dz
平均0
標準偏差1
標準正規分布
計算例
X~N(1,22)とする
の計算は大変なので
x 1
z
2
とすると
P(X<3)=P(Z<1)=F(1) =0.8413…
つまり、平均1、標準偏差2の分布において、
3以下の値をとる確率は0.8413…である。
表にはF(-1)などはない、マイナスの場合を計算したい場合には
F(-z) = 1 – F(z)
を利用する。
ちょっと練習問題
変量Xは平均が10、標準偏差が5の正規分布にしたがう。このとき、
•13以下の値が出る確率
•7以下の値が出る確率
•8以上11以下の値が出る確率
を求めてみよう。
ちなみに記号で書くとX~N(10,52)に従うということ
z=(x-10)/5とすると
P(x<13)=P(z<3/5)=F(0.6)=0.7257
?
P(x<7)=P(z<-3/5)=1-F(0.6)=1-0.7257=0.2743
P(8<x<11)=P(-2/5<z<1/5)=F(0.2)-1+F(0.4)
=0.5793-1+0.6554=0.23…
その他理論分布
正規分布
一様分布
f x  
1
2 2

x   2

e
2 2
 1

, a xb
f x    b  a
 0, その他
関数が与えられれば、平均と分散を求められる。
確率密度関数からの平均と分散の計算
離散

連続
 xf x

   xf x dx

全ての x
一様分布
の平均

b
a
 
2
2
b
1
1
b

a
ab
2
x
dx 
x a

ba
2b  a 
2(b  a)
2


x    f x dx

 
2
2
一様分布の分散


b
a
ab

x

2


2
1
dx
ba
b
1
2


x
 a  b x 


a
b  a  
a  b 2
4

d x   


a  b 2
12
収入
A方式
B方式
1月
40
36
2月
36
36
3月
35
36
4月
33
36
5月
39
37.75
6月
39
37.75
7月
37
37.75
8月
36
37.75
9月
33
34
10月
40
34
11月
31
34
12月
32
34
合計
431
431
平均
35.9166 35.9166
標準偏差
3.17542 1.60018
中心極限定理の例
45
40
35
30
25
20
15
10
5
0
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
収入が不安定な場合
A:毎月もらう
B:4ヶ月ごとの平均をもらう
12ヶ月で見た場合、合計も平均も同じ
ただし、標準偏差(及び分散)は異なる
平均を見たほうが安定していそう
どのくらい安定しているのか?→中心極限定理
中心極限定理
独立に同一な分布(平均μ、標準偏差σ)
に従うn個の変数の平均は

平均μ、標準偏差
の正規分布
に従う n
前の例で言うならば
A方式(独立に同一な分布に従っている):
平均35.9…、標準偏差3.1754…
B方式(4個の平均):
平均35.9…、標準偏差1.600…
確かに、平均は同じで
標準偏差は 1  1
倍くらいになっている
4
2