ポアソン分布

ポアソン分布の確率関数
第6回: ポアソン分布(2回目)
と正規分布(1回目)
p( x) =
λx
x!
⋅ e −λ , x = 0,1,2, L
ただし、λは正の数。
ポアソン分布は、ただ1つのパラメータλで
表される。P(λ)
ポアソン分布P(λ)
0.7
0.6
p(x)
0.5
λ=0.5
λ=1.0
λ=2.0
λ=3.0
λ=5.0
λ=10.0
0.4
0.3
0.2
分布のグラフ(続):さらに大きなλ値では…
ポアソン分布
のグラフ
ポアソン分布P(λ)
0.14
0.12
0.1
0.1
0
1
2
3
4
5
6
7
8
x
9 10 11 12 13 14 15 16
λ=10
λ=50
λ=100
λ=150
p(x)
0
0.08
ポアソン分布P(λ)
ポアソン分布のグラフ…
0.06
0.14
0.12
0.02
16
14
12
8
10
6
0
2
4
e
寄り道:自然対数の底
の
2つの展開公式について
べき乗
階乗での展開公式
160
148
135
123
110
85
⎛n⎞
λx − λ
⎯→ P (λ ) =
⋅e
B (n, p) = ⎜⎜ ⎟⎟ p x (1 − p) n − x ⎯
x!
⎝ x⎠
べき乗での展開公式
n
199
177
188
155
166
133
144
122
111
P(λ )( x) =
100
29
23
25
27
19
21
13
15
17
7
0
9
11
0
1
1
0.5
3
1
0.5
5
np = λ(一定値)
のままで、p → 0, n → ∞
を、実際に分布のグラフを書いて確認してみよう。
89
1.5
67
78
2
1.5
45
56
2.5
2
34
2.5
12
23
3
n
n
eの展開公式
1
階乗
97.
二項分布 → ポアソン分布
B(n , p)
P(λ)
1⎞
⎛ 1 1
⎛ 1⎞
e = lim ⎜1 + + + L + ⎟
e = lim ⎜1 + ⎟
1! 2!
n! ⎠
n⎠
n →∞ ⎝
n→∞ ⎝
e = 2.718281828...
3
60
x
x
eの展開公式
72.
0
35
0
0
0.02
47.
0.04
22.
0.06
0.04
5
p(x)
0.1
0.08
10
λ=10
λ=20
λ=30
λ=40
λ=50
λ=60
λx
x!
⋅ e −λ , x = 0,1,2, L
λは正の数
1
ポアソン分布が二項分布のある極限
であることの証明
二項分布が、ポアソン分布に近づくか?例1
• サイコロ1個を4回振って、6の目が出る
n = 4, p = 1 / 6, np = 2 / 3
B (4,1 / 6),
• ある ⇔
• サイコロ2個を24回振って、6のゾロメが出る
np = λ (一定値)のままで、
n = 24, p = 1 / 6 , np = 24 / 36 = 2 / 3
B(24,1 / 6 ),
2
2
• サイコロ3個を144回振って、3個全てが6の目が出る
p → 0, n → ∞
n = 144, p = 1 / 63 , np = 144 / 63 = 2 / 3
B(144,1 / 63 ),
• サイコロ4個を864回振って、4個全てが6の目が出る
n = 864, p = 1 / 6 4 , np = 864 / 6 4 = 2 / 3
B(864,1 / 6 4 ),
教科書の第1の証明方法のみ(特性関数は
取り上げなかったので、第2の証明方法も
取り上げない)
• …
P(2 / 3)
に近づくか?
np = λ(一定値)
のままで、p → 0, n → ∞
B (n, p )( x) =
B (n, p )( x)
n!
p x (1 − p ) n − x
x!(n − x)!
=
x個
64444744448
n(n − 1)(n − 2) L (n − x + 1) x
=
⋅ p (1 − p ) n − x
x!
p x x n(n − 1)(n − 2) L (n − x + 1)
=
⋅n ×
× (1 − p ) n − x
x!
nx
(np ) x
⎛ 1⎞ ⎛ 2⎞
⎛ x −1⎞
n− x
=
× 1 ⋅ ⎜1 − ⎟ ⋅ ⎜1 − ⎟ ⋅ L ⋅ ⎜1 −
⎟ × (1 − p )
x!
n ⎠
⎝ n⎠ ⎝ n⎠
⎝
⎯np
⎯=λ⎯
⎯⎯
⎯→
, p → 0, n →∞
np = λ(一定値)
のままで、p → 0, n → ∞
λx
x!
(np ) x
⎛ 1⎞ ⎛ 2⎞
⎛ x −1 ⎞
n− x
× 1 ⋅ ⎜1 − ⎟ ⋅ ⎜1 − ⎟ ⋅ L ⋅ ⎜1 −
⎟ × (1 − p )
x!
n ⎠
⎝ n⎠ ⎝ n⎠
⎝
⎛ np ⎞
(1 − p) n − x = ⎜1 − ⎟
n ⎠
⎝
⎛ x⎞
n⋅⎜ 1− ⎟
⎝ n⎠
⎛ n⎞
⎜ − ⎟ ⋅ (−λ )
λ⎠
⎛ λ ⎞⎝
= lim ⎜1 − ⎟
n⎠
n→∞ ⎝
⎛ λ⎞
⎯np
⎯=λ⎯
⎯⎯
⎯→ lim ⎜1 − ⎟
, p →0 , n →∞
n⎠
n →∞ ⎝
⎛ 1⎞
= lim ⎜1 + ⎟
n⎠
n →∞ ⎝
n
n⋅( − λ )
=e
−λ
λx − λ
∴ B(n, p) ⎯⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯⎯→ ⋅ e = P(λ )
p → 0, n → ∞
証明続く
x!
証明終わり
例2:教科書の図4.3の分布 np = λ = 10
二項分布とポアソン分布
二項分布とポアソン分布:np=10の場合
0.45
0.25
0.4
B(4,1/6)
B(24,1/36)
B(144,1/6^3)
B(864,1/6^4)
P(2/3)
0.3
0.25
0.2
0.15
0.2
B(n,p)とP(λ)
B(n,p)と P(λ)
0.35
n=15
n=20
n=30
n=50
n=100
n=500
P(λ=10)
0.15
0.1
0.1
0.05
0.05
0
1
2
3
4
5
6
x
7
8
9
10
0
1
3
5
7
9
11
13
15
17
19
x
2
二項分布と、その極限に対応する
ポアソン分布のグラフ
指数分布の裏としてのポアソン分布
二項分布とポアソン分布:今日が誕生日
•
•
•
•
B(120, 1/365)とP(120/365)
0.8
0.7
0.6
0.5
B(120, 1/365)
P(120/365)
0.4
0.3
0.2
0.1
0
0
1 2 3
4 5 6
x
7 8 9 10
ポアソン分布の方が、
計算がラク…
簡単なモデルで理解してみよう
単位時間(1 時間、日、秒、…)
時間の流れ
t
t +1
それを頭の中でN等分してみる。ここで、Nは十分大きな数
1/N :十分短い時間間隔
稀に、互いに独立に生起する事象
モデルで理解(続き2:
生起数はポアソン分布)
⇒全N個の (=単位時間)で x 個の が生じる
確率は、二項分布 B (N, p)で与えられる。
N p = λ, N は十分大きい、pは小さい
⇒ ポアソン分布 P (λ)
つまり、単位時間当たりに事象
がx回生起する
確率は、ポアソン分布(λ)で与えられることがわ
かった。
がら空きの銀行窓口へのお客さんの到着、
交通量の少ない道路での車の通過、
放射性元素の原子核の崩壊、
交通事故にあって死亡、
など、個々のお客さん、車両、原子、市民には
稀にしか起こらない事象があり、それぞれは
互いに独立に起きるとき⇒
その時間間隔 t は指数分布
その単位時間当たりの生起数 x はポアソン分布
モデルで理解(続き1:モデルの説明)
• いま、単位時間当たりに平均λ回起こる事象だ
とすると、1/N の間に起こる確率pは、 p =λ/N
• ごく短い時間間隔1/N の間に起こる確率p は
たいへん小さく、1つの
に2つ以上の
が同時に起こることはないとする(そのように、
Nを十分大きくとる)。
• このとき、1つの
には、 が生じるか生じ
ないか、のいずれかがpと1-pの確率で起きる。
N個の異なる
では、互いに独立にそのいず
れかが起きる。
⇒これは…
モデルで理解(続き3:
生起間隔は指数分布)
⇒また、時間間隔 t の確率密度分布f (t)は、
次のように考えればよい。x 個離れた で初
めて次の が生じる確率は
p=λ/N による幾何分布 P幾何(x)=(1-p)x-1p
で与えられる。(幾何分布:テキストp.13)
時間に直すには、t =x/N とすればよく、
P幾何(x) Æ f (t) dt ( N p = λ, N→∞)
Nt −1
λ
⎛ λ⎞
f (t ) = lim ⎜1 − ⎟
⋅ N = λe −λt 指数分布
N⎠
N
n →∞ ⎝
3
復習:2回目(4/16) テキストp.20
例題2.4:[3]指数分布での平均と分散
指数分布
⎧λe
f (t ) = ⎨
⎩0
− λt
+∞
µ = ∫ x ⋅ f ( x)dx
2
と σ =
(t ≥ 0)
(t < 0)
正規分布(1回目)
に対して、
+∞
∫ (x − µ)
2
⋅ f ( x)dx を計算する
−∞
−∞
⇒µ=
1
λ
, σ2 =
まず、どんな分布か…
z正規分布 (Normal Distribution)、
ガウス分布(Gaussian distribution)、誤差関数
とも呼ばれる。
z確率変数x は実数値をとる、連続分布
1
z2つのパラメータ、平均μ、分散σ2 で
特徴付けられる。N (μ, σ2)
λ2
時間間隔 t の平均は 1/λ
正規分布のグラフ
正規分布の確率密度関数
正規分布:分散σ2の違い
−
2σ 2
, x∈R
0.8
0.7
標準正規分布 N(0,1)への標準化
一般に、正規分布N (μ,σ2)に従う確率変数x を、
以下のようにuに変数変換すると、確率変数u は
μ=0.0, σ=1.0の標準正規分布N(0,1)に従う。
x−µ
σ
⎛ x−µ ⎞ 1
E (u ) = E ⎜
⎟ = (E ( x) − µ ) = 0,
⎝ σ ⎠ σ
⎛ ⎛ x − µ ⎞2 ⎞ 1
σ2
⎟=
E (u 2 ) = E ⎜ ⎜
⋅ E ( x − µ )2 = 2 = 1
⎜ ⎝ σ ⎟⎠ ⎟ σ 2
σ
⎝
⎠
(
)
この変数変換によりN(0,1)になおすことを、
「正規分布の標準化、正規化」という。
μだけ左に平行移動し(それにより、x=0が分布の中央に)、
σ分の1に縮小する(それにより、分散で表される拡がりが1に)
0.5
0.4
0.3
0.2
0.1
5
4
3
2
1
0
-1
0
-2
ただし、μ,σは実数。
正規分布は、2つのパラメータμ,σで表される。
N(μ,σ2)。式より、直ちにわかること;
•x=μに関して、左右対称(偶関数)。
•また、この平均値x=μで最大値をとる。
•x=μから左右にσだけ外れたところでは、最大
値のexp(-1/2)=0.606530…倍
x → u, u =
σ2=0.5
σ2=1.0
σ2=2.0
σ2=3.0
σ2=5.0
σ2=10.0
0.6
-3
2πσ
2
⋅e
N(0,σ2)
1
0.9
-4
f ( x) =
( x−µ )2
x
標準正規分布に変換して計算
⎧a − µ x − µ b − µ ⎫
Prob{a ≤ x ≤ b} = Prob ⎨
≤
≤
⎬
σ
σ ⎭
⎩ σ
b−µ
b−µ⎫
⎧a − µ
= Prob ⎨
≤u≤
⎬ = N (0,1)(u ) du
σ
σ ⎭ a −∫µ
⎩
σ
σ
u は、標準正規分布N(0,1)に従うので、N(0,1)について
上記の確率を求めることができれば、任意の正規分布
N (μ, σ2)に従うxについて、確率を求めることができる。
そこで、 特にN(0,1)についてのみ、確率値を与える
確率密度関数N(0,1)の積分値を、正規分布表として
用意しておき、数値計算等の手間を省く。
4
KpとPの対応:グラフでみると…
正規分布表
0.5
を与える、Kp ⇔ P の対応表:正規分布表
積分値Pが、確率値を与える。
• テキスト61ページの例題5.1:「品質管理」
化粧品のボトル。工場でのボトル詰め工程により、実際
にボトル詰めされた製品の容量にはバラツキが生じて
しまう。いま製品を多数抜き取って調べたところ、平均
125ml, 標準偏差2.0mlの正規分布に従っていることが
わかった。ボトルは、「容量120ml」と表示して出荷して
いるので、120ml以下で規格外である製品は、極力出
してはいけないが、現状では何%生じているか?
また、0.1%以下にするには、標準偏差の値をどこまで
小さくすべきか?(平均を上げると損になるので、詰め
作業の精度を上げることで標準偏差を小さくしたい)
∫
+∞
−∞
e
a
− u2
2
du =
2π
a
0.3
0.2
0.1
Kp > 0 の場合について求めておけば、十分。
⇒ Kp < 0については、どうすれば良いか?
Answer: 分布の対称性を利用せよ。
正規分布表を用いた確率計算の例題
:製品の品質管理
0.4
3
6
9
3.
2.
3.
1
4
2.
3.
8
1.
7
5
1.
3
2
1.
2.
6
9
0.
0
0
3
Kp
0.6
0.
Kp
下限値 Kp ⇒ 確率値 P
2
1 − u2
e du =P
2π
0.
∞
確率値 P
Prob{u ≥ K p } = ∫ N (0,1)(u )du = ∫
∞
下限値 Kp
確率分布が満たすべき2条件の確認
f ( x) =
● f ( x) ≥ 0
+∞
● ∫ f ( x)dx =
−∞
=
1
2π
∫
+∞
−∞
e
−
u2
2
1
2πσ 2
1
⋅e
2πσ 2
∫
+∞
−∞
e
−
−
( x−µ )2
2σ 2
( x−µ )2
2σ 2
, x∈R
dx
1
x−µ
⎛
⎞
, du = ⋅ dx, u : −∞ → +∞ ⎟
du ⎜ x → u =
σ
σ
⎠
⎝
=1
最後の等号は、もし次式が
成り立っているならば(a=1)⇒
∫
の証明は次回
+∞
−∞
e
a
− u2
2
+∞
∫e
a
− ⋅u 2
2
2π
a
du =
du =
−∞
2π
, for a > 0
a
の証明
左辺 = I とおくと、
⎛ + ∞ − a u 2 ⎞ ⎛ + ∞ − a v 2 ⎞ + ∞ + ∞ − a (u 2 + v 2 )
I 2 = ⎜⎜ ∫ e 2 du ⎟⎟ ⋅ ⎜⎜ ∫ e 2 dv ⎟⎟ = ∫ ∫ e 2
dudv
−∞
−∞
−∞ −∞
⎝
⎠ ⎝
⎠
ここで、変数変換:直交座標系(u, v)から極座標系(r , θ )へ
v
du
v⎞
⎛
(u, v) ⇒ (r ,θ ) : u = r cos θ,v = r sin θ , ⎜ r 2 = u 2 + v 2 , θ = tan −1 ⎟
u⎠
⎝
u, v : −∞ → +∞ ⇒ r : 0 → +∞, θ : 0 → 2π
dv
u
⇒
du ⋅ dv = rdθ ⋅ dr
rdθ
dr
θ
r
5
∫
+∞
−∞
e
a
− u2
2
2π
a
du =
正規分布の平均
の証明(続き)
du ⋅ dv = rdθ ⋅ dr
I2 =
+∞
∫ ∫
−∞
+∞
−∞
e
−
(
a 2
u +v2
2
)
dudv =
∫
∞
0
re
−
a 2
r
2
dr
∫
2π
0
+∞
⎡ 1
= 2π ⎢ − ⋅ e
⎣ a
dθ
+∞
=∫
= ∫ (x − µ) ⋅
2
−∞
2πσ
2
e
−
( x−µ )
2σ
2
パラメータσ2は分散
u e
2
−
u2
2
2πσ
2
e
−
x '2
2σ 2
( x−µ )2
2σ 2
dx
+∞
dx'+ µ ⋅ ∫ f ( x)dx
−∞
2
∫
+∞
−∞
u e
2
−
u
2
∫
du = 2π
∫
+∞
−∞
e
a
− u2
2
2π
a
du =
⎛ u 2 ⎞ − a2 u 2
2π
⎛ 1⎞1
⎜⎜ − ⎟⎟ × e du = ⎜ − ⎟ ×
a
⎝ 2⎠ a
⎝ 2⎠
+∞
−∞
証明方法2:
↑
}
2
の証明(2つの方法)
du = 2π
証明方法1:
先に証明した
dx
最後の等号は、もし次式が
成り立っているならば ⇒
+∞
−∞
1 − u2
x−µ
dx
⎛
⎞
= σ 2 ⋅ ∫ u2 ⋅
e du ⎜ by x ⇒ u =
, du =
, u : −∞ → +∞ ⎟
−∞
σ
σ
2π
⎝
⎠
2
=σ
+∞
1
x'
−
=µ
∫
+∞
1
2πσ 2
e
= 0+µ
正規分布の分散
+∞
+∞
−∞
証明終わり
2
1
−∞
⎤
2π
⎥ =
a
⎦0
−∞
∫ {( x − µ ) + µ}⋅
=
∞
分散 = ∫ ( x − µ ) 2 ⋅ f ( x)dx
パラメータμは平均値
−∞
u, v : −∞ → + ⇒ r : 0 → ∞,θ : 0 → 2π
a
− r2
2
∫ x ⋅ f ( x)dx
平均 =
+∞ 2
∫−∞ u{ e
↓
−
2
u
2
の両辺をa で微分すると、
これにa=1を代入して
得られる。
そのまま、部分積分
+∞
u ⎤
u
⎡
−
+∞ −
du = ⎢u ⋅ ( −1) ⋅ e 2 ⎥ + ∫ e 2 du = 0 + 2π = 2π
−∞
⎥⎦ −∞
⎣⎢
2
2
6