第2章 確率と確率分布

第2章補足Ⅱ
2項分布と正規分布についての補足
統計学 2006年度
• 確率変数 - とりうる値(連続変数の場合にはそ
の値を含む微小な区間)のそれぞれにある確率が
対応している変数
• 確率分布 - 確率変数のとりうる値(連続変数の
場合にはその値を含む微小な区間)と確率との対応
関係
• 確率分布は、いくつかの種類に分類することができ
る。
– 離散型確率分布
2項分布、ポアソン分布、負の2項分布、超幾何分布、・・・
– 連続型確率分布
正規分布、t分布、カイ2乗分布、・・・
d) 2項分布
[定義] 起こりうる結果がAかBかという2つの結果しか起こらな
い試行† をn回繰り返したとき、Aという結果がx回おこったと
する。このxの確率分布を2項分布という。
† このような試行をベルヌーイ試行という
[分布関数] Aが起こる確率をp、Bが起こる確率をq(=1-p)とす
ると、2項分布は
p(x)=nCxpxqn-x
という式であらわすことができる。この式を2項分布の分布関
数という。
[期待値と分散] 2項分布の期待値(平均)は E(x)=np
分散は
V(x)=npq
となる。
(例) サイコロを3回振る実験では、A(1の目が出る)かB(1の
目が出ない)かという2つの結果しか起こらない試行をn(=3)
回繰り返したとき、A (1の目が出る)という結果がx回おこっ
た。このxの確率分布は2項分布(にしたがう)といわれる。
•
1
5
p  ,q  ,n  3
この例では、 6
であるので、分布関数にあては
6
めると、 p(x) C 1 x 5 3 x となる。
3 x
6 6
• xのとりうる値は0,1,2,3の4つであるので、この分布関数は次
のような関係を表している。
x
1
P(x) 3 C0  
6
0
0
5
 
6
30
1
1
1
C
3 1 
6
5
 
6
31
2
1
C
3 2 
6
2
5
 
6
3 2
3
1
C
3 3 
6
3
5
 
6
33
※ nCxについて
• nCxはn個の中からx個を選ぶ組み合わせの数であり、次の
ように定義される。
n Cx 
n!
x!(n  x)!
• ここで、!は階乗を表す記号であり、次のようなものである。
n! = n ×(n-1)×・・・×2×1
よって、nCxは次のように計算できる。
n  (n  1)   (n  x  1)  (n  x)   2 1
n Cx 
x  ( x  1)   2 1 (n  x)   2 1
x個
n  (n  1)   (n  x  1)

x  ( x  1)   2 1
x個
たとえば、5人の班の中から2人の委員を選ぶ組み合わせは
5 C2 
5  4 20

 10(通り )
2 1 2
となる。
• サイコロを3回振る実験において、1の目が1回出るパターン
は、 ○××, ×○×, ××○ の3通りあるが、これはサイコロを
振る3回のうち、何回目に1の目が出るかを考えたものであり、
3 C1 
3
 3(通り )
1
である。
• また、nC0は定義のように計算できないので、 nC0=1と特別
に定義する。
•
であることから、サイコロを3回
振る実験の分布関数は次のように表すことができる。
3C0=1, 3C1=3, 3C2=3, 3C3=1
x
0
P(x)
5
 
6
3
1
1
1
3 
6
5
 
6
2
2
1
3 
6
2
1
5
 
6
3
1
 
6
3
• 離散型確率変数の期待値は、一般に E(x)   x P(x) によっ
て求めることができるので、
E(x)  0  0.579 1 0.347 2  0.069 3  0.005
 0  0.347 0.138 0.015 0.5
となる。
• 確率変数が2項分布にしたがう場合、期待値は E(x)  np と
して求めることができる。すなわち、すべてのとりうる値と対
応する確率が得られなくても、期待値が計算できるのである。
• この例の場合 E( x)  3  1  1  0.5 となる。
6
2
• また、2項分布にしたがう確率変数の分散は V( x)  npq
て求めることができる。
1 5 5
• この例の場合 V( x)  3   
6 6 12
となる。
とし
e) 正規分布
• 2項分布において、nを大きくしていくと、左右対称のつりがね
型の正規分布といわれる分布に近づく。
• 2項分布は離散型確率変数の分布であるが、nを無限に大き
くしたとき、xのとりうる値は無限に大きくなる。すなわちxは連
続型確率変数として扱われる。
n=500のとき
P (x)
0.06
0.05
0.04
0.03
0.02
0.01
144
136
128
120
112
104
96
88
80
72
64
56
48
40
32
24
16
8
0
0
x
• 正規分布は平均μ、分散σ2の値によって、中心の位置や山
の高さが変わってくる。
<平均の異なる正規分布>
σ=1の正規分布
0.5
μ=0
μ=3
μ=-4
0.4
0.3
0.2
0.1
0
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
<分散の異なる正規分布>
μ=0の正規分布
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
σ=1
σ=2
σ=1/2
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
• これらの正規分布は、中心の位置を移動させたり、目盛りの
幅を変える(横に伸ばしたり、縮めたりする)ことによって、全
て同じ正規分布となる。
※ 標準化と標準正規分布
• 正規分布にしたがう変数は、平均・分散をそろえることによっ
て、比較することが可能である。
• さまざまな正規分布における値を、標準正規分布における相
対的な位置に変換し、比較する。