パワーポイント6

数理統計学
西山
連続型の確率分布: 一様分布
0か1かの確率分布
離散型
0から1まで全ての値
連続型
面積で確率を示す
連続型の確率分布: 一様分布
確率密度
1
0.2から0.9まで
どんぴしゃり、X=0.5
に入る確率は0.7
となる確率はゼロ!
です。これを式で書
これをうまく説明して
くと・・
全面積=1
面積で確率を示す
期待値=値×確率の合計、に違いはなし
Xの値を0から1までベターっと、値×確率を
合計すると・・・
1
 x2  1
EX    x 1dx    
0
 2 0 2
1
 
EX
2
1
 x3  1
  x 1dx    
0
 3 0 3
1
2
 
V X   E X  E X 
2
 SDX  
1
 0.29
12
2
2
1 1
1
   
3  2  12
練習問題
1. 確率変数Xは、0から1までの任意の値を等しい可
能性でとる。このとき𝑋 2 の期待値E 𝑋 2 はいくらか。
2. 確率変数Xは、0から2までの任意の値を等しい可
能性でとりうる。𝑋の分布図を描け。さらにE 𝑋 と
V 𝑋 を求めよ。
3. 確率変数Xは、0から2までの値をとり、その間の確
1
率分布は𝑓 𝑥 = 𝑥で表される。設問に答えよ。
2
① 分布を描け。確率分布になっているか。
② 変数𝑋の期待値(と分散)を求めよ。
主な確率分布‐離散型
以下は必須の離散分布
1.
2.
3.
4.
二値分布(バイナリ―分布、ゼロイチ分布)
二項分布
ポアソン分布
多項分布(サイコロの目はこの一つ)
二値分布
とりうる値が2つのみ
X
0
1
E X   0.3
V X   0.3  0.7  0.21
P
0.7
0.3
SDX   0.21  0.46
成功確率
Y
4
8
P
0.7
0.3
?
二項分布
N個の中でX個が該当する
例:
視聴率調査、内閣支持率調査、▲▲率調査
考え方:
一つ一つがゼロイチ変数になっているN個
の和は二項分布になる
Y  X1  X 2    X N
二項分布
100人に対する視聴率調査(視聴率=20%)
Y  X 1  X 2    X 100
値
0
1
確率
0.8
0.2
期待値𝐸 𝑌 と分散𝑉 𝑌 を求めてください。
50の市で調査してみる…各市100人が対象
どこも視聴率20%のはずである
こんな結果<値とばらつき>
になるべきだったのか?
統計ソフトRで50市の結果
を要約
> mean(sample1)
[1] 19.5
> var(sample1)
[1] 14.13265
二項分布<𝑁 = 100, 𝑝 = 0.2>の確率分布図
この分布の期待値と分散を求めよ
x
100  x


P X  x 100 C x 0.2 0.8
人数(x)に、0から100までを代入して計算
クイズ
レポート提出可
締切:5/20
ある果物は、傷がついているものが全体の10%を
占めていることが例年の経験からわかっている。今
年出荷する分についても、その割合は同じだとする。
100個を1箱につめるとき、1箱の中のX個に傷があ
るとする。下の設問に答えよ。
1. このXは確率変数か?
2. どんな確率分布に従うか?
3. 𝐸 𝑋 と𝑉 𝑋 , 𝑆𝐷 𝑋 を求めよ。
ポアソン分布
二項分布の成功確率が非常に小さいケース
例:
1日の事故発生数、1頁のミスプリ数
ある国道の区間では毎日1件のペースで交通事故
が起こっている。では、そこで1日に事故が2件以上
発生する確率はいくらか?
Y  X 1  X 2    X 1339  X 1440
1
𝑁 = 1440分、𝑝 =
1440
ポアソン分布
1日の事故がX件おこる
𝑃 𝑋 ≤ 1 = 0.74
2回以上、起こる確率は
26%になる
ポアソン分布
1頁のミスプリ数 【考え方】
300頁の本に、50個のミスプリがある。同じページに2
個以上のミスプリがない確率はいくらだろうか。
考え方:
1
一つのミスプリがあるページに発生する確率は で、このことは
300
50個ある全てのミスプリに当てはまる。
𝑌 = 𝑋1 + 𝑋2 + ⋯ + 𝑋49 + 𝑋50
どの値もゼロイチ変数で、1になる個数を数える問題だから、本
来は二項分布になる。しかし、1をとる確率が極端に小さい。
ポアソン分布
1頁のミスプリ数 【解答】
あるページをとって、そのページにX個のミスプリがあるとする。
50
Xは0から50まで。しかし、平均は非常に小さい。300 = 0.17
確率分布関数
𝑥
𝑥
𝜆
0.17
𝑃 𝑋 = 𝑥 = 𝑒 −𝜆
= 𝑒 −0.17 ×
𝑥!
𝑥!
𝜆は平均値 ➡
50
300
ミスプリの個数が0ないし1個の確率を求める:
𝑃 0 = 0.84
解答: 確率=0.98
𝑃 1 = 0.14