スライド 1

情報通信工学セミナーⅡ
応用数学
確率 確率分布
C507092
松村政志
1
目次
1.確率
2.確率分布
2
1.確率
何らかの試みで生じ得るすべての結果に対し
目的とする状態の発生する可能性を表すもの
ある試行が行われたあとある事象が現れる割
合。偶然性を含まない一つに定まった数値。
3
1.確率
サイコロを1回投げた時、1の目が出る確率
全事象
6
起こり得る事象 1
確率をP(A)とすると
P(A)=1/6
4
1.確率
・和事象
・事象AまたはBのいずれかが起こる事象
・事象AとBが同時に起こらない(互いに排反)場合と、
両方の事象が重複する部分がある場合の2通りがある。
5
1.確率
・和事象
事象AとBが互いに排反である場合
事象Aの確率をP(A) 事象Bの確率をP(B)とすると
AとBが互いに排反である場合の和事象の確率P(A∪B)は
P(A∪B)=P(A)+P(B) と表される
A
B
6
1.確率
・和事象
事象AとBが互いに排反である場合
例:サイコロを振った時偶数である2.4.6の目が出る
のは互いに排反であるため
事象A:サイコロの目が2 事象B:サイコロの目が4
事象C:サイコロの目が6
P(A∪B∪C)=1/6+1/6+1/6=1/2
となる。
A
2
B
C
4
6
7
1.確率
・和事象
事象AとBが排反でない場合
事象Aの確率をP(A) 事象Bの確率をP(B) AとBが同時に起こる確率をP(A∩B)とすると
AとBが互いに排反でない場合の和事象の確率はP(A∪B)
P(A∪B)=P(A)+P(B)-P(A∩B) と表される
A
B
8
1.確率
・和事象
事象AとBが排反でない場合
例:サイコロを振った時、2の倍数(2.4.6)と3の倍数(3.6)
の出る事象は互いに排反でないので
A{2.4.6} B{3.6} P(A∩B){6}
P(A∪B)=3/6+2/6-1/6
=4/6
=2/3
となる。
9
1.確率
・積事象
・事象AとBが同時に起こる事象
・事象が互いに独立している独立事象と、一方の事象が
他方の事象に影響を及ぼす従属事象がある
10
1.確率
・積事象
事象AとBが独立事象である場合
事象Aの確率をP(A) 事象Bの確率をP(B)
AとBの積事象の確率をP(A∩B)とすると
P(A∩B)=P(A)×P(B)
例:サイコロを2回振った時、最初に奇数が出る事象A
と2回目に5の目が出る事象Bは独立事象
A{1.3.5} B{5}
P(A∩B)=3/6×1/6
=1/12
A
B
11
1.確率
・積事象
事象AとBが従属事象である場合
事象Aの確率をP(A)
事象Aの起こったことを前提に事象Bが起こる確率をPA(B)
積事象をP(A∩B)とすると
P(A∩B)=P(A)×PA(B)
12
1.確率
例:1から10の数字が書かれたカードから、1枚ずつ2枚のカード
を取り出すことを考える(取り出したカードは元に戻さない)
2枚とも奇数のカードを取り出す確率はいくらか
1.2.3.4.5.6.7.8.9.10
奇数を取り出す確率は5/10
3を取り出したと考えると
1.2. .4.5.6.7.8.9.10
次に奇数を取り出す確率は4/9
よって P(A∩B)=5/10×4/9
=2/9
13
1.確率
・余事象
・事象AがおこらないことをAの余事象といい、A で表す
事象Aの確率をP(A) Aの余事象の起こる確率をP(A)とすると
P(A)=1-P(A)
A
A
14
1.確率
・余事象
例:サイコロを3回振って少なくとも1回は1の目が出る
事象Aの確率を余事象を用いて考えると
サイコロを一回振った時に1の目がでない確率
A1{2.3.4.5.6} A2{2.3.4.5.6.} A3{2.3.4.5.6}
P(A)=5/6×5/6×5/6
=125/216
P(A)=1-P(A)=1-125/216=91/216
15
1.確率
・原因の確率
P(A)×P(E|A)
P(A)×(E|A)+P(B)×P(E|B)
事象Aと事象Eが同時に起こる時、
事象Aの起こる確率をP(A)、事象Eの起こる確率をP(E)とすると、
事象Aが起きるという条件がみたされた場合に事象Eが起きる
確率はP(E|A)と表すことができる。
事象Aになり、更に事象Aが起きるという条件が満たされた場合
にEという事象が起きる確率は、P(A)×P(E|A)となる。
この式は、P(A)×P(E|A)+P(B)×P(E|B)の中で、
P(A)×P(E|A)が起こる確率を示している。
16
1.確率
・原因の確率
弁当あり
弁当なし
男
5
65
70
女
15
15
30
20
80
100
弁当ありの確率P(E) 女性である確率P(A)
P(E)=20/100 P(A)=30/100
P(E|A)=P(E∩A)/P(A)
P(E∩A)は女性であり、その中で弁当を持っている確率なので
P(E∩A)=(30/100)×(15/30)
=3/20
P(E|A)=(3/20)/(30/100)
よって、P(E|A)=1/2 となる。
17
1.確率
・原因の確率
弁当あり
弁当なし
男
5
65
70
女
15
15
30
20
80
100
女性である確率P(A) 弁当ありの確率P(E)
P(E)=20/100 P(A)=30/100
P(A|E)=P(A∩E)/P(E)
P(A∩E)は弁当を持っており、女性である確率なので
P(A∩E)=(20/100)×(15/30)
=1/10
P(A|E)=(1/10)/(20/100)
よって、P(E|A)=1/2 となる。
18
1.確率
・原因の確率
例:袋の中に重心の偏った2つのサイコロA,Bが入っている。
Aは1つ目が3/10の確率で、Bは1の目が3/5の確率で出
る。袋の中からサイコロを一つ取り出し、振ってみたら1
の目が出た。取りだしたサイコロがAである確率はいくらか
サイコロを取り出す確率P(A),P(B)はともに1/2
サイコロAで1の目が出る確率P(E|A)は3/10
サイコロBで1の目が出る確率P(E|B)は3/5
1/2×3/10
P(A|E)= 1/2×3/10+1/2×3/5 =1/3
19
1.確率
・原因の確率
ある試薬がある。確率98%で正しい結果が、2%で間違った結果が出る
とする。
1億人に一人かかる病気があり、この試薬を試したとき、試薬が間違っ
ているかその人が病気かどちらの確率が高いか。
正しい確率0.98 間違っている確率0.02 1億人に一人かかる確率 1/108
0.98×1/108
=4.9×10-7
0.98×1/108+0.02×99999999/108
試薬が間違っている確率が高い
0.02×99999999/108
=0.99999951
8
8
0.98×1/10 +0.02×99999999/10
20
2.確率分布
・代表値と散布度
・代表値
平均値、中央値、最頻値の総称。中央値は測定値を小さい
順に並べた時丁度真中にくる値のことで、分布の両端に
大きな値や小さな値があっても影響されない。
データが偶数個の場合真中に一番近い2つのデータの
平均をとって平均値とする。
最瀕値は、度数の最も多い階級に対する値である。
・散布度
データの分布のばらつきを表す統計量の総称。
21
2.確率分布
・中央値
6人の身長が156.8,168.7,163.8,154.1,159.6,165.6であっ
た場合。その中央値を求める。
小さい順に並べると154.1,156.8,159.6,163.8,165.6,168.7
となる。3番目と4のデータの平均値が中央値である。
中央値をMeとすると
Me=(1.59.6+163.8)/2=161.7である。
22
2.確率分布
・中央値と平均値
例えば年収を考えた場合。貧富の差が激しい国では、一部
の大金持ちが平均年収をつりあげてしまっている為、平均収
入は普通の人の年収よりもずっと高い値になってしまう。この為、
平均年収は普通の人の生活水準を推し測るには向かない。
一方中央値は、年収が低い順に国民を並べた時に丁度真中
になる人の年収を表している為、一部の大金持ちの年収に左
右されることが無く、中央値は普通の人の生活水準に近くな
る。
23
2.確率分布
・分散(標本分散)と標準偏差
平均値が同じでもデータの分布が同じとは限らない
データがどのくらい平均値の周りに散らばっているのか
知りたい
そこで、データの分散状態を調べる
分散σ2はデータ数をn、それぞれのデータ値をxi、その平均
値をxとすると、次式で得られる
24
2.確率分布
・分散(標本分散)と標準偏差
データ数n データ値xi
データ値の平均値 x
この分散σ2は変量 (xi-x)2の平均値であるから、変量xの測定
単位が、例えばcmであるとき、分散の単位はcm2になってし
まう
単位を一致させるために、分散の正の平方根σを取り、これを
変量xの標準偏差と言う 標準偏差=σ
25
2.確率分布
例:5つのデータ{3.2.7.7.6}の分散を求める
データ数n データ値xi
データ値の平均値 x
5つのデータの平均は
(3+2+7+7+6)/5=5
よって
σ2={(3-5)2+(2-5)2+(7-5)2+(7-5)2+(6-5)2}/5
=4.4
26
2.確率分布
・確率分布
宝くじで一等が当たる確率や、試験に合格する確率などに
対して、種々の結果がどんな確率で起きるかをまとめたもの
確率変数Xの確率分布において、Xの取り得る各数値の得ら
れる確率をPnとするとその平均は次式で求められる
確率分布=X1・P1+X2・P2+X3・P3+・・・+Xn・Pn
このときの平均値を期待値という
27
2.確率分布
例:サイコロを投げて、出た目に応じて得点するゲー
ムを行う。出た目が1~4の場合はその目を得点とし、目
が5,6の場合は得点しない。サイコロを一回投げた時に得点
の期待値はいくらか。
確率分布=X1・P1+X2・P2+X3・P3+・・・+Xn・Pn
サイコロの各目の出る確率は1/6、
それぞれの目で得られる値は1.2.3.4.5.6
ただし5,6は0となるので、
X=(1×1/6)+(2×1/6)+(3×1/6)+(4×1/6) =5/3
28
2.確率分布
モンティ・ホール問題
A B Cのドアがあり、このうちどれか一つがあたりである。
プレイヤーはA B Cのドアから1つ選ぶ。ホストは他の2つのドアのうち一つを開けて、
ハズレを見せる。ホストはプレイヤーに、初めの選択のままでよいか、もう一つの閉じ
ているドアに変更するか、選択権を提供する。プレイヤーは選択を変更すべきだろう
か?
当たりのドアを選ぶ確率は1/3、はずれのドアを選ぶ確率は2/3である。最初にあたり
を選んだとき、変更した場合当たる確率は0%。最初にはずれを選んだとき、変更した
場合当たる確率は100%。 なので、
変更して当たる確率=(1/3×0)+(2/3×1)
=2/3
最初のドアで当たる確率=(1/3×1)+(2/3×0)
=1/3
答え 変更した方が当たる確率が高い
29
2.確率分布
・正規分布
正規分布は自然現象や社会現象に広く見られる確率分布の
一つで、ガウス分布とも呼ばれている。
mを平均値、σ2を分散、σを標準偏差とすると、
の式で与えられる。
30
2.確率分布
・正規分布
先ほどの式から曲線を描くと、中央の平均値を中心に左右対称の釣り鐘状の曲線と
なる。正規分布はN(m,σ2)と表される。
正規分布の概形
31
2.確率分布
・標準正規分布
平均mが0,分散σ2が1である正規分布N(0.12)を標準正規分布
という。次式はその確率密度関数を示している。
32
2.確率分布
・標準正規分布
確率密度関数
連続的な値をとることができる確率変数xの確率密度を表す関数である。
確率密度関数を積分することによって、ある区間の確率を算出することが
でき、全ての区間にわたって積分を行うと1となる。
データ数を多く取っていくと、ヒストグラムはきめ細かくなり、次第に滑らか
になる。この形を確率密度関数という。
ヒストグラムと確率密度関数
33
2.確率分布
・標準正規分布
テストの点数を考える。図のような位置に40点と60点があるとすると、確率
密度関数のその間にある領域の面積をSとすると、Sは40点から60点の間に
いる人の割合になる。
f(x)
面積と確率
つまり、集団の中から一人選ぶと40点から60点の間の人を選ぶ確率はSとな
る。この面積は0以上1以下である。縦軸はある点数になる確率である。確率
密度関数は囲む全面積が1になるように縦軸を書き換えているが、その理由
34
は全確率が1になるように設定するためである。
2.確率分布
正規分布で±1σ(標準偏差)の範囲は全体の約68%である。
35
2.確率分布
散らばりの度合いを表す数値であり、平均値と各資料の値の差を二乗し、
それを算術平均した値の平方根として求める。
標準偏差が小さいことは、平均値のまわりの散らばりの度合いが小さい。
標準偏差が大きいことは、平均値のまわりの散らばりの度合いが大きい。
また、標準偏差が0の時、散らばりはない。
36
2.確率分布
(得点-平均点)は、点数と平均点との差を求めている。平均点より何点上
回っているか、下回っているかを求めている。
その値を標準偏差で割る。ここでの標準偏差とは、試験を受けたそれぞれ
の人について「平均値とどれだけ離れているか」の平均値のことを示す。
つまり、(得点-平均点)/標準偏差は、標準的な差に対して、当人の差は
大きいのか小さいのかを計算している。
その値に10を掛けて50を足すことで、50を中心に上回っているか、下回っ
ているかがわかるようにしている。
37
2.確率分布
・標準正規分布
体重、身長、科目の成績など測定している対象によって単位が異なる。
ある人が全体のなかで体重についてどの位置にいるか、身長についてどの
位置にいるかを見るためには必ずしもキログラムやセンチメートルという単
位は必要とならない。
単位が違うものでも統一的に比較できる指標があると便利である。このた
め考えられたのが標準正規分布である。
38
2.確率分布
・標準正規分布
39
2.確率分布
・標準正規分布
平均m、標準偏差σの正規分布は、次式を使うことで
平均0、標準偏差1の標準正規分布へ変換することができる
この時xが実際の変数、平均値をm、標準偏差をσ
標準正規分布の変数をuとしている。
この値をf(x)に入れ、f(u)とすることで、標準正規分布への変換
が達成される。
40
2.確率分布
・一様分布
確率変数xの値に関わらず、f(x)が一定の値をとるような分布を
一様分布と呼ぶ。minがa、maxがbとすると、確率の総和が1に
なるという制約から
f(x)×(b-a) = 1
すなわち
1
f(x)= b-a
となる。
一様分布図
41
2.確率分布
・二項分布
ある集団において、特性Aを持つものの割り合いがpであり、持
たないものの割り合いがqであるとする(p+q=1)。このとき、集団
から無作為にn人を抽出したとき、特性Aを持つ者がx人である
確率を考える。n人のうちx人が特性を持つ組み合わせはnCx。
その各々に対して、x人が特性Aを持つ確率はpx、残りn-x人が
特性を持たない確率はqn-xであり、両者共に起こるのは両者
の積である。よって、
f ( x ) = nCx px qn – x x = 0,1, … ,n,p > 0,q > 0,p + q = 1
が求まる。この分布を二項分布と呼ぶ。
42
2.確率分布
・二項分布
f ( x ) = nCx px qn – x
x = 0,1, … ,n,p > 0,q > 0,p + q = 1
p:特性を持つ者の割合 q:持たない割合 n:無作為に抽出した人数
X:無作為に抽出した時に特性を持っている人数
f(x):特性を持つか持たないかいずれかのn回の独立な試行を行ったときの特性を
持つ数で表される離散確率分布
43
2.確率分布
・二項分布
f ( x ) = nCx px qn – x
x = 0,1, … ,n,p > 0,q > 0,p + q = 1
横軸が30回のうちに特性を持つ者の人数x。縦軸がその確率f(x)となる。
二項分布は、特性を持つ確率f(x)と調査数(試行回数)nにより、分布の形が
決定される。つまり、確率×試行回数で特性を持つ者の人数が最も多くなる
44
ので、離散分布確率が一番高くなるxはf(x)×n=x となる。
2.確率分布
・ポワソン分布
単位時間中に平均でλ回発生する事象が丁度x回発生する確率
λが大きくなると正規分布に近づく。
45
2.確率分布
・ポワソン分布
ある店では、一時間に平均5人の客が来る。客の着方はランダムだとすると
き、1時間に3人の客が来る確率を求めよ。
λ=5[人/時間] x=3[人/時間] e=2.72
f(x)=0.1404
46
2.確率分布
・指数分布
単位時間中にある事象が発生する平均回数をλとするとき、その事象の発
生間隔がt単位時間である確率f(x)は指数分布に従う。
銀行の窓口に客が到着する時間感覚や、発作を起こしてから死亡するまで
の時間感覚などは指数分布に従う。
47
2.確率分布
・待ち行列
利用率をρとすると、待ち行列Lは
L=ρ/(1-ρ)
となる。
利用率/(1-利用率) つまり 利用時間/非利用時間
Ρ=0.5の時、待ち行列はL=0.5/(1-0.5)となるので、L=1となる。
これは平均一人並んでいるということになる。
48
2.確率分布
・待ち行列
利用率ρはポワソン分布で利用した「単位時間中に平均でλ回
発生する事象」をどれだけのスピードで処理できるかで求める
ことができる。ここではそのスピードをμとすると、
ρ=λ/μ
と表すことができる。
49
2.確率分布
・待ち行列
ある医院では,患者が平均10分間隔でランダムに訪ねてくる。
医者は、1人であり、一人の患者の診断および処方の時間は平均8分の指
数分布であった。このとき,患者が診察を受け始めるまでの純粋待ち時間は
何分か。
p=λ/μ
λ=1/10[人/分]
μ=1/8[人/分]
λ=6[人/時間]
μ=7.5[人/時間]
ρ=(1/10)/(1/8) = 6/7.5=0.8
L=ρ/(1-ρ) = 0.8/(1-0.8) = 4
一人あたりの診察時間が8分なので、待ち時間は
4 ×8 = 32[分]
50
参考文献
・統計学
http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/toukeihy.htm
・初級シスアド取扱説明書_正規分布図と標準偏差
http://www.geocities.co.jp/SiliconValleyCupertino/2190/topic/hensa/hensa.html
・情報理論(第2版) 著 南 産業図書
2009年版 基本情報技術者 標準教科書 中根 雅夫 監修
・一様分布
http://staff.aist.go.jp/t.ihara/uniform.html
・二項分布
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/nikou.html
・サルでもわかる待ち行列
http://www.objectclub.jp/technicaldoc/monkey/s_wait
・確率分布と検定
http://www.heisei-u.ac.jp/ba/fukui/pdf/apstattext02.pdf
51
参考文献
・第8回 教育統計入門
http://www.eng.ritsumei.ac.jp/asao/courses/rmethod/week08/RM_Week08.
pdf
・バラツキの概念と標準偏差について
http://homepage1.nifty.com/QCC/sqc2/sqc-2.html
・偏差値のお話
http://www.o-shinken.co.jp/benkyo/hensati/hensachi.htm
・指数分布
http://www.kogures.com/hitoshi/webtext/stat-poisson-bunpu/index.html
52