確率・統計(電子2年) 第2講 前回復習

確率・統計(電子2年)
第2講
• 集合論の記法,確率空間
前回復習
練習 1(小レポート課題 1)
あるコンビニエンスストアが客を増そうとして安売りを検討している.
方法 A 全商品 1 %引きにする.
方法 B レシートにくじを付け,100 人に一人,当たりを出し,当たった
人はその時購入した商品を只にする.
<1> あなたが客として,どっちの方法を取っている店に買いに行くか?
R 円の物を買いたいとする.安売りで得する金額(円)は,方法 A だと,確実
に 0.01R.一方,方法 B だと,運がいい(0.01 の「確率」で)と丸々R,そうでな
い大抵の場合は 0.このままでは比較できないので,期待値と標準偏差(分散の平
方根)で考える.
• 方法 A:期待値 0.01R,標準偏差 0.
• 方法 B:期待値 0.01R,標準偏差 0.09949 . . . × R(約 0.1R).
計算:分散= 0.01 × ((1 − 0.01)R)2 + 0.99 × ((0 − 0.01)R)2 = 0.0099R2
期待値が同じなので,
「合理的な客」は標準偏差が 0 の A の店を選ぶと思われる.
しかし,ギャンブル好きの人は敢えて B の店を選ぶかも知れない.
余談:人(市場)は必ずしも合理的に行動しない,という観点が現代の経済学
では重要な研究テーマになっているらしい.
<2> あなたが店主として,どっちの方法を採用するか?
<1>との違いは何か?それは店主の損得は多数のお客さんへの販売全体で決ま
る点である.安売りでの値引き額の総計(円)を考えよう.簡単のために,お客の
人数がちょうど 100N (100 の倍数)とし,そのうちの N 人に当りが出る,とする.
客を 1 から 100N の番号で識別し,当たりが出た客の購入金額を R1 , R2 , . . . , RN と
し,それ以外の客の購入金額を RN +1 , RN +2 , . . . , R100N としよう.すると,安売り
での値引き額の総計は,
• 方法 A:0.01
• 方法 B:
N
100N
j=1
j=1
Rj .
Rj .
1
つまり,店にとっては,もし当たりの出た N 人の各人の購入金額が他の人と比
較して高い場合は,方法 A の方が総割引額が少なく,逆に当たりの出た人たちが
安い買い物ばかりしていた場合は,方法 B の方が嬉しい.ここで重要な点は,店
主は,Rj の値を事前に知ることはできず,上の式の値を実際には(事前に)計算
できないことである.
よって,店主が安売りキャンペーンとして方法 A か B かを判断する際に,総値
引額の確率的な特性(「期待値」や「分散」)に関する分析が必要になる.さらに
もっと精密な議論をするには,j 番の客の購入金額 Rj がどういう「分布」を取る
か,にも依存するし,その際の推理や近似の妥当性は,N の大きさにも関係する.
このような場合の考え方を学ぶのも本講義の目的である.
とりあえず総値引額の期待値や分散で考えるとしよう.どの客 j も購入金額 Rj
は同じ「分布」
(未知)に従うと仮定する.実は,Rj の分布がどういう形であって
も,R1 , R2 , . . . , が互いに無関係(独立)であれば,つまり各人の購買行動が他の
人が何を買ったかに影響されないと仮定できるならば,Rj の期待値を R,Rj の分
散を VR と置く(それぞれ j に拠らないので)と,
「総値引額」の期待値と標準偏差
は以下のようになる(後日説明).
• 方法 A:期待値 NR,標準偏差
• 方法 B:期待値 NR,標準偏差
1
NVR .
10
NVR .
総値引額の期待値が同じなので標準偏差が小さい方法 A が店にとっても優しく,店
主としては,お客も喜ぶ(お客が増える)はずの方法 A を採用するだろう.<1
>で触れたように,すべての客が方法 A を好むとは限らない.しかし,どっちの
方法を好む客が多いかを考えると,店主はおそらく方法 A を選択するだろう.
練習 2(小レポート課題 2)
的当てを繰り返し行う.1 回の投てきで当る確率を x = 0.5 として,こ
の値は何回投げても変化しないとする.
<1> 10 回投げてちょうど 1 回当る確率 v.s. 30 回投げてちょうど 3 回当る確率
10 回投げてちょうど 1 回当る確率の方が大きい.
少し一般化して,1 回の当たる確率 x をパラメタ(0 < x < 1)とし,n 回投げ
て 1 回当たる確率を fn (x),3n 回投げて 3 回当たる確率を gn (x) と置くと,
fn (x) = n(1−x)n−1 x,
gn (x) = 3n C3 (1−x)3n−3 x3 =
n(3n − 1)(3n − 2)
(1−x)3n−3 x3
2
電卓を信じるなら,f10 (0.5) = 0.009766 . . . > g10 (0.5) = 0.000003781 . . . である.
ここで,f10 (x) と g10 (x) のグラフを比べると,図 1 左のように,f10 (x) > g10 (x).
2
実はこの大小関係は一般の n で成り立つ.それを確認するには,
def
hn (x) =
(3n − 1)(3n − 2)(1 − x)2n−2 x2
gn (x)
=
fn (x)
2
hn (x) = · · · = (3n − 1)(3n − 2)(1 − x)2n−3 x(1 − nx)
1
となり, x =
で最大値を取ることがわかるので,以下を示せばよい:
n
gn (x)
1
(3n − 1)(3n − 2)(n − 1)2n−2
≤ hn
=
≤ 1
fn (x)
n
2n2n
(3n − 1)(3n − 2)(n − 1)2n−2
という式の n を 1 以上の実数に拡
2n2n
張して単調減少であることを調べるか(n = 1 の時,右側の不等式の等号が成立),
数学的帰納法を適用すればよい.興味のある人はトライしてみてください.
右側の不等式は,
<2> 10 回投げて 1 回以上当る確率 v.s. 30 回投げて 3 回以上当る確率
実はどっちの確率が大きいかは,x の値によって変わる.
少し一般化して,n 回投げて 1 回以上当たる確率を Fn (x),3n 回投げて 3 回以上
当たる確率を Gn (x),
Fn (x) = 1 − (1 − x)n ,
3n(3n − 1)
(1 − x)3n−2 x2
Gn (x) = 1 − (1 − x)3n − 3n(1 − x)3n−1 x −
2
x = 0.5 の時は,
1 1
1
3n(3n − 1) 1
1 n
3n(3n − 1) Fn ( )−Gn ( ) = − n + 1+3n+
=
−4
+1+3n+
2
2
2
2
8n
8n
2
n
なので,n が大きくなると,−4 が効いて,Fn (0.5) < Gn (0.5) が言える.実際,
F10 (0.5) = 0.9990 . . . < G10 (0.5) = 0.9999 . . . となる.ここで,F10 (x) と G10 (x) の
グラフを書いて比べると,図 1 右のように,x がかなり小さい範囲では F10 (x) が
大きく,x = 0.1 を越えた辺りで逆転して G10 (x) が大きくなる.
練習 3
n チームで(例えば野球の)トーナメント戦を戦うとする.また,各
チームの強さは同等であり,どの2チームが対戦する場合も,勝つ確
率は互いに 0.5 であるとする.(無作為の)組み合わせ抽選会を行う前
の時点での,ある任意の2チームのペアがこの大会中に対戦する確率
を n を使った式で表現せよ.
n ≥ 4 の場合,トーナメント木の形は一意ではないが,この問題の答えは,実
2
は木の形にも依存せず, である.これは本日の講義の後半で,確率論の記法を
n
使って説明する.逆にそのような記号なしで(「言葉」だけで)は,見通しよく考
えることが簡単ではない.
3
0.7
1.2
f10(x)
g10(x)
g10(x)/f10(x)
0.6
F10(x)
G10(x)
G10(x)/F10(x)
1
0.5
0.8
0.4
0.6
0.3
0.4
0.2
0.2
0.1
0
0
0
0.2
0.4
0.6
0.8
1
0
0.2
0.4
0.6
0.8
1
図 1: 確率比較.左<問 1 >,右<問 2 >
追加練習(追練)
追練1 壷に r 個の赤玉(当たり)と b 個の黒玉(はずれ)が入っている.無作為に m
個を掴んで取り出したとき(ただし,m ≤ b ,つまり全部外れる可能性がある場
合を考える),以下を計算せよ.
• m 個中に r 個の当たり全部が含まれている確率
• m 個中に少なくとも1個の当たりが含まれている確率
追練2 インフルエンザが流行しており,生徒数の1割以上が欠席したら学級閉鎖する.
個々の生徒がインフルエンザで欠席する確率は5% (0.05) とする.クラスの生徒
数 n が 10, 40, 80 の各々の場合の,学級閉鎖が起こる確率を計算せよ.手計算では
無理なのでプログラムを書いて計算する.ただし,A 君と B 君が同時に欠席する
確率は,(0.05)2 で計算できることにする.特定の3名以上が同時に欠席する確率
も同様に単なる積で計算できるとする.
2. 確率空間(参考書1.2章)
集合論の表記の復習
ある「事象」が「生起する確率」を数学的に扱い,その中の法則性を明らかに
するための数学モデルを作る.
それが起きる「確率」を定義する対象である「事象」を「集合」と考えるので,
集合論の記号を多用する.X, Y, X1 , X2 , . . . などを事象(=集合),F などを事象
の集合(集合体または集合族と呼ぶ),として,
4
• X ⊂ Y , X ∈ F,
• X ∩Y,
X ∪Y,
X c,
∞
i=1
∅,
Xi ,
∞
i=1
Xi
– 事象 X の余事象(X が起きない)を X c (complement の c),
– 事象 X, Y の積事象(両方同時に起きる)を X ∩ Y ,
– 事象 X, Y の和事象(少なくともどちらか一方が起きる)を X ∪ Y ,
• ただし,X ∩ Y = ∅ の時,X ∪ Y を X + Y と書く場合もある.
• 集合を具体的に定義するとき,{a | 要素 a が満たすべき条件 } のような書き
方をする.例えば,{x |x は実数.0 ≤ x ≤ 1} は,[0, 1] の範囲の実数の集合.
全体集合・補集合とド・モルガンの法則
これは確率論の話ではなく,集合に関する基本的で重要な性質.
• (A ∩ B)c = Ac ∪ B c ,
(A ∪ B)c = Ac ∩ B c
これを適用すると,例えば
• (A ∩ B ∩ C)c = Ac ∪ (B ∩ C)c = Ac ∪ B c ∪ C c ,
• (Ac ∪ B)c = (Ac )c ∩ B c = A ∩ B c
確率空間 (Ω, F , P )
Ω
全事象.直感的には,不可分ですべての排他的な場合をつくすような最小単
位の選択肢を全部集めた集合.本講義では,
「すべての異なる運命」と解釈す
る(「パラレルワールド」という言い方をする人も居る).統計を論じる場合
は別の解釈をするかも知れない.この要素を,基本事象,根元事象,標本,
とも呼び,その全体を標本空間とも呼ぶ.いずれにせよ「数学的定義・定理」
は「解釈」に左右されない.
以下で,1つの ω ∈ Ω は,1つの(見えない)運命に対応する.
F
Ω の部分集合のうちで「生起確率」を定義できる対象(事象),を全部集め
た集合.部分集合の集合のことを「集合体」と呼ぶ.
P
確率測度.各「事象 A」(A ⊂ Ω, A ∈ F ) に「生起確率 P (A)」という値を与
える関数.つまり,P : F → [0, 1]
5
• 我々にはどの運命 ω が選択されたかはわからず,
「事象の生起」を感知す
るだけである.そこで,
「事象」を「運命の集合」と同一視し,A という
事象が起きたならば,A の要素である運命のうちの1つが選択されてい
ると解釈する.
例えば,
「事象 A, B は起きて,事象 C は起きない」という状況では,
「A ∩
c
B ∩ C に含まれる運命のうちの1つが選択されている」.
• P (A) は「事象 A の要素である運命のどれか1つが選択される確率」と
解釈できる.これは全事象 Ω の中の事象 A の面積(比)のようなもの.
• F の満すべき性質:この3条件を満す集合体 F を σ-集合体と呼ぶ. 1. Ω ∈ F
2. Ac ∈ F
3.
∞
i=1
if A ∈ F
Ai ∈ F
if A1 , A2 , · · · ∈ F
• P の満すべき性質:A, A1 , A2 , · · · ∈ F に対して,
1. 0 ≤ P (A)
2. P (Ω) = 1
3. Ai ∩ Aj = ∅ (i = j)
⇒
P
∞
i=1
Ai =
∞
i=1
P (Ai ) (σ-加法性)
現実の確率的現象を「モデル化」するというのは,形式的には,ある確率空間
(Ω, F , P ) を定義することを意味する.この時,
• P はすべての事象 A ∈ F に対して個別に定義するわけではなく,本来の「現
象」と合致する「いくつかの基本的な事象に対する確率」やそれらの間の「関
係性」
(※以降で説明する独立性や条件付き確率)を仮定し(与え),そこか
ら出発して任意の A に対して P (A) の値を決めるのが「確率計算」.
• しかし,
「いくつかの基本的な事象に対する確率」や「事象間の関係性」に関
する仮定が不足していると,モデルが一意に定まらない.その場合,任意の
事象に対して確率計算が実行できるとは限らない.
例1 サイコロを 1 回だけ投げる時の出目
最も基本的な事象(=運命)として,ωj を出目 j に対応させ,Ω = {ω1 , . . . , ω6 } と
いう全事象を定義する.つまり,サイコロを投げる前に神様は1つの運命 ωj を選
択しており,それに従ってサイコロの目が出ると考える.
F (すべての事象の集合)を考え,個々の事象に確率を与えるには,
6
• P ({ωj }) =
1
と定義する.
6
これは,どの目も出易さは同等(確率的に平等)という仮定を意味する.
def
• A:
「奇数の目が出る」という事象は,A = {ω1 , ω3 , ω5 } とモデル化できるの
で,事象 A が起きる確率 P (A) は,以下のように「計算」できる.
P (A) = P (
{ωj }) =
j=1,3,5
j=1,3,5
P ({ωj }) =
1
1
×3 =
6
2
例2 コイン(表が1裏が0)を無限回投げ続ける時の出目系列
最も基本的な事象(=運命)として,
ω0 = (0, 0, . . .), ω1 = (1, 0, . . .), ω2 = (0, 1, 0, . . .), ω3 = (1, 1, 0, . . .), . . .
と置いて,出目系列に対応させ,Ω = {ω0 , ω1 , . . .} という全事象を定義する.無限
回投げ終わってみないと(つまり永久に)どの運命 ωj が選択されたのかは判らな
い.これは,コイン投げの無限回試行を開始する前に神様は1つの運命 ωj を選択
しており,それに従ってコインの目が次々と出る,というモデルを意味する.
• つまり,「コインを無限回投げる」全体を1つの実験とし,その全体結果が
1つの運命に従って決まる.
• 「サイコロを1回投げる」を1つの実験とし,実験を行う毎に異なる運命が
選択され,各々結果が決まる,と考えるのではない点に注意.
この対応では,ωn が,非負整数 n の 2 進表現の {0, 1} の可算列に対応しており,
n
1
def
σ(n)k = (n − k ) · k−1 と置いて,ωn = (σ(n)1 , σ(n)2 , . . .) と書ける.ここで,
2
2
• どの基本事象 ωj もその生起確率 P ({ωj }) は 0 である
とする.これは,どの基本事象も起き易さは同等(確率的に平等)という仮定に
基づく.P ({ωj }) は j によらず同じ値 ε と置け,ε > 0 だと無限個を足すと 1 を超
えてしまい, P (Ω) = 1 に矛盾するので,ε = 0 しか取りえない.
そこで,F (すべての事象の集合)を考え,個々の事象に確率を与えるには,
def
• 自然数 k = 1, 2, . . . に対して,Sk = {ωj |σ(j)k = 1}:
「k 回目に表が出る」
(他
1
の回の目は気にしない)という事象を定義し,P (Sk ) = と定義する.
2
これは,何回目の出目も,表が出るか裏が出るかは平等,という仮定を意味する.
さらに,n を自然数として,コイン投げを続ける中で,第 k1 回,第 k2 回,. . .,
第 kn 回目の試行の観測を行う場合を想定し,その n 個の観測回の並びを K =
def
(k1 , k2 , . . . , kn ),SK = {ωj |σ(j)k1 = 1, σ(j)k2 = 1, . . . , σ(j)kn = 1} と置き,
7
• 「k1 , k2 , . . . , kn 回目に表が出る」(他の回の出目は気にしない)という「事
1
象」SK に対しては,P (SK ) = n と定義する.
2
後でわかるように,これは「各回での出目は互いに独立」というモデル化である.
このような仮定の下で,
def
• A:「1 回目と 2 回目で同じ目が出る」という事象は,A0 = {ωj |σ(j)1 =
def
0, σ(j)2 = 0}, A1 = {ωj |σ(j)1 = 1, σ(j)2 = 1} と置くと,A = A0 ∪ A1 , A0 ∩
A1 = ∅ なので,確率 P (A) は,以下のように「計算」できる.
P (A) = P (A0 ∪ A1 ) = P (A0 ) + P (A1 ) =
1
1
×2=
4
2
例3 時計に目をやった時に秒針が指している値(時刻)
ただし,秒針は滑らかに動き,[0, 60) の間の実数値を指すものとする.Ω = [0, 60)
という全事象を定義し,つまり,時計を見る前に神様は1つの運命 ω を [0, 60) 内
の実数値として選択し,それに従って見た瞬間の秒針が決まると考える.前例と
同様に,
• 任意の実数 ω ∈ [0, 60) に対して,
「秒針が ω を指している確率」は 0 である
という点に注意する.なぜなら,どの値 ω も起き易さは同等(確率的に平等)で
ある.よって,確率は ω によらず同じ値 ε と仮定できる.ε > 0 だと無限個を足す
と 1 を超えてしまい, P (Ω) = 1 に矛盾するので,ε = 0 しか取りえない.
そこで,F (すべての事象の集合)を考え,個々の事象に確率を与えるには,
• [0, 60) の間の任意の「区間」や「区間の和」
(結局,長さを定義できるもの)
を「事象」と考え,その事象の起きる確率を「長さ」に比例して与えること
で自然なモデルを作ることができる:P (A) = (A の線分としての長さ)/60.
これは「[0, 60) 上の一様分布」に対応する(後日説明).また,この「区間」に基づ
く F は,[0, 60) 上の Borel 集合体と呼ばれる(後述の「測度としての確率」参照).
def
• A:
「秒針が 15 秒と 30 秒の間にある」という事象は,A = [15, 30] ⊂ [0, 60)
とモデル化し,確率 P (A) は,以下のように「計算」できる.
P (A) =
15
|A|
=
= 0.25
|Ω|
60
事象の「生起確率が 0 である」ことは「絶対に起きない」ことのモデルではな
い.裏返せば,
「確率 1」は「必ず(毎回)起きる」ことのモデルではない!
8
測度としての確率(参考)
「長さ」や「面積」の一般化を「測度」と呼び,それはまた「積分論」
(ルベー
グ積分の意味での)でもある.ここで定義したモデル(Kolmogorov らによる)に
基づく確率論は,数学的には「測度論」「積分論」という理論の応用分野である.
σ-集合体や σ-加法性は,何かの「長さ」や「面積」に関して,我々の直感と一致
する結果を出すために必要十分と考えられている条件である.
(Ω, F ) の例として,1 次元ユークリッド空間(実数)R とその上の Borel 集合体
B(R) (R 上のすべての開半区間を含む最小の σ-集合体)がある.
def
• A = {(−∞, a), (a, ∞)| − ∞ < a < ∞} (すべての開半区間)とする.
• A を含むすべての σ-集合体の共通部分は,また σ-集合体になることが示せ
る.これを,B(R) と呼ぶ.
σ-集合体や σ-加法性を考える理由:
• 最小不可分要素である「点 ω 」を基本事象 {ω} と考えて,それら個々に対して
確率を定義するだけではうまくいかない場合がある.上述の例2,例3参照.
• すべての部分集合(2Ω の要素)の各々を事象と考えて,それらに対して確率
を定義することはできない場合がある.例えば,実数区間 [0, 1] 上のすべて
の部分集合に矛盾なく自然な「長さ」を定義することはできない.
• σ-集合体や σ-加法性の仮定の下で,最も基本的な性質である「確率測度の連
続性(定理 1.1)」(後日説明)が成立する.
練習 3 の解説
• n チームのトーナメント戦による大会で,(無作為の)組み合わせ抽選会を
行う前の時点での,ある任意の2チームのペアがこの大会中に対戦する確
率は?
チームに通し番号(=一意な識別番号)1, 2, . . . , n を付ける.トーナメント木は
n 個の葉を持ち,抽選会では無作為にそこにチームを割り付ける.
ただし,トーナメント木の作り方(n の奇数・偶数やシードの有り無し等)に
よらず,総試合は (n − 1) である.各試合(トーナメント上の位置)に通し番号
n(n − 1)
(k = 1, 2, . . . , n − 1)を付ける.またチームのペア (i, j) の総数は n C2 =
2
n(n − 1)
であり,これにも通し番号(m = 1, 2, . . . ,
)を付ける.
2
• 事象 Am :
「m 番目のチームペアがこの大会中に対戦する」
(k)
• 事象 Am
:
「m 番目のチームペアが試合 k で対戦する」
9
まず,任意の試合 k に着目すると,
• 試合 k では必ずある1つのペア m(だけ)が対戦する.
(k)
(k)
(k)
つまり,A1 , A2 , . . . , An(n−1)/2 は排他的な事象である.
また,トーナメント木の葉に各チームがどう割り当てられるか未定(無作為)な
上に,各チームの強さも同じなので,
• 特定のペア m が試合 k で対戦する(試合 k まで勝ち上がる)確率が他のペ
ア m のそれと異なることはない(モデルとして不自然).
(k)
) = pk と置け(任意のペア m で),すべてのペア m の(可能性
よって,P (Am
の)確率を合わせると 1,つまり:
n(n−1)/2
m=1
(k)
P (Am
) = pk ×
n(n − 1)
= 1,
2
2
.
n(n − 1)
一方,任意の1つのペア(m 番目のペア)に着目すると,
となり,k にも依らず, pk = p =
• ペア m がもし試合 k で対戦したならば,他の試合 k で対戦することはない.
(2)
(n−1)
は排他的な事象である.よって,
つまり,A(1)
m , Am , . . . , Am
P (Am ) = P (
n−1
k=1
(k)
Am
)
=
n−1
k=1
(k)
P (Am
) = p × (n − 1) =
2
n
は,チームペア m に依らない.
注:この問題では,単純にすべての詳細(木の作り方,チームの割り当て,試合
の勝敗)の場合を数え上げてるわけではなく,もっとマクロな事象の確率として
の性質(対等な事象の発生確率は等しいはず)を利用して確率を計算している.
複合確率の公式(和の展開公式)
正確には確率論固有の話ではなく,集合上に定義された加法的な関数に成り立
つ,集合に関する性質である.
• P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
• P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (B ∩ C) − P (A ∩ C) +
P (A ∩ B ∩ C)
一般に,A1 , A2 , · · · An ∈ F に対して,以下の等式が成り立つ.
10
•
P
n
i=1
Ai
n
=
(−1)i+1
i=1
n+1
i=1
= P
n
i=1
= P
n
i=1
= P
n
i=1
Ai
Ai + P (An+1) −
Ai + P (An+1) +
n
i=1
n
+
i=1
n
(−1)i
i=1
⎛
(−1)i+1 ⎝
P⎝
1≤k1 <...<ki ≤n
⎛
P⎝
= P
i=1
⎛
P⎝
n
i=1
Ai +
i
j=1
n+1
j=1
1≤k1 <...<kn+1 =n+1
n
i
i
j=1
⎞
(Akj ∩ An+1 )⎠
⎛
P⎝
⎞
i+1
Akj ⎠
j=1
⎞
Akj ⎠ は,
P (Ak )
⎛
+(−1)n P
(Ai ∩ An+1 )
i=1
1≤k1 <...<ki <ki+1 =n+1
1≤k1 <...<ki ≤n+1
n+1
j=1
i=1
= P (An+1 ) + P
P⎝
1≤k1 <...<ki ≤n
(−1)i+1
+(−1)n
n
⎛
i=2
Ai + P (An+1) − P
(−1)i+1
k≤n
n
Akj ⎠
n+1
j=1
⎞ は,
Ai ∪ An+1 = P
= P (An+1 ) +
i
n + 1 の時の右辺
P⎝
1≤k1 <...<ki ≤n
数学的帰納法で示す.
n + 1 の時の左辺 P
⎛
⎞
Akj ⎠ +
⎞
⎛
P⎝
i
j=1
1≤k1 <...<ki =n+1
⎞⎞
Akj ⎠⎠
Akj ⎠
n−1
i=1
1≤k1 <...<ki <ki+1 =n+1
n
(−1)i
⎛
P⎝
i+1
j=1
⎞
Akj ⎠
Ak
k=1
Ai + P (An+1) +
(−1)i
i=1
1≤k1 <...<ki <ki+1 =n+1
⎛
P⎝
i+1
j=1
⎞
Akj ⎠
例題 (マッチングの問題)
n 個の異る国から男女1名ずつが来て,n 人ずつの男性グループと女性
グループを作るとする.この2つのグループから n 組の男女のペアを
「無作為」に作る時,すべてのペアで男女の国が異なる組み合わせにな
る確率 pn は?(ヒント:複合確率の公式を使う)
また,n → ∞ の場合,どういう値に近づくか?
11
j 番目の男性が自国の女性とペアになるという事象を Aj と置く.少なくとも1
つの国の男性が自国の女性とペアになる確率は,
P (A1 ∪ · · · ∪ An ) = P (A1 ) + · · · P (An ) − P (A1 ∩ A2 ) . . . + (−1)n+1 P (
n
=
(−1)j+1
j=1
n
=
P⎝
1≤k1 <k2 <···<kj ≤n
(−1)j+1 n Cj
j=1
⎛
⎛
j
j
r=1
⎞
n
j=1
Aj )
Akr ⎠
n
(n − j)!
1
(−1)j+1
=
n!
j!
j=1
⎞
(n − j)!
は,j 個の国を固定し
n!
r=1
1≤k1 <k2 <···<kj ≤n
(n Cj 通り),各々の場合に,
「それら j 個の国の男は自国の女とペアになり他の
(n − j) 個の国の男は自国以外の女とペアになる」確率が (n − j)!/n! であることか
ら従う.よって,
ただし,等式
P⎝
Akr ⎠ = n Cj
pn = P (Ac1 ∩ · · · ∩ Acn ) = 1 − P (A1 ∪ · · · ∪ An ) = 1 −
=
n
(−1)j
j=0
n
(−1)j+1
j=1
1
j!
1
1
1
1
1
= 1 − + − + · · · + (−1)n
j!
1 2! 3!
n!
n
1 k
x より,
n→∞
k!
k=0
さて,指数関数の Taylor 級数:ex = lim
lim pn = e−1 = 1/e = 0.36 . . .
n→∞
よって,n を大きくしていったとき,pn は,0.36 . . . の周りを振動しながら収束
する.つまり,n がある程度以上大きいならば,
「すべてのペアで男女の国が異なる
組み合わせになる確率 pn 」は約 0.36 で安定する.これは直感からは想像できない.
練習 1 確率測度の要件(P の満たすべき性質)だけから以下を示せ.
(i) P (Ac ) = 1 − P (A)
(ii) A ⊂ B ⇒ P (A) ≤ P (B)
(iii) P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
12