第6章 数え上げ理論と確率 B4 酒井 隆行 6.1 数え上げ 数え上げ理論は、実際に列挙することなしに、 “幾つあるか”という問に答えようとするもので ある。 例 “nビットの数は何個あるか” “n個の異なる要素の順番付けは何通りある か” などなど 和法則と積法則 • 和法則 2つの互いに素な集合の1つからの要素の選 び方の数が、集合のサイズの和に等しい。 すなわち、AとBが共通部分をもたないとき、 AB A B が成り立つ。 • 積法則 順序対の選び方の数が、最初の要素の選び 方の数と2番目の要素の選び方の数との積 に等しい。 すなわち、AとBが2つの有限集合であるとき、 A B A B が成り立つ。 文字列 有限集合Sの上での文字列とは、Sの要素の文字列で ある。たとえば、長さ3の2進数列は次の8通りある。 000, 001, 010, 011, 100, 101, 110, 111 長さkの文字列のことをk-文字列と呼ぶことがある。文 字列sの部分文字列s’とは、sの連続する要素からなる 順序列をいい、k-部分文字列とは、長さkの部分文字 列のことである。 集合Sの上でのk-部分列は、 だけ存在する。 S k 順列 有限集合Sの順列とは、Sの要素をすべて1度ずつ用いて 作った順序列をいう。たとえば、 S={a,b,c}のとき、Sの順列は次の6通りである。 abc, acb, bac, bca, cab, cba Sのk-順列とは、Sの中から重複なしにk個の要素をとって 並べた列のことである。 集合{a,b,c,d}の2-順列は以下の12通りである。 ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc n-集合のk-順列の数は、 n! n n 1n 2 n k 1 n k ! で与えられる。 組み合わせ n-集合のk-組み合わせとは、単にSのk-部分 集合のことである。4-集合{a,b,c,d}の2-組み合 わせは、以下の6通りである。 ab, ac, ad, bc, bd, cd n-集合のk-組み合わせの数は、 n! k!n k ! で与えられる。 2項係数 n k という記号(nチューズkと発音する)で、n-集合のk-組み 合わせの個数を書くことにする。 n n n! k k!n k ! n k これらの数は2項係数としても知られている。これは、 これらが2項展開の係数として現れるからである。 x y n n k n k x y k 0 k n 2項係数の上下界 • 下界 1≤k≤nのとき、次のような下界がある。 n n n 1n 2 n k 1 k k 11 k n n 1 n k 1 1 k k 1 n k k • 上界 Stirlingの公式から得られる不等式k!≥(k/e)ᵏを 用いると、下のような上界が得られる。 n n n 1 n k 1 k k 11 k nk k! en k k すべての0≤k≤nに対して帰納法を用いると次 の上界を証明することができる。 n n n k n k k k n k ただし、便宜上 0 1 0 と仮定しておく。 k=λnのとき(ただし、0≤λ≤1)、上界は次のように 書き直すことができる。 n nn n n n 1 n 1 n 1 1 1 1 2 nH ここで、 n H lg 1 lg 1 は(2進)エントロピー関数であり、便宜上、 0lg0=0と仮定しておく。 6.2 確率 確率は標本空間Sによって定義されるが、こ れは各要素が根元事象であるような集合で ある。各根元事象は試行によって起こりうる 結果とみなすことができる。 事象とは、標本空間の部分集合のことである。 事象Sは全事象と呼ばれ、事象Øは空事象と 呼ばれる。A,BがA∩B=Øを満たす事象のとき、 これらは互いに素であるという。 確率公理 標本空間Sに関する確率分布とは、Sの事象から次の 確率公理を満たす実数への写像である。 1. 任意の事象Aに対してPr{A}≥0である。 2. Pr{S}=1 3. 互いに素な任意の2つの事象Aに対して、 PrA B PrA PrB である。より一般的には、どの2つも互いに素である 任意の事象列A1 , A 2 , に対して が成り立つ。 Pr A i PrA i i i 離散確率分布 確率分布が有限の標本空間または加算無限の標本 空間上で定義されているとき、離散確率分布という。S を標本空間としたとき、任意の事象Aに対して PrA Prs sA が成り立つ。また、Sが有限ですべての根元事象sϵSが 確率分布 1 Prs S をもつとき、Sに関する一様確率分布という。 連続一様確率分布 a≤c≤d≤bであるような任意の閉区間[c,d]に対 して、連続一様確率分布は、事象[c,d]の確率 を dc Prc, d ba と定義する。 条件付き確率と独立性 • 条件付き確率 事象Bが起こるという条件の下での事象Aの 条件付き確率はPr{B}≠0のとき、次のように定 義される。 PrA B PrA | B PrB • 独立 PrA B PrAPrB または、Pr{B} ≠0のときはこれと等価な条件 PrA | B PrB が成り立つとき、事象A,Bは独立であるという。 A1, A2 ,, An を事象の集合とするとき、すべての 1≤i<j≤nに対して PrA i A j PrA i PrA j であるとき、これらの事象は対ごとに独立であるという。 この集合のすべてのk-部分集合A i1 , A i 2 ,, A i k が2≤k≤n と1 i1 i2 ik n に対して Pr A i1 A i 2 A i k Pr A i1 Pr A i 2 Pr A i k を満たすとき、これらは相互独立だという。 Bayesの定理 条件付き確率の定義より、確率が0でない2つの事象AとBに対して、次式が 成り立つ。 PrA B PrBPrA | B PrAPrB | A これをPr{A|B}に関して解くと、次式を得る。 PrA | B PrAPrB | A PrB (1) さらにPr{B}は、次のように書ける。 PrB PrB A Pr B A PrAPrB | A PrAPrB | A これを、(1)式に代入すると、 PrAPrB | A PrA | B PrAPrB | A Pr A Pr B | A 6.3 離散確率変数 離散確率変数Xとは、有限または加算無限の標 本空間Sから実数への関数である。確率変数Xと 実数xに対して、事象X=xを{sϵS:X(s)=x}と定義す る。したがって、 PrX x である。関数 Prs sS:X ( s ) x f (x) PrX x は、確率変数Xの確率密度関数である。 XとYが確率変数であるとき、関数 f x, y PrX xかつY y をXとYの結合確率密度関数という。yを定数とするとき、 PrY y PrX xかつ Y y x が成り立ち、同様に定数xに対して、 PrX x PrX xかつ Y y y が成り立つ。条件付き確率の定義を用いると、次式を 得る。 PrX xかつ Y y PrX x | Y y PrY y すべてのx,yに対して PrX xかつY y PrX xPrY y が成り立つとき、XとYは独立であると定義する。 確率変数の期待値 離散確率変数Xの期待値とは、 EX x PrX x x であり、上の和が有限か絶対収束する場合には 明確に定義される。 2つの確率変数の和の期待値は、それぞれの期 待値の和に等しい。すなわち、E[X],E[Y]が定義さ れるなら、 EX Y EX EY である。期待値をμと記すこともある。 Xを任意の確率変数とするとき、任意の関数g(x) は新たな確率変数g(X)を定義する。g(X)の期待 値が定義されるなら、 EgX gx PrX x x である。g(x)=axとして、aを任意の定数とするとき、 EaX aEX が成り立つ。したがって、期待値は線形である。 すなわち、 EaX Y aEX EY が成り立つ。 2つの確率変数X,Yが独立で、それぞれに対して 期待値が定義されているとき、次式が成り立つ。 EXY xy PrX xかつ Y y x y xy PrX xPrY y x y x PrX x y PrY y x y EX EY 一般に、n個の確率変数 X1 , X2 ,, Xn が相互独 立ならば、 EX1X2 Xn EX1 EX2 EXn である。 確率変数Xが自然数N={0,1,2,…}からの値をと るとき、 EX i PrX i i 0 iPrX i PrX i 1 i 0 PrX i i 1 分散と標準偏差 平均がE[X]である確率変数Xの分散は、次のとおりである。 2 Var X EX EX EX 2 E 2 X 確率変数Xの分散とaXの分散は次の関係がある。 Var aX a 2 Var X XとYが独立な確率変数であるとき、 VarX Y VarX VarY である。一般に、n個の確率変数X1, X2 ,, Xnが対ごとに独立であ れば、次式が成り立つ。 n n Var X i Var X i i 1 i 1 確率変数Xの標準偏差はXの分散の平方根をとったものである。標 準偏差をσと書いたりする。この記号を用いると分散は 2 と記される。 6.4 幾何分布と2項分布 確率pで起こる成功と、確率q=1-pで起こる失 敗の2通りの結果しかないBernoulli試行を例 にして、幾何分布および2項分布について考 えていく。 • 幾何分布 確率変数Xを成功を得るのに必要な試行回数とすると、 k≥1に対して、 PrX k q k1p が成り立つ。上を満たす確率分布を2項分布という。 幾何分布の期待値は、 EX kq k 1p k 1 p kq k q k 0 p q 1 p 2 q 1 q 分散は、 Var X q p 2 • 2項分布 確率変数Xをn回の試行中の成功の回数と定 義すると、 n k n k PrX k p q k が成り立つ。上の式を満たす確率分布を2項 分布という。便宜上、 n k n k bk; n, p p 1 p k という記号を用いる。 Xを2項分布b(k;n,p)に従う確率変数、Xᵢをi回 目の試行における成功回数を表す確率変数 とすると、期待値は n EX E X i i 1 n EX i i 1 n p i 1 np E Xi2 EXi p より、Xᵢの分散は Var Xi p p 2 pq であり、 n Var X Var X i i 1 n Var X i i 1 n pq i 1 npq を得る。 2項分布b(k;n,p)は、kが0からnまで変化する につれて平均値npに達するまで増加を続け、 その後減少する。連続する2項の比を取って みると、 n k n k p q k bk; n , p bk 1; n , p n k 1 n k 1 p q k 1 n 1p k 1 kq k<(n+1)pに対してはb(k;n,p)>b(k-1;n,p)が成り 立ち、k>(n+1)pに対してはb(k;n,p)<b(k-1;n,p) が成り立つ。 この分布は、k=(n+1)pが整数の場合は b(k;n,p)=b(k-1;n,p)であり、よってこの分布は、 k=(n+1)pとk-1=(n+1)p-1=np-qに二つの極大値 を持つ。そうでないときは、np-q<k<(n+1)pとい う範囲にある1つの整数値kにおいてのみ極 大値をとる。 補題6.1 n≥0とし、0<p<1,q=1-p,0≤k≤nとする。このとき、 次式が成り立つ。 k np nq bk; n, p k nk n k 証明 n nn k n k k k n k を用いると、 n k n k bk; n, p p q k k n n k nk k n k np nq k nk p k q n k n k 6.5 2項分布の両端部分 1回の成功確率をpとするn回のBernoulli試行 において、ちょうどk回成功する確率よりも、少 なくともあるいは高々k回成功する確率のほう がより興味深い場合が多い。この節では、2 項分布の両端部分について考える。 定理6.2 成功確率pであるn回のBernoulli試行 X:全成功回数を表す確率変数 このとき、0≤k≤nに対して少なくともk回成功す る確率は n PrX k bi; n, p ik n k p k である。 証明 6.1の練習問題から得られた次の不等式を利用する。 n n n k k i k i また、 n k bi; n k, p 1 i 0 であるので、 n n k ik i 0 PrX k bi; n, p bk i; n, p n k i p 1 p n k i i 0 k i n k n n k k i p 1 p n k i i 0 k i n k n k n k n k i p 1 p n k i p k i 0 i n k n k n p bi; n k, p p k k i k 系6.3 成功確率pであるn回のBernoulli試行 X:全成功回数を表す確率変数 このとき、0≤k≤nに対して高々k回成功する確率 は k PrX k bi; n, p i 0 n n k 1 p n k n n k 1 p k 定理6.4 成功確率p,失敗確率q=1-pであるn回の Bernoulli試行 X:全成功回数を表す確率変数とする。このと き、0<k<npに対してk回より少なく成功する確 率は k 1 PrX k bi; n, p i 0 kq bk; n, p np k 証明 幾何数列の級数和 k 1 bi; n, p i 0 を評価する。 i=1,2,…,kに対して、次式を得る。 bi 1; n, p iq n i 1p bi; n, p i q n i p n q n k p もし、 n q x 1 n k p ならば、0<i≤kに対して bi 1; n, p xb i; n, p が成り立つ。この操作を繰り返せば0≤i<kに対 して bi; n, p x bk; n, p ki が得られる。 よって、 k 1 k 1 i 0 i 0 k i x p , n ; i b bk; n, p bk; n , p x i i 1 x bk; n , p 1 x kq bk; n , p nq k 系6.5 成功確率pであるn回のBernoulli試行 X:全成功回数を表す確率変数 このとき、np<k<nに対してk回より多く成功す る確率は次式で与えられる。 PrX k n bi; n, p i k 1 n k p bk; n, p k np 定理6.6 i=1,2,…,nに対するi番目の試行において成功 確率がpᵢ,失敗確率がqᵢ=1- pᵢであるn回の Bernoulli試行 X:全成功回数を表す確率変数 μ=E[X]とおくと、r>μに対して次式が成り立つ。 e PrX r r r 証明 x e 任意のα>0に対して関数 はxに関して強い 意味で増加関数であるので、 X r PrX r Pre e が成り立つ。ここで、 αは後に決定される。 Markovの不等式 PrX t EX t により、 を得る。 PrX r E eX er i=1,2,…,nに対して Xᵢ:i回目のBernoulli試行が成功なら1、失敗な ら0となる確率変数 とすると、 n X Xi i 1 n X X i p i i 1 が成り立つ。 X-μを置き換え、確率変数Xᵢが相互独立ならば確 率変数 e X p は相互独立になることから、 i i E e X n Xi pi E e i 1 n E e X i pi i 1 期待値の定義から、 E e X i pi e 1 pi p i e 1 pi q i p i e q i q i e p i pi e 1 exp p i e である。 n pi i 1 であるので、 n E e X exp p i e i 1 exp e が成り立つ。よって次式を得る。 PrX r exp e r ln r と選べば次式が成り立つ。 r ln r PrX r exp e exp r r ln r ln r er r r e r r 系6.7 成功確率p,失敗確率q=1-pであるn回のBernoulli 試行 このとき、r>npに対して、 n PrX np r bk; n, p k np r npe r r 証明 2項分布に対してE[X]=npが成り立つならばμ=np である。 6.6 確率を用いた解析例 この節では3つの例を用いて確率を用いた解析 例を示す。 6.6.1 部屋にいるk人のなかで2人が同じ誕生日 である確率 6.6.2 ボールを箱に無作為に入れる場合 6.6.3 硬貨投げにおける連続して表の出る“列” 6.6.1 誕生日パラドックス 問題 部屋にいる人のうち2人が同じ日にうまれた確率が1/2を 超えるためには部屋に何人の人がいなければならない か? 準備 それぞれの人に整数1,2,…,kの番号をつける。 k:人の数 1年はn=365(簡単のため、うるう年はなし) bᵢ:i番目の人がうまれた日(i=1,2,…,k 1≤bᵢ≤n) 誕生日は1年のn日において一様に分布していると仮定 i=1,2,…,kとr=1,2,…,nに対して Prbi r 1 n が成り立つ。 2人の人間iとjが同じ誕生日である確率は、 誕生日の無作為な選択が独立であることに 依存する。もし誕生日が独立であるならば、i の誕生日とjの誕生日がある日rである確率は Prbi rかつ b j r Prbi rPrb j r 1 n2 となる。 よって、部屋にいる2人の人間の誕生日が同じ になる確率は Prb i b j Prb i rかつ b j r n r 1 n 1 n 2 r 1 1 n である。 k人のうちの少なくとも2人の誕生日が同じにな る確率は補事象を考えることにより解析できる。 K人が異なった誕生日である事象は k 1 Bk A i i 1 である。ここで、Aᵢはi+1の誕生日がすべてのj≤iに対し てjの誕生日と異なる事象である。すなわち、 A i bi 1 b j : j 1,2,..., i である。 Bk Ak1 Bk1 と書くことができるので、漸化式 PrBk PrBk1PrAk1 | Bk1 をえる。ここで、初期条件として とする。 PrB1 1 b1, b2 ,..., bk1 が異なるならばn日から選ばれない n-(k-1)日が存在するので、i=1,2,…,k-1に対して bk bi となる条件確率は(n-k+1)/nである。 先ほどの漸化式を繰り返し適用することにより、 PrBk PrB1PrA1 | B1PrA 2 | B2 PrA k 1 | Bk 1 n 1 n 2 n k 1 1 n n n 1 2 k 1 1 1 1 1 n n n を得る。 1 x ex により kk 1 2n ln 1 2 のとき次式を得る。 PrB k e 1 n e 2 n e k 1 n i n i 1 e k 1 e k k 1 2 n 1 2 k(k-1)≥2nln2のとき、k人すべての誕生日が異なる確率 が1/2以下となる。よって23人以上いれば少なくとも2 人の誕生日が同じになる確率が1/2以上となる。 6.6.2 ボールと箱 同一のボールを1,2,…,bと番号付けられたb個 の箱に無作為に入れるという過程を考える。 ボールを入れるのは独立事象で、それぞれ のボールはどの箱にも等確率で入れられる。 ボールがある特定の箱に入る確率は1/bであ る。したがって、ボールを入れる過程は成功 確率1/bのBernoulli試行の列である。 • ある特定の箱に幾つのボールが入るか? 特定の箱に入るボールの数は2項分布 b(k;n,1/b)に従う。もしn個のボールが入れら れるならば、特定の箱に入るボールの数の期 待値はn/bである。 • ある特定の箱にボールが1つ入るまでに平均 何回ボールをなげなければならないか? 箱にボールが入るまでにボールを投げ入れ る回数は確率1/bの幾何分布に従うので、成 功までボールを投げ入れる平均回数は 1/(1/b)=bである。 • すべての箱に少なくとも1個のボールが入るまで 何回ボールを投げないといけないか? 空の箱にボールが入れられると“当たり” b回当たるのに必要なボールの投げ入れ回数の 平均値nを求める。 i番目の段階をi-1回目の当たりの後からi回目の 当たりまでのボールの投げ入れと定義する。 i番目の段階におけるそれぞれのボールの投げ 入れに対して、ボールの入ったi-1の箱とb-i+1の 空の箱が存在する。よって、i番目の段階におけ るすべてのボールの投げ入れに対して当たる確 率は(b-i+1)/bである。 nᵢ: i番目の段階におけるボールの投げ入れ 回数 b回の当たりを得るために必要な投げ入れ回 数は b n ni i 1 である。それぞれの確率変数はnᵢは成功確率 (b-i+1)/bの幾何分布をもつので次式を得る。 b En i b i 1 期待値の線形性から b En E n i i 1 b En i i 1 b i 1 b b i 1 b 1 b i 1 i bln b O1 したがって、すべての箱にボールが入るまでに はおおよそblnb回の投げ入れが必要である。 6.6.3 連続硬貨投げ 公正な硬貨をn回投げるとする。連続して表が出 る最大の列はどの程度になると期待されるかを 考える。 答えは lg n まず表が連続する最大列の平均長がO(lgn)であ ることを証明する。 Aik:i回目の硬貨投げから始めてk回以上表が続 けて出る事象(1≤k≤nかつ1≤i≤n-k+1) 任意の事象 Aik に対してk回すべてが表となる確 率はp=q=1/2の幾何分布である。 PrAik 1 2k に対して k 2lg n Pr A i , 2 lg n 1 2 2 lg n 1 2 2 lg n 1 n2 である。任意の有限または加算無限の事象列について成り立つ ブールの不等式 PrA1 A2 PrA1PrA2 により、事象の和集合の確率は各事象の確率の和を超えないの で、任意の位置から始めて2 lg n 以上表が続いて起こる確率は n 2 lg n 1 n Pr A i , 2 lg n 1 n 2 i 1 i 1 1 n となる。 したがって、任意の列が 2lg n 以上の長さを もつ確率は高々1/nであるので、最大列長 2lg n より短くなる確率は少なくとも1-1/nであ る。よって平均長は 2lg n 1 1 n n1 n Olg n で上から押さえられる。 次に下界 lg n の証明を行う。 長さ lg n 2 の列を見つける。 Pr A i , lg n 2 1 2 lg n 2 1 n を得る。よって、表が lg n 2以上続く列の位置 がiで始まらない確率は高々1 1 n である。N 個の硬貨投げをそれぞれが lg n 2 回の連続 する硬貨投げからなる少なくとも2n lg n の グループに分けることができ、これらは互い に独立な硬貨投げになる。 これらのグループのそれぞれが長さ lg n 2 の表 が続く列にならない確率は 1 1 n 2 n lg n 1 1 e 2 n lg n 1 n 2 n lg n 1 n Oe lg n O1 n したがって、最大列長がlg n 2 を超える確率は 1 O1 n である。最大列長の平均値は少なくとも lg n 21 O1 n 0 1 n lg n である。
© Copyright 2024 ExpyDoc