第 13 回 大数の法則と中心極限定理 村澤 康友 2015 年 6 月 15 日 目次 1 標本平均 1 2 大数の法則 2 2.1 確率変数の収束 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.2 大数の弱法則 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 中心極限定理 3 3 3.1 確率分布の収束 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3.2 中心極限定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.3 正規乱数の生成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1 標本平均 {Xi } を確率変数列とする. 定義 1. (X1 , . . . , Xn ) の標本平均は X̄n := X1 + · · · + Xn n 注 1. 確率変数の平均(期待値)とは異なる. 定理 1. X1 , . . . , Xn が平均 µ の同一な分布をもつなら ( ) E X̄n = µ 証明. 期待値の線形性より ( ) X1 + · · · + Xn n E(X1 ) + · · · + E(Xn ) = n µ + ··· + µ = n =µ ( ) E X̄n = E 1 定理 2. X1 , . . . , Xn が分散 σ 2 の独立かつ同一な分布をもつなら ( ) σ2 var X̄n = n 証明. X1 , . . . , Xn は独立なので ) X1 + · · · + Xn n var(X1 + · · · + Xn ) n2 var(X1 ) + · · · + var(Xn ) n2 2 σ + · · · + σ2 n2 2 σ n ( ) var X̄n = var = = = = ( 2 大数の法則 2.1 確率変数の収束 {Xn } を確率変数列とする. 定義 2. 任意の ϵ > 0 について lim Pr[|Xn − c| < ϵ] = 1 n→∞ なら {Xn } は c に確率収束するという. p 注 2. plimn→∞ Xn = c または Xn −→ c と書く. 注 3. 確率変数の収束の概念は他にもいろいろある. 2.2 大数の弱法則 定理 3 (チェビシェフの大数の弱法則). {Xi } が平均 µ,分散 σ 2 の独立かつ同一な分布をもつなら plim X̄n = µ n→∞ 証明. チェビシェフの不等式より,任意の ϵ > 0 について ( ) ] var X̄n [ ( ) Pr X̄n − E X̄n ≥ ϵ ≤ ϵ2 すなわち [ ] σ 2 /n Pr X̄n − µ ≥ ϵ ≤ 2 ϵ 2 1.0 0.8 0.6 0.0 0.2 0.4 x 0 50 100 150 200 Index 図1 余事象の確率は n → ∞ の極限をとると n 回のコイントスにおける表の割合 [ ] σ 2 /n Pr X̄n − µ < ϵ > 1 − 2 ϵ [ ] lim Pr X̄n − µ < ϵ ≥ 1 n→∞ 確率は 1 以下なので等号が成立. 例 1. コインを 10 回,100 回,1000 回と投げ続けると表の出る割合は 1/2 に近づく(図 1). 3 中心極限定理 3.1 確率分布の収束 {Xn } に対応する cdf の列を {Fn (.)} とする. 定義 3. F (.) の任意の連続点 x で lim Fn (x) = F (x) n→∞ なら {Xn } は F (.) に分布(法則)収束するという. d 注 4. Xn −→ F (.) と書く. 3 3.2 中心極限定理 定理 4 (リンドバーグ=レヴィの中心極限定理). {Xi } が平均 µ,分散 σ 2 の独立かつ同一な分布をもつなら 1 ∑ Xi − µ d √ −→ N(0, 1) σ n i=1 n 証明. 左辺を Y とする.すなわち 1 ∑ Zi Y := √ n i=1 n ただし Zi := Xi − µ σ Z1 , . . . , Zn は独立なので,Y の mgf は,任意の t について ( ) MY (t) := E etY ( ( )) n t ∑ Zi = E exp √ n i=1 ( n ( )) ∏ t exp √ Zi =E n i=1 ( ( )) n ∏ t = E exp √ Zi n i=1 ( )n t = MZ √ n MZ′ (0) = 0,MZ′′ (0) = 1 なので,マクローリン展開より ( MZ t √ n ) t M ′′ (0) = MZ (0) + MZ′ (0) √ + Z 2 n t2 =1+ + ··· 2n ( t √ n )2 したがって ( lim MZ n→∞ t √ n )n ( = lim n→∞ = et 2 t2 + ··· 1+ 2n /2 これは N(0, 1) の mgf. 注 5. 定理を書き換えると X̄n − µ d √ −→ N(0, 1) σ 2 /n 定義 4. n が大きいときの Xn の近似分布を漸近分布という. 4 )n + ··· n = 10 n = 100 2 4 6 8 Frequency 50 0 50 0 0 0.5 1.0 1.5 x 2.0 注 6. 中心極限定理より 指数乱数の標本平均の分布 ( ) σ2 X̄n ∼ N µ, n a a ただし ∼ は近似分布を表す. 例 2. 指数乱数の標本平均の分布(図 2). 3.3 正規乱数の生成 {Ui } を [0, 1] 上の一様乱数の列とすると 1 2 1 var(Ui ) = 12 E(Ui ) = X := U1 + · · · + U12 − 6 とすると E(X) = 0 var(X) = 1 また中心極限定理より 2.5 x 図2 100 150 200 150 100 Frequency 500 300 0 100 Frequency 200 250 n=1 a X ∼ N(0, 1) これを利用して一様乱数から標準正規乱数が生成できる(図 3). 5 0.6 0.8 1.0 x 1.2 1.0 0.8 0.6 pnorm(x) 0.0 0.2 0.4 0.6 0.4 0.2 0.0 Fn(x) 0.8 1.0 ecdf(x) −4 −2 0 2 4 −4 x 図3 −2 0 x 標準正規乱数の累積相対度数グラフと N(0, 1) の cdf 6 2 4
© Copyright 2024 ExpyDoc