Document

統計基礎(第6回)
大数の法則と中心極限定理
早稲田大学大学院商学研究科
2015年5月20日
大塚忠義
1
Agenda
第6回 大数の法則と中心極限定理
• ベルヌーイ試行
• 大数の法則
• 中心極限定理
• 正規分布の活用
2
ベルヌーイ試行(1)
統計上、算術平均は極めて重要
1
X  ( X1 
n
 Xn)
は観測平均または観測確率と呼
ばれ
ベルヌーイ試行と確率論上重要な二つの
法則に基づき、真の確率を導くために使用
される
3
ベルヌーイ試行(2)
本校の学生の1年間に交通事故の発生率
(p)を知りたい
事故にあった人:1、合わなかった人:0
事故の発生は互いに独立と仮定
事故にあう確率はpは未知
Sn  X1   X n は交通事故の実際の発
生者数で確率変数である
S n は2項分布に従うと想定できる
4
ベルヌーイ試行(3)
B(n, p)より、平均はnp
Xも
の関数なので、確率変数である
E ( Sn )  np
E( X )  p
は実際の調査で得られた値であり、そ
の平均は、発生確率となる
5
大数の法則(1)
大数の法則:観測平均 と真の平均(確
率)pの関係を示したもの
lim P( X  p  c)  0
n 
観測平均と真の平均の乖離が任意の常
数cより大きくなる確率は、観測数が無限
大になれば、ゼロに収束する
真の平均は母平均といい、一般的には
μで表すが、確率を示すためpとしている
6
大数の法則(2)
偶然発生の事象は観測数が多くなるほど
実際の結果が真の結果に近づく
(実際の結果÷観測数)は発生確率に近
づく
大標本で観測された平均は母集団の真の
平均(母平均)とみなしてよい
未知の母平均を知るためにはどの程度の
標本数、モデルを作成すればよいか?
7
大数の法則(3)
正確なコイントスイング(確率は0.5)
すべて表の確率は
1回:0.5
10回:0.00098
0.5の10乗
50回: 0.00000000000000089
0.5の50乗
大数の法則(4)
正確なコイントス(確率は0.5)
ちょうど半分表が出る確率は
10回投げて表が5回:0.25
100回投げて表が50回:0.080,49回:
0.079,48回:0.073,47回:0.067・・
47-53回表が出る確率:0.518
中心極限定理(1)
大数の法則より一般化された理論
近代統計学の基盤をなす定理
母集団分布が何であれ、母平均、母分散
が存在すれば Sn  X1   X n の確率
分布はnが十分に大きいとき、概ね正規
分布に従う
二項分布の場合 Sn : B(n, p) : N (np, npq)
pq
X : N ( p, )
n
中心極限定理(2)
厳密に表すとnを無限大にすると次のよう
になる
b
S n  n
1
lim P(a 
 b)  
e
a
n 
n
2
x2

2
dx
正規分布の活用
ある集団について「XX以上の人数」「上
位YY番目になる点数」という問いに答え
るために正規分布(正規分布表、エクセ
ル関数)を活用することができる
ただし、データが独立あること その確率
分布が正規分布に従うと仮定できること
が条件
設問
商学部の学生1000人に対し数学の試験
を行った。その結果は平均点:65点、標
準偏差:12点であった
1)50点から70点までの成績の人は何人
くらいいると考えられますか
2)80点以上の人は何人くらいいると考え
られますか
3)上位50番目以内に入るためには何点
以上取ればよいですか
Question?
お疲れ様でした
14