確率・統計Ⅰ

確率・統計Ⅰ
第13回 統計学の基礎2
ここです!
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
確率論とは
確率変数、確率分布
確率変数の独立性 / 確率変数の平均
確率変数の平均(続き)、確率変数の分散
確率変数の共分散、チェビシェフの不等式
ベルヌイ試行と二項分布
二項分布(続き)、幾何分布など
二項分布の近似、ポアソン分布、正規分布
正規分布とその性質
i.i.d.の和と大数の法則
中心極限定理
統計学の基礎1(母集団と標本、確率論との関係)
統計学の基礎2(正規分布を用いた推定・検定)
統計学の基礎2
1. 正規分布を用いた推定
2. 正規分布を用いた検定
母平均の推定(母分散既知)
母平均μ, 母分散σ2 とする。
標本の大きさ n が大きい場合、
または(nが小さくても)
母集団が正規分布に従う場合
標本平均 X は正規分布に従う
N(μ, σ2 / n )
(復習)標本平均の性質
(1) E( X )   , V ( X )   n
2
(2) 母集団分布が正規分布ならば、
X も正規分布に従う 。(正規分布の性質)
(3) n が大きければ (n≧30くらい)、X は
つねに正規分布と考えてよい。(中心極限定
理)
X 
(4) (2),(3) のとき、 Z  X 
 n
標準正規分布に従う。
*
は
母平均の推定(母分散既知)
母平均μ, 母分散σ2 とする。
標本の大きさ n が大きい場合、
または(nが小さくても)
母集団が正規分布に従う場合
X 
Z
標本平均
X は正規分布に従う
は 標準正規分布
 n N(μ, σ2 / n )
に従う
母平均の推定(母分散既知)
標準正規分布で確率95%になる範囲
P(1.96 Z  1.96)  0.95
(信頼水準95%の場合)
つまり


X 
P  1.96
 1.96  0.95
/ n


よって

 

P X  1.96
   X  1.96
  0.95
n
n

X  1.96

n
   X  1.96

n
これに X の実現値
x を代入
母平均の推定(母分散既知)
(信頼水準95%の場合)
X  1.96

n
   X  1.96

n
つまり
X  1.96

n
   X  1.96

n
[例題]母平均の推定(母分散既知)
[1] 約8000世帯の収入の平均を調べた
ところ、703万円であった。
母分散σ2は判っていて、σ=410万円
とする。
このデータから、母平均μ(全世帯の
平均収入)の95%信頼区間を求めよ。
[例題]母平均の推定(母分散既知)
8000世帯の標本平均が703(万円)、
母集団の標準偏差が410(万円)だか
ら、
n  8000, X  703,   410
したがって母平均μの95%信頼区間の
上限・下限は、
[例題]母平均の推定(母分散既知)

410
 703 1.96
下限 = X  1.96
n
8000
 703  8.98  694 .0

410
 703 1.96
上限 = X  1.96
n
8000
 703  8.98  712 .0
[演習]正規分布を用いた推定
[1] あるマンモス大学の受験生の得点分布は、昨
年のデータから標準偏差4点と考えられる。この
受験生の母集団から大きさ36の標本をとったとこ
ろ、標本平均は60点であった。
全体の平均点を95%の信頼率で推定せよ。
統計学の基礎2
1. 正規分布を用いた推定
2. 正規分布を用いた検定
正規分布を用いた検定(例)
硬貨をつづけて200回投げたとき、115回表
が出た。この硬貨は正常でないといえるか。
かりに 正常
と仮定 したとき、
表の出る回数 X が
P( | X -100 | <15 ) ≧ 0.95 (たとえば)
となってしまうならば、
「仮定は疑わしい」と考える。
正規分布を用いた検定(例)
硬貨をつづけて200回投げたとき、115回表が出た。この硬貨
は正常でないといえるか。
P( |X-100|<15 ) ≧ 0.95 ?
正常、すなわち「表が出る確率 p=1/2 」 と仮定すると、
「表の出る回数 X は二項分布 B (200, 1/2) に従う 」
ことになるから、
1
P(| X  100 | 15)   P( X  r )   200 Cr  
2
r 86
r 86
114
よって
1

200 Cr  
2
r 86
114
114
200
 0.95
200
となっているかどうか
計算してみればよい。
正規分布を用いた検定(例)
硬貨をつづけて200回投げたとき、115回表が出た。この硬貨
は正常でないといえるか。
Σ200Cr (1/2)200 の計算は大変なので、正規近似を使おう。
np=200・1/2 = 100, npq = 200・1/2・1/2 = 50
だから、
X  100
X 
50
*
は、ほぼ標準正規分布に従う。
正規分布を用いた検定(例)
硬貨をつづけて200回投げたとき、115回表が出た。この硬貨
は正常でないといえるか。
X  100
X 
50
*
115 100
X  115  X 
50
*
 X  2.12
*
正規分布を用いた検定(例)
硬貨をつづけて200回投げたとき、115回表が出た。この硬貨
は正常でないといえるか。
ところが、標準正規分布では
P( | X*| < 1.96 ) = 0.95 だから、
X* = 2.12 は この範囲外。
5% の危険率で、仮定 p=1/2 は 棄却できる。
(硬貨は正常でなく、かたよりがあるといえ
る。)
検定とは
要するに検定とは
確率的背理法
仮定を棄てる基準の確率を危険率、
最初の仮定を帰無仮説という。
[例題]母平均の検定(母分散既知)
[1] ある都市で約8000世帯の収入の平
均を調べたところ、703万円であった。
母分散σ2は判っていて、σ=410万円
とする。
全国平均は695万円とする。この都
市の平均収入は全国平均と異なると
いえるか、危険率5%で検定せよ。
[例題]母平均の検定(母分散既知)
この都市の平均収入μとして、
帰無仮説 : μ=695(万円)
をたてる。
n  8000, X  703,   410
であるから、統計量 X* の実現値は、
[例題]母平均の検定(母分散既知)
703 695
X 
8

X 

 1.75
 n 410 8000 4.58
*
これは標準正規分布の95%領域の右
側点 1.96 より 小さいので、帰無仮説
「μ=695」は棄却できない。
(すなわち、この都市の平均収入μは「全国
平均695万円と異なる」とは言い切れない。)
[基礎練習題]正規母集団
[1] A君がある試験を受けて、765点で
あった。受験者全体の平均点を580点、
標準偏差を100点とするとき、次の問
いに答えよ。
(1) A君の位置は標準正規分布でどこ
になるか。
(2) A君は上位何%に位置するか。
[基礎練習題]正規母集団
[2] 平均11, 分散4 の正規母集団から
大きさ10の標本を抽出したところ、
12, 14, 14, 9, 10, 12, 11, 13, 10, 15
というデータが得られた。
標本平均のこのデータによる実現
値は、標準正規分布でどこに位置す
るか。
[基礎練習題]正規母集団
[3] あるマンモス大学の受験生の得点
の分布は、平均60点、標準偏差4点で
あった。
この受験生の母集団から大きさ36の
標本をとるとき、標本平均が 59点以
上62点以下になる確率を求めよ。
メニューに戻る
メニューへ