二項分布とベルヌーイ分布

2014 年 6 月 6 日
基礎統計
区間推定と仮説検定
分布に従うとする。
練習問題
仮説検定(符号が反対の場合、片側検定
解答:母集団は,模擬試験の得点分布
Step 1)標本の大きさを N,分布の期待値  , 分散
p.117 参照)
 2 とすると、 X の分布は N (  ,  2 / N)
ある学園の期末試験の成績分布は平均 164 点であ
った。生徒のうちから random に 16 人を選び、徹
step 2)標準化を行う。 ( X   ) /  2 / N ~ N (0,1)
夜で勉強させたところ、標本平均は 161 点、不偏
分散は 36 であった。徹夜勉強は害があるか。得点
Step 3)  2 は未知なのでこれを不偏分散 s 2 で置き
分布は正規分布とし、学習法により分散は異ならな
換 え る と 、 自 由 度 N-1 の t 分 布 に な る 。
いとする。有意水準は 5%用いよ
t=( X   ) / s 2 / N ~ t ( N  1) 、 数 表 よ り 自 由 度
N-1=25-1=24 の両側 5%点は 2.064
解答:母集団は徹夜をおこなった場合の得点分布。
Step 1)標本の大きさを N,分布の期待値  , 分散
 2 とすると、 X の分布は N (  ,  2 / N)
Step 4) 具 体 的 な 数 値 N=16, X    60  50 ,
s 2 / N  100 / 25  2 より t 
step 2)標準化を行う。 ( X   ) /  2 / N ~ N (0,1)
50  60
 5 となり、
2
Step 3)  2 は未知なのでこれを不偏分散 s 2 で置き
tの絶対値 5 は自由度 25-1=24 のt分布の両側
換 え る と 、 自 由 度 N-1 の t 分 布 に な る 。
5%点 2.064 より大きく、有意水準 5%で仮説(模
擬試験の平均得点は入試の平均得点と一致する。)
t=( X   ) / s 2 / N ~ t ( N  1) 、 数 表 よ り 自 由 度
は棄却される。したがっても模擬試験は入試より難
N-1=16-1=15 の上側 5%点は 1.753
しい。
( も し も 模 試 の 標 本 平 均 が 58 点 で あ る と
Step 4) 具 体 的 な 数 値 N = 1 6 , X    6 ,
s 2 / N  36 / 16  1.5 より
t=(58-60)/2=-1)と、有意水準 5%では仮説は棄
161  164
 2 となり、t
1.5
却できず、模試と入試の得点の平均の得点差はは認
められない。
の絶対値 2 は自由度 15 のt分布に上側 5%点1.
753より大きく、有意水準 5%で仮説(徹夜は影
ベルヌーイ分布と二項分布
響がないか、むしろ有益である)は棄却される。し
番組**は全世帯の p の割合で視聴されている。
たがって、徹夜は害があると認められる。
N=600 で調査を行っている。i 番目に抽出した家庭が
( も し も 標 本 平 均 が 163 点 で あ る と
視聴していたら Xi=1、その番組を視聴していないと
t=1/1.5=0.666)と、有意水準 5%では仮説は棄
Xi=0 とする。すると、(X1+…+Xn)/n は視聴率
却できず、悪影響の証拠とは認められない。
二項分布は定義は P.176
両側検定(p.229 参照)の練習問題
X1,…,Xn が独立で
某学習塾がおこなう模擬試験は本番の入試試験と同じ得
P(Xi=1)=p
点分布を持つよう計画している。受験生 25 人を random
P(Xi=0)=1-p
に選び、模擬試験をうけさせたところ、標本平均 50 点、
X1+…+Xn の値の分布を二項分布という。
不偏分散 100 であった。本番の入学試験は平均点が 60
n=1 のときをベルヌーイ分布という。
であることがわかっているとき、模擬試験の得点分布の
E(Xi)= p×1+ (1-p)×0=p
期待値は入試試験の期待値と異なるといってよいか。
V(Xi)= p×(1-p)2+ (1-p)×(0-p)2
とは異なっていると判断できる。ただし、成績は正規
=p(1-p)
1
E(X1+…+ Xn-1)=np
V(X1+…+ Xn-1)=np(1-p)
p.202
ラプラスの定理
Step 1)n が大きい時、二項分布は正規分布に近
づく。したがって 、 X ~ N ( p, p(1  p ) / N) と考えて
良い。
Step 2
標準化を行い。近似式が成立すると考え
る。
Xp
~ N (0,1)
p(1  p ) / N
Step 3

P  1.96 




Xp
 1.96 

p(1  p ) / N

 P X  1.96 p(1  p ) / N  p  X  1.96 p(1  p ) / N

ここで標準誤差 p (1  p ) / N の中の p が未知なので、
標本平均 X でおきかえた
X  1.96 X (1  X ) / N  p  X  1.96 X (1  X ) / N
を信頼係数 95%の信頼区間とする。
不偏分散が不偏であることの証明。p.224
2クラス X、Y の平均点は同一かどうか。クラスサイ
ズは n X , nY
各クラスの i の生徒の得点は
X i ~ N (  X ,  2 ), Yi ~ N ( Y ,  2 ) とし、いずれも互いに独立
とする。すると
X ~ N (  X ,  2 / n X ), Y ~ N ( Y ,  2 / n y )
X  Y ~ N (  X  Y ,  2 / n X   2 / n y )
そこで未知の  2 を
s2 
(x1  x) 2  ...  (x n X  x) 2  ( y1  y ) 2  ...  ( ynY  y ) 2
n X  1  nY  1
により推定する。注意:
2