第2日目第2時限の学習目標

第2日目第3時限の学習目標
 点推定と区間推定について学ぶ(続き)。
(1)区間推定の公式の導き方の基本を知
る。
(2)区間推定の演習を行う。
 統計的検定の基本的な考え方について学ぶ。
(1)母平均の統計的検定の考え方を知る。
(2)帰無仮説とその採択・棄却の概念を
学ぶ。
(3)仮説検定に際しての危険率(有意水
準)の
概念を学ぶ。
信頼区間導出の概要-3(参考)
 実際、標本が得られた母集団の母分散が未知の
場合、平均μ0なる正規分布からの N 個の標本を
用いて上記の t なる量を計算すると、
 sx 
t  ( x  0 ) / 
  t
 N 1 
すなわち、t は自由度 ν=N-1 の t-分布に従うこ
とが証明できる。ここで、t-分布とは?
信頼区間導出の概要-4 (参考)
 t 分布とは、つぎのような関数から成る
分布で、f(t) は任意の t が特定の値を取
る確率を表す。また Γ はガンマ関数で
ある:
  1 
 1



2
2


t
2


f (t ) 
 1  
    
   
2
自由度 v = N-1 の t-分布の分布とは?
-正規分布に近い y 軸対称な分布
確率
斜線部
1-α
t- 分布
t
- t N-1(α/2)
t N-1(α/2)
信頼区間導出の概要-5(参考)
 上の分布の特徴からは、次式が成り立
つ:

 sx 
 
  
prob t N 1    ( x  0 ) /
  t N 1  
2
 2 
 N 1 

 1   .
この式を変形し μ0 について解くと、先ほどの
信頼区間の公式となる。すなわち、
区間推定の公式-統計的推定問題の例
sx
sx 



Pr ob x  t N 1 ( ) 
 0  x  t N 1 ( ) 

2
2
N 1
N 1 

 1    上の式は、母平均を、標本平均や標本標準偏差等を
用いて、ある区間に入る確率がどれだけ、という言
い方で推定する式であり、
 統計における基本的な2つの方法である、推定と検
定のうち、推定の問題の1つの例といえる。
演習6
 平均値の区間推定を行う。
 授業での演習のサンプル数は、10 と
する。
 (データセット1):
41,24,20,21,15,26
,19,23,40,26
(データセット2):
38,24,15,26,10,22
,14,29,37,29
演習6
区間推定の公式(再掲載)
標本
平均
標本標
準偏差
t-分布の上側
100 (α/2)
%点
sx
sx 



Pr ob x  t N 1 ( ) 
 0  x  t N 1 ( ) 

2
2
N 1
N 1 

 1  
母
平
均
演習6(計算の手順)
 (1)平均を求める。
 (2)標準偏差 sx を求める。
 (3)
s / N 1 を計算する。
x
• (4) つぎに示す t 分布表で、自由度
ν=N-1 の t 分布の5%棄却
点の値を読み取る。
• (5)区間推定の公式を用いて、母平均
の95パーセント信頼区間を求める。
演習6(自由度 ν=N-1 の t-分布の
棄却点の値 tN-1(α/2) の読み取り方)
α のこ
と
ν
p
0.9
0.8
…
0.05
1
.158
.325
…
2
.142
.289
…
∶
9
0.02
…
12.706
31.821
…
4.303
6.965
…
2.262
2.821
…
∶
.129
.261
…
∶
∶
∞
…
…
統計的検定の基本的な考え方(1)
区間推定の方法の復習ー1
 母平均の区間推定の場合には、ある母集団から
N 個の標本を手にしたとき、標本平均及び標本
標準偏差からつぎの量 t 、すなわち
 sx 
t  ( x  0 ) / 

 N 1 
を計算すると、この量 t の値が、つぎの区間に
入る確率が、
統計的検定の基本的な考え方(2)
区間推定の方法の復習ー2

 
  
prob t N 1    t  t N 1    1   .
2
 2 

となることを用いてこの式を変形し、μ0 につい
て解くと、先ほど演習した、当該標本が得られ
たもとの母集団の母平均の区間推定の公式
が導けることを学んだ。
統計的検定の基本的な考え方(3)
母平均の統計的検定(1)
 これに対して、ある母集団から N 個の標本を手
にしたとき、標本平均及び標本標準偏差からつ
ぎの量
 sx 
t  ( x  0 ) / 

 N 1 

 
   に入る確率を
t  t N 1  
が  t N 1    t , 2
 2 

考えてみよう。つまり、
自由度 v = N-1 の t-分布で、
横軸の値 t がこの図の斜線部に入る確率
裾野の両側
の斜線部の
合計が α
確
率
t- 分布
t
- t N-1(α/2)
1-α
t N-1(α/2)
統計的検定の基本的な考え方(4)
母平均の統計的検定(2)(参考)
 上の分布の特徴からは、次式が成り立つ:

 sx 
 
prob t N 1    ( x  0 ) / 
,
2
 N 1 

 sx 
  
( x  0 ) /
  t N 1     .
 2 
 N 1 
この式を変形し x について解くと、つぎのよう
になる。すなわち、
統計的検定の基本的な考え方(5)
母平均の統計的検定(3)(参考)

    sx 
prob0  t N 1    
  x,
 2   N 1 

    s x 
x  0  t N 1    
   .
 2   N  1 
 上式は、データが母平均μ0 なる母集団からの標
本ならば、標本平均が上記の範囲に入る確率は
α % である、ことを意味している。
統計的検定の基本的な考え方(6)
母平均の統計的検定(4)(参考)
 ここでの αは、検定の文脈では危険率あるいは有
意水準と呼ばれる。
 αは、通常、5% か1% が選ばれる。
 また、「データが母平均μ0 なる母集団からの標
本である」という言明は、統計的検定の文脈で
は、帰無仮説と呼ばれ、つぎのように表記され
る:
H 0 :   0
統計的検定の基本的な考え方(7)
母平均の統計的検定(5)(参考)
 ところで、危険率 α が5% の場合、データが母平
均μ0 なる母集団からの標本ならば、標本平均が
上記の範囲のような極端な値を取る可能性は、
100回のサンプリングでも5回ぐらいしかな
いことになる。
 万が一、うえの帰無仮説のもとで、このような
起こり得そうもないことが起きた場合、我々は
その帰無仮説を捨てる。これを、統計学では、
帰無仮説を棄却する、という。さもなければ、
我々は、帰無仮説を採択する。これが、検定で
ある。
統計的検定の基本的な考え方(8)
統計的検定における2種類の過誤
 統計的検定における第1種及び第2種の過誤
(1) 第1種の過誤 :
帰無仮説が正しいのに、棄却する確率
(2) 第2種の過誤 :
帰無仮説が間違っているのに、採択する確率
 2種類の過誤の関係
2種類の過誤は、一方を大きくすると他方は小
さく
なり、その逆も成り立つという二律背反の関係
にある。