標本分布 正規分布の区間推定 標本分布2:正規分布の区間推定

九州大学 工学部地球環境工学科
船舶海洋システム 学
船舶海洋システム工学コース
ス
海事統計学 第9回 (担当:木村)
(担当 木村)
標本分布 正規分布の区間推定
標本分布2:正規分布の区間推定
授業の資料および演習・例題等の解答は
htt //
http://sysplan.nams.kyushu-u.ac.jp/gen/index.html
l
k
h
j /
/i d ht l
標本から正規分布の母数に関する情報を得る(1)
x1 , x2,  , xn ,  が互いに独立確率変数で、
が互いに独立確率変数で それらが全て
期待値

分散

2
の正規分布に従うとき、
x1  x2    xn
平均値 x 
の分布は
n
2
正規分布 N (  , ) になる
n
正規分布表
から読み取る
すなわち z 
x

未知の期待値μの
範囲を推定できる?
は標準正規分布 N(0,1)
N(0 1) になる
n


標準正規分布 z が -1.96
1 96 と +1.96
1 96
x


Pr

1
.
96


1
.
96
の間の値をとる確率は 95% つまり

  0.95
分散σは既知で
なければならない
ば
このままでは現実的には使えない



n



 

Pr  x  1.96
   x  1.96
  0.95
n
n

期待値μがこの範囲である可能性は 95%
正規分布表
1
0.95   0.4750
2
標本から正規分布の母数に関する情報を得る(1)
x1 , x2,  , xn ,  が互いに独立確率変数で、
が互いに独立確率変数で それらが全て
期待値

分散

2
の正規分布に従うとき、
x1  x2    xn
平均値 x 
の分布は
n
2
正規分布 N (  , ) になる
n
正規分布表
から読み取る
すなわち z 
x

未知の期待値μの
範囲を推定できる?
は標準正規分布 N(0,1)
N(0 1) になる
n


標準正規分布 z が -1.96
1 96 と +1.96
1 96
x


Pr

1
.
96


1
.
96
の間の値をとる確率は 95% つまり

  0.95
分散σは既知で
なければならない
ば
このままでは現実的には使えない



n



 

Pr  x  1.96
   x  1.96
  0.95
n
n

期待値μがこの範囲である可能性は 95%
標本から正規分布の母数に関する情報を得る(1)
x1 , x2,  , xn ,  が互いに独立確率変数で、
が互いに独立確率変数で それらが全て
期待値

分散

2
の正規分布に従うとき、
x1  x2    xn
平均値 x 
の分布は
n
2
正規分布 N (  , ) になる
n
正規分布表
から読み取る
すなわち z 
x

未知の期待値μの
範囲を推定できる?
は標準正規分布 N(0,1)
N(0 1) になる
n


標準正規分布 z が -1.96
1 96 と +1.96
1 96
x


Pr

1
.
96


1
.
96
の間の値をとる確率は 95% つまり

  0.95
標準偏差σは既知で
なければならない
ば
このままでは現実的には使えない



n



 

Pr  x  1.96
   x  1.96
  0.95
n
n

期待値μがこの範囲である可能性は 95%
標本から正規分布の母数に関する情報を得る(2)
平均値 x1  x2    xn の分布について標準化した分布
n
分散σ2は未知なので
2
n個の標本からの推定値ˆ で代用
x
t

このとき、分布
ˆ
n
自由度 n-1 の
(x) :ガンマ関数

ただし
n
n
1
2
ˆ 2 
(
x

x
)

i
n  1 i 1
はデータ数 n に依存した関数
正規分布にならない
t分布(t-distribution)
自由度 n の
t分布の確率密度関数
z
x
不偏分散
データ数 n に対して
n-1 であることに注意
に従う
 n 1
n 1


2  2
2   x 

1  
f ( x) 
n
n
n  
2
n→∞の極限では
正規分布になる
標本から正規分布の母数に関する情報を得る(2)
平均値 x1  x2    xn の分布について標準化した分布
n
分散σ2は未知なので
2
n個の標本からの推定値ˆ で代用
x
t

このとき、分布
ˆ
n
自由度 n-1 の
(x) :ガンマ関数

ただし
n
n
1
2
ˆ 2 
(
x

x
)

i
n  1 i 1
はデータ数 n に依存した関数
正規分布にならない
t分布(t-distribution)
自由度 n の
t分布の確率密度関数
z
x
不偏分散
データ数 n に対して
n-1 であることに注意
に従う
 n 1
n 1


2  2
2   x 

1  
f ( x) 
n
n
n  
2
n→∞の極限では
正規分布になる
t 分布表
自由度
(Degree of freedom)
(n-1)
【参考:ガンマ関数】

( x)   t x 1e t dt
0
(1)  1
(2)  1 (3)  2
1
   
2
x が正の整数のとき
( x)  ( x  1)!
t分布のグラフ
【参考】 ガンマ関数

( x)   t x 1e t dt
0
参考文献:ウィキペディア
【参考】 自由度1のt分布 = 「コーシー分布」
(Cauchy distribution)
正規分布
N(0,1)
1
f ( x) 
 1 x2


コーシー分布
コーシー分布の
期待値と分散
は定義できない
「中央値」のみ
定義できる
dx
1

Tan
x
2
 1
1 x
コーシー分布の
裾野は遠くまで
伸びる
コーシー分布の
コ
シ 分布の
期待値と分散
は定義できない
中心値極限定理が
成り立たない分布
【意
【意外と身近なコーシー分布】
身 な
布】
θ が( - π / 2, π / 2 )上の一様分布に従うとき,tan ( θ ) は コーシー分布 になる。
y
θ
x
【t 分布のまとめ】
標本数 n+1
自由度 n の
t分布の確率密度関数
ただし
n =1 のとき
シ 分布
コーシー分布
(x)
コーシー分布の
確率密度関数
コーシー分布の
期待値と分散
は定義できない
n→∞の極限では
極限
正規分布になる
 n 1
n 1


2  2
2   x 

1  
f ( x) 
n
n
n  
2
:ガンマ関数
1
f ( x) 
 1 x2


中心値極限定理が
成り立たない特殊な分布
標本数 n+1 が30程度までなら t分布表を利用
標本数 n+1 が40以上なら正規分布表を利用
標本から正規分布母数に関する情報を得る(まとめ)
x1 , x2,  , xn , 
同一な正規分布の独立な試行で得られた n 個のデータ
について、
n
1
2
x1  x2    xn
ˆ


( xi  x ) 2 を計算する
平均値 x 
と分散の推定値
n  1 i 1
n
平均値 x の
x

t
は、自由度n-1の
標準化を試み
ˆ
t分布に従う
分布に従う
た確率変数
n
データ数 n に対して
n-1 であることに注意
例) データ数 n =10 のとき、自由度9

t分布表より、自由度 9 の t が -2.262 と +2.262
の間の値をとる確率は 95% つまり

t分布を用いれば、母集団標準偏差σ
が不明でも母集団平均値μについて
推論
推論できる

x


P  2.262 
Pr
 2.262  0.95
ˆ


n


ˆ
ˆ 

Pr  x  2.262
   x  2.262
  0.95
10
10 

区間推定
信頼区間
もとの(未知な)正規分布における真の期待値μが
この範囲である可能性は 95% → 信頼係数
標本から正規分布母数に関する情報を得る(まとめ)
x1 , x2,  , xn , 
同一な正規分布の独立な試行で得られた n 個のデータ
について、
n
1
2
x1  x2    xn
ˆ


( xi  x ) 2 を計算する
平均値 x 
と分散の推定値
n  1 i 1
n
平均値 x の
x

t
は、自由度n-1の
標準化を試み
ˆ
t分布に従う
分布に従う
た確率変数
n
データ数 n に対して
n-1 であることに注意
例) データ数 n =10 のとき、自由度9

t分布表より、自由度 9 の t が -2.262 と +2.262
の間の値をとる確率は 95% つまり

t分布を用いれば、母集団標準偏差σ
が不明でも母集団平均値μについて
推論
推論できる

x


P  2.262 
Pr
 2.262  0.95
ˆ


n


ˆ
ˆ 

Pr  x  2.262
   x  2.262
  0.95
10
10 

区間推定
信頼区間
もとの(未知な)正規分布における真の期待値μが
この範囲である可能性は 95% → 信頼係数
正規母集団の母平均の差の分布
x1 , x2,  , xm
(2) 異なる2つの正規分布からの
サンプルの平均の差はどんな分布?
母集団X
標本平均
標本X
1 m
標本不偏分散 U 
( xi  x ) 2

m  1 i 1
y1 , y2,  , yn
標本平均
標本Y
x1  x2   , xm
m
2
x

母平均 x
母分散  2
x
y
y1  y2   , yn
n
1 n
標本不偏分散 U 
( yi  y ) 2

n  1 i 1
2
y
母集団Y
母平均  y
母分散  2
xy
標準化
の分布は、平均値  x   y
分散  2  1  1 

m

n
これを利用することにより
これを利用することにより、
このとき t は自由度 m+n-2 の t分布
正規母集団の母平均の差の分布
x1 , x2,  , xm
(2) 異なる2つの正規分布からの
サンプルの平均の差はどんな分布?
母集団X
標本平均
標本X
1 m
標本不偏分散 U 
( xi  x ) 2

m  1 i 1
y1 , y2,  , yn
標本平均
標本Y
y
y1  y2   , yn
n
1 n
標本不偏分散 U 
( yi  y ) 2

n  1 i 1
2
y
母集団Y
母平均  y
母分散  2
xy
t  x  y 
の分布は、平均値  x   y
分散  2  1  1 

m
標準化
これを利用することにより、未知数の
これを利用することにより
未知数の
集団Xの母平均と集団Yの母平均に
有意な差があるかどうかを判定できる
x1  x2   , xm
m
2
x

母平均 x
母分散  2
x

n
(m  n  2) mn
(m  1)U x2  (n  1)U y2 (m  n)


このとき t は自由度 m+n-2 の t分布
【演習問題】
2015.06.23
学籍番号
氏名
同一な正規分布の独立な試行で得られた
同
な正規分布の独立な試行で得られた n 個のデ
個のデータ
タ
x1 , x2,  , xn
について、
データ数 n = 9 のとき、もとの正規分布の期待値を信頼係数90%で区間推定せよ。
ただし データの平均を
x
分散の推定値を ̂
2
とする。
【演習問題】
学籍番号
氏名
同一な正規分布の独立な試行で得られた
同
な正規分布の独立な試行で得られた n 個のデ
個のデータ
タ
x1 , x2,  , xn
について、
データ数 n = 9 のとき、もとの正規分布の期待値を信頼係数90%で区間推定せよ。
ただし データの平均を
x
分散の推定値を ̂
2
とする。
データ数 n = 9 のとき、自由度 ?
t分布表より、自由度 8 の t が -1.860 と +1.860
の間の値をとる確率は 90% つまり


x


Pr  1.860 
 1.860  0.9
ˆ


9


ˆ
ˆ 

Pr  x  1.860
   x  1.860
  0.9
9
9

期待値 信頼区間
期待値の信頼区間
【演習問題】
学籍番号
氏名
同一な正規分布の独立な試行で得られた
同
な正規分布の独立な試行で得られた n 個のデ
個のデータ
タ
x1 , x2,  , xn , 
について、
データ数 n = 9 のとき、もとの正規分布の期待値を信頼係数90%で区間推定せよ。
ただし データの平均を
x
分散の推定値を ̂
2
とする。
データ数 n = 9 のとき、自由度 8
t分布表より、自由度 8 の t が -1.860 と +1.860
の間の値をとる確率は 90% つまり


x


Pr  1.860 
 1.860  0.9
ˆ


9


ˆ
ˆ 

Pr  x  1.860
   x  1.860
  0.9
9
9

期待値 信頼区間
期待値の信頼区間