PowerPoint プレゼンテーション

前回の復習
N 個の母集団の平均が m 分散が s2 であるとする
N 個のうち n 個をサンプリングする操作を何度も繰り返す
繰り返し計算した平均
の分布は平均 m ,分散
の正規分布にしたがう
この性質を用いれば
N 個の母集団の分散 s2 があらかじめわかっているとき
ある信頼水準のもとで,n 個のサンプリングから母集団の平均を推定できる
N 個の母集団の分散 s2 がわからなければ,どうすればよいのか?
スチューデントの t
母集団の分散に対する不偏推定量は n 個のサンプルの不偏分散
前回の話の流れでは
今回は,母集団の分散 s2 の代わりに
母集団の分散 s2 を使う
n 個のサンプルの不偏分散 V を使う
基準値 z を定義する
スチューデントの t を定義する
サンプリングを繰り返し
z, t がどのように分布するか
調べる
標準正規分布
自由度 f = n - 1 の「 t 分布」
t 分布
f∞
正規分布 
f n=6
f n=3
t = 0 を中心にした左右対称の分布
自由度 f = n - 1 の値によって形が違う
f が無限大のとき,標準正規分布と一致
f が小さいほど最大値が小さく裾野が広い
-
-2
0
t
2
4
Excel には t 分布そのものを求める関数はない
Excel 関数 TINV(a,f)
自由度が f のときに次の関係を満たす tC を求める
信頼限界の設定
信頼限界を 1 - a と決める(信頼限界 95% なら a  0.0)
自由度 f
の t 分布
自由度 f の t 分布関数で
斜線の部分の面積の和が a になるように
tC を決める
(f   , a  0.0 なら tC = 2.571)
Excel の関数 TINV が使える
a
-t C
1-a
0
t
a
tC
=TINV(a,f) で,tC の値が表示される
t を何度も決め直したとき
-tC ~ +tC の範囲に入る確率が 1 - a
信頼区間の計算
t を何度も決め直したとき
-tC ~ +tC の範囲に入る確率が 1 - a
カッコの中を変形する
t 推定
母集団の分散がわからない系について
サンプル数 n のサンプリングを行い標本平均
を求めた
サンプリングを繰り返し行ったとき,
次の計算で求めた区間に母集団の平均 m が含まれる確率は 1 - a である
ここで tC の値は,自由度 f = n - 1 と a の値によって,t 分布から決まる
検定
今度は,母集団の平均について,ある仮説を立てる(無帰仮説)
「母集団の平均は m である」
ここで n 個のサンプリングを行い,標本平均
を得た
標本平均の値から判断して,無帰仮説は正しいといえるか?
母集団の分散がわからない場合について考える
仮説が正しいなら,次のように定義した t は自由度 n – 1 の t 分布にしたがう
信頼限界の設定
信頼限界を 1 - a と決める(信頼限界 95% なら a  0.0)
自由度 f
の t 分布
自由度 f の t 分布関数で
斜線の部分の面積の和が a になるように
tC を決める
(f   , a  0.0 なら tC = 2.571)
Excel の関数 TINV が使える
a
-t C
1-a
0
t
a
tC
=TINV(a,f) で,tC の値が表示される
t を何度も決め直したとき
-tC ~ +tC の範囲に入る確率が 1 - a
採択区間の計算
t を何度も決め直したとき
-tC ~ +tC の範囲に入る確率が 1 - a
棄却
採択
棄却
a
1-a
a
m-tC (V/n)1/2 m m+t C (V/n)1/2
x
カッコの中を変形する
t 検定
母集団の分散 がわからない系について
サンプル数 n のサンプリングを行い標本平均
を求めた
このとき,「母集団の平均は m である」と仮説をたてた
が次の区間に含まれていれば,仮説は 1 - a の確率で正しい
ここで tC の値は,自由度 f = n - 1 と a の値によって,t 分布から決まる
c2 分布
母集団の平均ではなく分散 s2 を推定したいときにはどうすればよいか?
n 個のサンプルの残差二乗和 S を用いて c2 を定義する
0.6
0.5
c2 を繰り返し求めると,特有の分布を示す
0.4
「c2 分布」という
f=2
0.3
c2 は必ず正で,分布は対称ではない
自由度 f = n - 1 の値によって形が違う
0.2
f=5
0.1
0.0
0
5
c
2
平均 f , 分散 f
10
15
信頼限界の設定
信頼限界を 1 - a と決める(信頼限界 95% なら a  0.0)
次のような c2A, c2B を求める
1 -a
a/2
つまり
a/2
0
0 c2
A
c2
c2
B
いいかえると c2A ~ c2B の確率が 1 - a
信頼区間の計算
c2 を何度も決め直したとき
c2A ~ c2B の範囲に入る確率が 1 - a
カッコの中を変形する
c2 推定
母集団の分散 s2 がわからない系について
サンプル数 n のサンプリングを行い残差二乗和 S を求めた
サンプリングを繰り返し行ったとき,
次の計算で求めた区間に母集団の分散 s が含まれる確率は 1 - a である
ここで c2A, c2B の値は
自由度 f = n - 1 と a の値によって
c2 分布から決まる
自由度 f の
c 2 分布
Excel の関数 CHIINV が使える
1 -p
0
p
0
c2
c2
C
=CHIINV(p,f) で,c2C の値が表示される