前回の復習 N 個の母集団の平均が m 分散が s2 であるとする N 個のうち n 個をサンプリングする操作を何度も繰り返す 繰り返し計算した平均 の分布は平均 m ,分散 の正規分布にしたがう この性質を用いれば N 個の母集団の分散 s2 があらかじめわかっているとき ある信頼水準のもとで,n 個のサンプリングから母集団の平均を推定できる N 個の母集団の分散 s2 がわからなければ,どうすればよいのか? スチューデントの t 母集団の分散に対する不偏推定量は n 個のサンプルの不偏分散 前回の話の流れでは 今回は,母集団の分散 s2 の代わりに 母集団の分散 s2 を使う n 個のサンプルの不偏分散 V を使う 基準値 z を定義する スチューデントの t を定義する サンプリングを繰り返し z, t がどのように分布するか 調べる 標準正規分布 自由度 f = n - 1 の「 t 分布」 t 分布 f∞ 正規分布 f n=6 f n=3 t = 0 を中心にした左右対称の分布 自由度 f = n - 1 の値によって形が違う f が無限大のとき,標準正規分布と一致 f が小さいほど最大値が小さく裾野が広い - -2 0 t 2 4 Excel には t 分布そのものを求める関数はない Excel 関数 TINV(a,f) 自由度が f のときに次の関係を満たす tC を求める 信頼限界の設定 信頼限界を 1 - a と決める(信頼限界 95% なら a 0.0) 自由度 f の t 分布 自由度 f の t 分布関数で 斜線の部分の面積の和が a になるように tC を決める (f , a 0.0 なら tC = 2.571) Excel の関数 TINV が使える a -t C 1-a 0 t a tC =TINV(a,f) で,tC の値が表示される t を何度も決め直したとき -tC ~ +tC の範囲に入る確率が 1 - a 信頼区間の計算 t を何度も決め直したとき -tC ~ +tC の範囲に入る確率が 1 - a カッコの中を変形する t 推定 母集団の分散がわからない系について サンプル数 n のサンプリングを行い標本平均 を求めた サンプリングを繰り返し行ったとき, 次の計算で求めた区間に母集団の平均 m が含まれる確率は 1 - a である ここで tC の値は,自由度 f = n - 1 と a の値によって,t 分布から決まる 検定 今度は,母集団の平均について,ある仮説を立てる(無帰仮説) 「母集団の平均は m である」 ここで n 個のサンプリングを行い,標本平均 を得た 標本平均の値から判断して,無帰仮説は正しいといえるか? 母集団の分散がわからない場合について考える 仮説が正しいなら,次のように定義した t は自由度 n – 1 の t 分布にしたがう 信頼限界の設定 信頼限界を 1 - a と決める(信頼限界 95% なら a 0.0) 自由度 f の t 分布 自由度 f の t 分布関数で 斜線の部分の面積の和が a になるように tC を決める (f , a 0.0 なら tC = 2.571) Excel の関数 TINV が使える a -t C 1-a 0 t a tC =TINV(a,f) で,tC の値が表示される t を何度も決め直したとき -tC ~ +tC の範囲に入る確率が 1 - a 採択区間の計算 t を何度も決め直したとき -tC ~ +tC の範囲に入る確率が 1 - a 棄却 採択 棄却 a 1-a a m-tC (V/n)1/2 m m+t C (V/n)1/2 x カッコの中を変形する t 検定 母集団の分散 がわからない系について サンプル数 n のサンプリングを行い標本平均 を求めた このとき,「母集団の平均は m である」と仮説をたてた が次の区間に含まれていれば,仮説は 1 - a の確率で正しい ここで tC の値は,自由度 f = n - 1 と a の値によって,t 分布から決まる c2 分布 母集団の平均ではなく分散 s2 を推定したいときにはどうすればよいか? n 個のサンプルの残差二乗和 S を用いて c2 を定義する 0.6 0.5 c2 を繰り返し求めると,特有の分布を示す 0.4 「c2 分布」という f=2 0.3 c2 は必ず正で,分布は対称ではない 自由度 f = n - 1 の値によって形が違う 0.2 f=5 0.1 0.0 0 5 c 2 平均 f , 分散 f 10 15 信頼限界の設定 信頼限界を 1 - a と決める(信頼限界 95% なら a 0.0) 次のような c2A, c2B を求める 1 -a a/2 つまり a/2 0 0 c2 A c2 c2 B いいかえると c2A ~ c2B の確率が 1 - a 信頼区間の計算 c2 を何度も決め直したとき c2A ~ c2B の範囲に入る確率が 1 - a カッコの中を変形する c2 推定 母集団の分散 s2 がわからない系について サンプル数 n のサンプリングを行い残差二乗和 S を求めた サンプリングを繰り返し行ったとき, 次の計算で求めた区間に母集団の分散 s が含まれる確率は 1 - a である ここで c2A, c2B の値は 自由度 f = n - 1 と a の値によって c2 分布から決まる 自由度 f の c 2 分布 Excel の関数 CHIINV が使える 1 -p 0 p 0 c2 c2 C =CHIINV(p,f) で,c2C の値が表示される
© Copyright 2024 ExpyDoc