PowerPoint プレゼンテーション

不偏推定量
N 個の母集団の平均が m 分散が V であるとする
N 個のうち n 個をサンプリングして m と V を予想したい
平均
標本分散
不偏分散
自由度
n 個のデータのうちいくつが変わりうるか?
平均の計算では n 個すべてが,別の値をとりうる
分散の計算では,あらかじめ平均がわかっている必要がある
x1 ~ xn-1 が決まれば xn は自動的に決まってしまう
自由度は n-1 である
不偏分散は偏差二乗和を自由度で割ったものである
点推定と区間推定
点推定
区間推定
信頼区間
n 個のサンプリングを繰り返し信頼区間を何度も決めたとき
繰り返し決めた信頼区間の中に真の平均 m が含まれる確率が
1 - a (例えば 95%)になるように X を決める
信頼限界 1 - a (例えば 95%)
信頼区間を決める統計的根拠は?
標本平均の分布と基準値 z
母集団の分散 V = s2 は,あらかじめ正確にわかっているとする
母集団の平均 m はわからない
中心極限定理
n 個のサンプルの平均
は,平均 m ,分散 s2/n の正規分布にしたがう
分散の平均と平均の分散を混同しないこと
z は,平均 0 ,分散 1 の標準正規分布にしたがう
0
z
信頼限界の設定
信頼限界を 1 - a と決める(信頼限界 95% なら a = 0.05)
標準正規分布の関数で
斜線の部分の面積の和が a になるように
zC を決める
(a = 0.05 なら zC = 1.960 となる)
Excel の関数 NORMSINV が使える
a
-z C
1-a
0
z
a
=NORMSINV(P) で,P に 1-(a) を入れれば
zC の値が表示される
zC
z を何度も決め直したとき
-zC ~ +zC の範囲に入る確率が 1 - a
信頼区間の計算
z を何度も決め直したとき
-zC ~ +zC の範囲に入る確率が 1 - a
カッコの中を変形する
z 推定
母集団の分散 s2 が正確にわかっている系について
サンプル数 n のサンプリングを行い標本平均
を求めた
サンプリングを繰り返し行ったとき,
次の計算で求めた区間に母集団の平均 m が含まれる確率は 1 - a である
ここで zC の値は,a の値によって,標準正規分布から決まる
検定
今度は,母集団の平均について,ある仮説を立てる(無帰仮説)
「母集団の平均は m である」
ここで n 個のサンプリングを行い,標本平均
を得た
標本平均の値から判断して,無帰仮説は正しいといえるか?
母集団の分散 s2 が正確にわかっている場合について考える
仮説が正しいなら,次のように定義した z は標準正規分布にしたがう
信頼限界の設定
信頼限界を 1 - a と決める(信頼限界 95% なら a = 0.05)
標準正規分布の関数で
斜線の部分の面積の和が a になるように
zC を決める
(a = 0.05 なら zC = 1.960 となる)
Excel の関数 NORMSINV が使える
a
-z C
1-a
0
z
a
=NORMSINV(P) で,P に 1-(a) を入れれば
zC の値が表示される
zC
z を何度も決め直したとき
-zC ~ +zC の範囲に入る確率が 1 - a
採択区間の計算
z を何度も決め直したとき
-zC ~ +zC の範囲に入る確率が 1 - a
棄却
採択
棄却
a
1-a
a
m-zC (s2 /n)1/2
m
x
m+zC (s2 /n)1/2
カッコの中を変形する
z 検定
母集団の分散 s2 が正確にわかっている系について
サンプル数 n のサンプリングを行い標本平均
を求めた
このとき,「母集団の平均は m である」と仮説をたてた
が次の区間に含まれていれば,仮説は 1 - a の確率で正しい
ここで zC の値は,a の値によって,標準正規分布から決まる