九州大学 工学部地球環境工学科 船舶海洋システム 学 船舶海洋システム工学コース ス 海事統計学 第9回 (担当:木村) (担当 木村) 標本分布 正規分布の区間推定 標本分布2:正規分布の区間推定 授業の資料および演習・例題等の解答は htt // http://sysplan.nams.kyushu-u.ac.jp/gen/index.html l k h j / /i d ht l 標本から正規分布の母数に関する情報を得る(1) x1 , x2, , xn , が互いに独立確率変数で、 が互いに独立確率変数で それらが全て 期待値 分散 2 の正規分布に従うとき、 x1 x2 xn 平均値 x の分布は n 2 正規分布 N ( , ) になる n 正規分布表 から読み取る すなわち z x 未知の期待値μの 範囲を推定できる? は標準正規分布 N(0,1) N(0 1) になる n 標準正規分布 z が -1.96 1 96 と +1.96 1 96 x Pr 1 . 96 1 . 96 の間の値をとる確率は 95% つまり 0.95 分散σは既知で なければならない ば このままでは現実的には使えない n Pr x 1.96 x 1.96 0.95 n n 期待値μがこの範囲である可能性は 95% 正規分布表 1 0.95 0.4750 2 標本から正規分布の母数に関する情報を得る(1) x1 , x2, , xn , が互いに独立確率変数で、 が互いに独立確率変数で それらが全て 期待値 分散 2 の正規分布に従うとき、 x1 x2 xn 平均値 x の分布は n 2 正規分布 N ( , ) になる n 正規分布表 から読み取る すなわち z x 未知の期待値μの 範囲を推定できる? は標準正規分布 N(0,1) N(0 1) になる n 標準正規分布 z が -1.96 1 96 と +1.96 1 96 x Pr 1 . 96 1 . 96 の間の値をとる確率は 95% つまり 0.95 分散σは既知で なければならない ば このままでは現実的には使えない n Pr x 1.96 x 1.96 0.95 n n 期待値μがこの範囲である可能性は 95% 標本から正規分布の母数に関する情報を得る(1) x1 , x2, , xn , が互いに独立確率変数で、 が互いに独立確率変数で それらが全て 期待値 分散 2 の正規分布に従うとき、 x1 x2 xn 平均値 x の分布は n 2 正規分布 N ( , ) になる n 正規分布表 から読み取る すなわち z x 未知の期待値μの 範囲を推定できる? は標準正規分布 N(0,1) N(0 1) になる n 標準正規分布 z が -1.96 1 96 と +1.96 1 96 x Pr 1 . 96 1 . 96 の間の値をとる確率は 95% つまり 0.95 標準偏差σは既知で なければならない ば このままでは現実的には使えない n Pr x 1.96 x 1.96 0.95 n n 期待値μがこの範囲である可能性は 95% 標本から正規分布の母数に関する情報を得る(2) 平均値 x1 x2 xn の分布について標準化した分布 n 分散σ2は未知なので 2 n個の標本からの推定値ˆ で代用 x t このとき、分布 ˆ n 自由度 n-1 の (x) :ガンマ関数 ただし n n 1 2 ˆ 2 ( x x ) i n 1 i 1 はデータ数 n に依存した関数 正規分布にならない t分布(t-distribution) 自由度 n の t分布の確率密度関数 z x 不偏分散 データ数 n に対して n-1 であることに注意 に従う n 1 n 1 2 2 2 x 1 f ( x) n n n 2 n→∞の極限では 正規分布になる 標本から正規分布の母数に関する情報を得る(2) 平均値 x1 x2 xn の分布について標準化した分布 n 分散σ2は未知なので 2 n個の標本からの推定値ˆ で代用 x t このとき、分布 ˆ n 自由度 n-1 の (x) :ガンマ関数 ただし n n 1 2 ˆ 2 ( x x ) i n 1 i 1 はデータ数 n に依存した関数 正規分布にならない t分布(t-distribution) 自由度 n の t分布の確率密度関数 z x 不偏分散 データ数 n に対して n-1 であることに注意 に従う n 1 n 1 2 2 2 x 1 f ( x) n n n 2 n→∞の極限では 正規分布になる t 分布表 自由度 (Degree of freedom) (n-1) 【参考:ガンマ関数】 ( x) t x 1e t dt 0 (1) 1 (2) 1 (3) 2 1 2 x が正の整数のとき ( x) ( x 1)! t分布のグラフ 【参考】 ガンマ関数 ( x) t x 1e t dt 0 参考文献:ウィキペディア 【参考】 自由度1のt分布 = 「コーシー分布」 (Cauchy distribution) 正規分布 N(0,1) 1 f ( x) 1 x2 コーシー分布 コーシー分布の 期待値と分散 は定義できない 「中央値」のみ 定義できる dx 1 Tan x 2 1 1 x コーシー分布の 裾野は遠くまで 伸びる コーシー分布の コ シ 分布の 期待値と分散 は定義できない 中心値極限定理が 成り立たない分布 【意 【意外と身近なコーシー分布】 身 な 布】 θ が( - π / 2, π / 2 )上の一様分布に従うとき,tan ( θ ) は コーシー分布 になる。 y θ x 【t 分布のまとめ】 標本数 n+1 自由度 n の t分布の確率密度関数 ただし n =1 のとき シ 分布 コーシー分布 (x) コーシー分布の 確率密度関数 コーシー分布の 期待値と分散 は定義できない n→∞の極限では 極限 正規分布になる n 1 n 1 2 2 2 x 1 f ( x) n n n 2 :ガンマ関数 1 f ( x) 1 x2 中心値極限定理が 成り立たない特殊な分布 標本数 n+1 が30程度までなら t分布表を利用 標本数 n+1 が40以上なら正規分布表を利用 標本から正規分布母数に関する情報を得る(まとめ) x1 , x2, , xn , 同一な正規分布の独立な試行で得られた n 個のデータ について、 n 1 2 x1 x2 xn ˆ ( xi x ) 2 を計算する 平均値 x と分散の推定値 n 1 i 1 n 平均値 x の x t は、自由度n-1の 標準化を試み ˆ t分布に従う 分布に従う た確率変数 n データ数 n に対して n-1 であることに注意 例) データ数 n =10 のとき、自由度9 t分布表より、自由度 9 の t が -2.262 と +2.262 の間の値をとる確率は 95% つまり t分布を用いれば、母集団標準偏差σ が不明でも母集団平均値μについて 推論 推論できる x P 2.262 Pr 2.262 0.95 ˆ n ˆ ˆ Pr x 2.262 x 2.262 0.95 10 10 区間推定 信頼区間 もとの(未知な)正規分布における真の期待値μが この範囲である可能性は 95% → 信頼係数 標本から正規分布母数に関する情報を得る(まとめ) x1 , x2, , xn , 同一な正規分布の独立な試行で得られた n 個のデータ について、 n 1 2 x1 x2 xn ˆ ( xi x ) 2 を計算する 平均値 x と分散の推定値 n 1 i 1 n 平均値 x の x t は、自由度n-1の 標準化を試み ˆ t分布に従う 分布に従う た確率変数 n データ数 n に対して n-1 であることに注意 例) データ数 n =10 のとき、自由度9 t分布表より、自由度 9 の t が -2.262 と +2.262 の間の値をとる確率は 95% つまり t分布を用いれば、母集団標準偏差σ が不明でも母集団平均値μについて 推論 推論できる x P 2.262 Pr 2.262 0.95 ˆ n ˆ ˆ Pr x 2.262 x 2.262 0.95 10 10 区間推定 信頼区間 もとの(未知な)正規分布における真の期待値μが この範囲である可能性は 95% → 信頼係数 正規母集団の母平均の差の分布 x1 , x2, , xm (2) 異なる2つの正規分布からの サンプルの平均の差はどんな分布? 母集団X 標本平均 標本X 1 m 標本不偏分散 U ( xi x ) 2 m 1 i 1 y1 , y2, , yn 標本平均 標本Y x1 x2 , xm m 2 x 母平均 x 母分散 2 x y y1 y2 , yn n 1 n 標本不偏分散 U ( yi y ) 2 n 1 i 1 2 y 母集団Y 母平均 y 母分散 2 xy 標準化 の分布は、平均値 x y 分散 2 1 1 m n これを利用することにより これを利用することにより、 このとき t は自由度 m+n-2 の t分布 正規母集団の母平均の差の分布 x1 , x2, , xm (2) 異なる2つの正規分布からの サンプルの平均の差はどんな分布? 母集団X 標本平均 標本X 1 m 標本不偏分散 U ( xi x ) 2 m 1 i 1 y1 , y2, , yn 標本平均 標本Y y y1 y2 , yn n 1 n 標本不偏分散 U ( yi y ) 2 n 1 i 1 2 y 母集団Y 母平均 y 母分散 2 xy t x y の分布は、平均値 x y 分散 2 1 1 m 標準化 これを利用することにより、未知数の これを利用することにより 未知数の 集団Xの母平均と集団Yの母平均に 有意な差があるかどうかを判定できる x1 x2 , xm m 2 x 母平均 x 母分散 2 x n (m n 2) mn (m 1)U x2 (n 1)U y2 (m n) このとき t は自由度 m+n-2 の t分布 【演習問題】 2015.06.23 学籍番号 氏名 同一な正規分布の独立な試行で得られた 同 な正規分布の独立な試行で得られた n 個のデ 個のデータ タ x1 , x2, , xn について、 データ数 n = 9 のとき、もとの正規分布の期待値を信頼係数90%で区間推定せよ。 ただし データの平均を x 分散の推定値を ̂ 2 とする。 【演習問題】 学籍番号 氏名 同一な正規分布の独立な試行で得られた 同 な正規分布の独立な試行で得られた n 個のデ 個のデータ タ x1 , x2, , xn について、 データ数 n = 9 のとき、もとの正規分布の期待値を信頼係数90%で区間推定せよ。 ただし データの平均を x 分散の推定値を ̂ 2 とする。 データ数 n = 9 のとき、自由度 ? t分布表より、自由度 8 の t が -1.860 と +1.860 の間の値をとる確率は 90% つまり x Pr 1.860 1.860 0.9 ˆ 9 ˆ ˆ Pr x 1.860 x 1.860 0.9 9 9 期待値 信頼区間 期待値の信頼区間 【演習問題】 学籍番号 氏名 同一な正規分布の独立な試行で得られた 同 な正規分布の独立な試行で得られた n 個のデ 個のデータ タ x1 , x2, , xn , について、 データ数 n = 9 のとき、もとの正規分布の期待値を信頼係数90%で区間推定せよ。 ただし データの平均を x 分散の推定値を ̂ 2 とする。 データ数 n = 9 のとき、自由度 8 t分布表より、自由度 8 の t が -1.860 と +1.860 の間の値をとる確率は 90% つまり x Pr 1.860 1.860 0.9 ˆ 9 ˆ ˆ Pr x 1.860 x 1.860 0.9 9 9 期待値 信頼区間 期待値の信頼区間
© Copyright 2024 ExpyDoc