統計学 第11回 西山 前回までのまとめ サンプルの結果から母集団の平均 信頼係数 P ① Z ① を推定する方法 X ① P ① サンプルの平均は母集団の平均を 2 n 中心にまとまる傾向 2 2 P X ① X ① サンプルの平均のばらつきを求める n n 標準誤差 のが鍵です 推定には手順がある 信頼係数を決める まず標準値で区間をつくる 95%信頼区間なら、±2以内 90%信頼区間なら、±1.65以内 標準値の定義式で置き換える 未知数μの区間に変形する 教科書:151~156ページ 区間推定のまとめ サンプル平均 サンプル誤差 母分散 2 母平均 =サンプル平均X 1.96 サンプル数 n 母集団の分散が分らない場合は、不偏分散を求めて、代わりに使う サンプル数が10個未満なら、必ずT分布の数値表を見て、 1.96を修正しないといけない。 復習クイズ ある食品会社は牛肉をちょうど1Kgビニールの袋に入れよう としている。サンプルを16袋とったところ、サンプル平均は 0.950Kgで標準偏差は0.1Kgだった。設問に回答してください。 今の母集団はどのように定義できるでしょう。 サンプル誤差の目安はいくらに評価できますか。 袋全体の平均重量(μ)を推定してください。 解答① ‐推定に二つ必要です 母平均(μ)は サンプル平均 0.950Kg 標準誤差 0.1 0.025 16 0.950 2 0.025 標準値とT値を補足します • T値≒標準値です。 • ゆえに、T値は±2以内と思って基本的にOKです (確率95%範囲) • サンプル数が少ない時はT分布の数値表で95% 範囲を確かめる方が厳密です。 平均と分散の標本分布 母集団は、μ=170、σ2=102、サンプル数は5個 標本分散の分布 標本平均の分布 700 600 500 400 300 200 100 0 最大値 最小値 平均値 分散 歪み度 尖り度 25 -5 0 75 -1 00 12 515 0 17 520 0 22 525 0 27 530 0 32 535 0 37 540 0 42 545 0 47 550 0 <= 33 7. 89 カイ二乗分布の形 3.8 9- 18 3. 46 データの分散の値 18 18 0.4 6- 18 0. 02 17 7.0 2- 18 7. 59 17 3.5 9- 17 3. 15 17 0.1 5- 17 0. 72 16 6.7 2- 17 6. 28 16 3.2 8- 16 3. 85 16 9. 15 9.8 5- 15 1- 6.4 15 15 2.9 8- 15 6. 41 0 頻度 900 800 700 600 500 400 300 200 100 0 187.33 152.9773 169.9806 20.43845 0.007936 0.042042 最大値 最小値 平均値 分散 歪み度 尖り度 477.6252 0.448268 79.85362 3114.514 1.367639 2.805332 不偏分散は 100を中心に 分布します 推定は割り切りがポイントでした サンプル5人 平均=170センチ 標準偏差=10センチ X 170 ˆ 2 5 100 サンプル数が10個未満 T分布表から95%範囲を確かめよ 教科書巻末の 数値表5を参照 サンプル数が20個以上なら 2シグマの法則を使う。標準値で±2以内! T値の95%区間、90%区間 これは自由度(n-1) 90%圏 95%圏 T値の定義 T X ˆ 2 n サンプルから求めた不偏分散を、 母集団の分散の代わりに使う Gosset, W. S. 母集団のσ2に近ければ 大したことではない データ数が十分多け ればよい 1906年にペンネームStudentでT分布の存在を発見しました 正規分布÷カイ二乗→T分布 T分布は正規分布とカイ二乗分布の 子どもです。フィッシャーが1920年 までに数学的基礎を与えました。 フィッシャーの公式 T Fisher, R.A. Z 2 k Tの値は自由度kのT分布 k 解答② ‐T分布表で厳密に 母平均(μ)は サンプル平均 0.950Kg サンプル誤差 0.1 0.025 16 0.950 2.131 0.025
© Copyright 2024 ExpyDoc