統計学 西山 平均と分散の標本分布 指定した値はμ=170、σ2=102、データ数は5個で反復 カイ二乗分布 標本平均の分布 700 600 500 400 300 200 100 0 187.33 152.9773 169.9806 20.43845 0.007936 0.042042 <= 33 7. 89 18 9- 3.8 18 3. 46 データの分散の値 18 60.4 18 2- 18 0. 02 17 7.0 17 7. 59 17 3.5 9- 3. 15 17 5- 0.1 17 2- 17 0. 72 16 6.7 16 6. 28 16 3.2 8- 3. 85 最大値 最小値 平均値 分散 歪み度 尖り度 16 5- 9. 15 9.8 15 1- 6.4 15 15 2.9 8- 15 6. 41 0 頻度 900 800 700 600 500 400 300 200 100 0 標本分散の分布 25 -5 0 75 -1 00 12 515 0 17 520 0 22 525 0 27 530 0 32 535 0 37 540 0 42 545 0 47 550 0 正規分布 不偏性 最大値 最小値 平均値 分散 歪み度 尖り度 477.6252 0.448268 79.85362 3114.514 1.367639 2.805332 母分散に対して バイアスを含む 教科書:127ページ 分散の計算に二通りあり 言葉の定義どおりだと 1 2 S N X N i 1 X 2 i 母集団の分散なら 不偏分散 こちらが主となります N 1 2 2 X i X ˆ N 1 i 1 2 2 ˆ E バイアスを修正ずみ 練習問題: 推定入門<点推定> ある高校の1年からランダムに5名を選んで100メー トル走の記録をとると、 12.32、15.28、14.19、13.72、13.26 だった。 学年全体の平均値、分散はいくら位でしょう? X 13.754 S 0.964 2 Ⅰ限:イントロ済 Ⅱ限:ここから バイアスをとって推定する 点推定‐誤差は無視 分散の点推定 合計 平均 分散推定 記録(X) 12.32 15.28 14.19 13.72 13.26 68.770 13.754 偏差 -1.434 1.526 0.436 -0.034 -0.494 0.000 0.000 二乗偏差 2.056356 2.328676 0.190096 0.001156 0.244036 4.820 0.964 これはS2だか らバイアスを 含む 1.205 4.820÷(5-1) 0.964 5 4 【例題】母平均の区間推定 ある高校の1年生からランダムに5名を選ん で100メートル走の記録をとると、 12.32、15.28、14.19、13.72、13.26 だった。学年全体の平均はいくら位か誤差を 考慮してから答えなさい。 X 13.75 ˆ 2 1.205 当分は学年全体の分散と一致 していると仮定する 母平均の区間推定 ある確率 P ① Z ① X P ① ① n P X ① X ① n標準誤差 n 2 2 2 サンプル 推定には定石があります① 第4章「統計的推測」とは 割り切り! 0.95 P 2 Z 2 推定の定石② サンプルの平均値を標準値に 直すというのは Z X /n 2 解答 0.95 P 2 Z 2 本当はちょっと不正確! 最初正しければ みな正し! X P 2 2 2 /n 最大偏差 標準偏差の2倍まで わかっている値 を代入 2 2 P 2 X 2 n n 2 未知数 2 P X 2 X 2 n n 標準誤差 サンプル平均 1.205 1.205 P13.75 2 13.75 2 5 5 P12.77 14.73 本当はちょっと不正確 信頼係数を90%に落とすと 信頼係数 0.90 P1.645 Z 1.645 X P 1.645 1.645 2 n 1 . 205 1 . 205 P13.75 1.645 13.75 1.645 5 5 サンプル平均 標準誤差 推定の手順 信頼係数を決める(95%、90%、99%) まず標準値で区間をつくる 95%信頼区間なら、±2以内 90%信頼区間なら、±1.65以内 99%信頼区間なら、±2.6以内 標準値の定義式で置き換える 未知数μの区間に変形する 教科書:151~156ページ 練習問題【1】 ある高校の1年生からランダムに5名を選ん で100メートル走の記録をとると、 12.32、15.28、14.19、13.72、13.26 だった。次の解答を完成させなさい。 X 13.75 2 ˆ 1.205 練習問題【1】の解答 P1 Z 1 ・ ・ ・ X 13.75 2 ˆ 1.205 P 練習問題【1】の解答 0.68 P1 Z 1 ・ ・ ・ P 13.26 X 13.75 ˆ 2 1.205 14.24 点推定の理屈 区間推定は、 誤差をどこまで見積もるか 2 標準誤差 サンプル平均 1.645 1.205 13.75 1 5 0 幅をつけない推定法を点推定といいます 練習問題【2】 ある高校の1年生からランダムに20名を選 んで100メートル走の記録をとると、 X 13.75 2 ˆ 1.205←学年全体と一致する だった。学年全体の平均について推定し なさい。但し、信頼係数は95%とする。 練習問題【2】の解答 サンプルが増えた分、標準誤差が小さくなります 0.95 P1.96 Z 1.96 Ⅱ限 ここまで 6/25 X P 1.96 1 . 96 2 /n 2 2 P X 1.96 X 1.96 n n 1 . 205 1 . 205 P13.75 1.96 13.75 1.96 20 20 P13.27 14.23 区間推定のまとめ<95%区間> サンプル平均 標準誤差 母分散 母平均 =サンプル平均X 1.96 サンプル数n 2 ルートNの公式 母集団の分散が分らない場合は、不偏分散を求めて、代わりに使う サンプル数が10個未満なら、必ずT分布の数値表を見て、 1.96を修正しないといけない(次回予定) 【例題】○○率の推定 Ⅰ限:このイントロまで Ⅱ限:ここから 6/25 ある人気ドラマをみたかどうかを、100人の サンプルに対して質問したところ、40人の人 が「みた」と答えた。社会全体では、何%程 度の人がこのドラマを見ただろうか。 信頼係数は95%で答えてください。 知りたいのは社会全体の視聴率です 視聴率は40%だと、 いまわかったじゃないか 社会全体のことは調べてませんから、 分かりません ゼロイチ母集団の特徴 Ⅰ限 みた → 1 ここまで 6/25 みない → 0 (例)社会全体では 30%(=0.30)がみた 本当の視聴率は 母平均(μ)のこと 1の確率をpとして ―ゼロイチ母集団― 平均 分散 1 p 0 1 p p p 1 p 2 100人サンプルの視聴率は サンプル平均 0 0 1 0 X サンプルの視聴率 100 ○○率調査とは母平均の推定 推定の手順どおりに サンプル平均 40 0.40 100 標準誤差 2 n p1 p 0.40 0.60 0.049 n 100 母平均(μ)=0.40±2×0.049 95%信頼区間
© Copyright 2025 ExpyDoc