統計学 第9回 西 山 第8回目のポイント 標本分散S2は元の母分散σ2に比べて小 さくなる傾向がある(下方バイアス). 不偏分散≒母集団の分散 1 2 X i X ˆ N 1 i 1 N 2 シグマハット 教科書: 127頁、3‐15式 今日のポイント サンプル平均の確率法則を復習します。 第4章へ進みます。推定入門。 第3章のT分布については、後で戻ります。 例題【1】合計値に関する問題 旅客機利用客の体重は、全体として平均55Kg、標準 偏差10Kgで正規分布していると言われる。では、定 員400人が満席の時の旅客総ウェイトの最大値をいく らと見込むとよいか? これは平均値の 確率法則を利用 する問題 総ウェイト= 400 (400人の平均体重 ) 無作為データ = サイコロの目 全体を母集団 集めたデータをサンプル と呼びます 今回の標本分布 母集団 どんな400人が 多いか 【1】の解答―実験結果 コンピューター実験で解答しましょう・・・母平均=55、母 分散=102、サンプル数=400人に設定してから、1000 回反復してサンプル平均を確認 標本平均の分布 250 200 150 100 50 53 .53 -5 3. 53 .83 83 -5 4. 54 .14 14 -5 4. 54 .44 44 -5 4. 54 .75 75 -5 5.0 55 5 .05 -5 5. 55 .35 35 -5 5. 55 .66 66 -5 5. 55 .96 96 -5 6. 56 .26 26 -5 6.5 7 0 最大値 最小値 平均値 分散 56.56709 53.53117 55.00031 0.256368 理論的な解答―母集団の確認から 55 10 2 2 正規分布の 3シグマの法則 400人がサンプル E X 55 100 V X 0.25 400 SDX 0.5 平均56.5Kgを 超えないはず! 練習問題【1】 あるビルに設置されているエレベーターの定員は11名 であり、最大積載量は750Kgと明示されている。定員一 杯のとき、平均68.2Kgだと「乗れない!」ということにな る。このエレベーターの安全性について、統計上の観点 にたって、考えるところを自由に述べなさい。 但し、上の エレベータに乗るかもしれない人たち(=母集団)の体重 分布は、N(55,225)としておく。 簡単のため11人満員の時の状況だけを考える 例題【2】:0‐1データの平均値 社会全体で視聴率が30%である人気ドラマ がある。100世帯(=100台)のTVを無作為 に選んで、視聴率調査をする場合、結果とし て得られる数字は、どんな範囲におさまるだ ろうか。 例題2は スキップするかも しれません 例題【2】の解答・・・① 30人はみて、70人は見ていないと回答するサ みた=1、みない=0 0、1データの合計= (標本)視聴率 1の数 データの合計 X 100 サンプル平均の確率法則を使え 0‐1母集団と0‐1サンプル 0、1サンプルの母集団は? 視聴率は母平均μのこと 母集団の特徴 EX 0.3 V X 0.3 0.7 0.21 2 例題【1】の理論的な解答 母集団の分布 0.3 0.21 2 E X 0.30 100人 0.21 V X 0.0021 n 100 SDX 0.0021 0.046 2 反復実験してみると 100個の0‐1データの平均値は? 3000回データ抽出を反復しました. 最大値: 0.45 最小値: 0.15 平均: 0.3002 分散: 2.037346e-03 標準偏差: 0.0451 サンプル誤差 この反復結果が理論通りか、前のスライドを 確認しておいてください 【例題】推定への入門 ある高校の1年生からランダムに5名を選ん で100メートル走の記録をとると、 12.32、15.28、14.19、13.72、13.26 だった。学年全体の平均はいくら位か範囲を 示して答えなさい。 X 13.75 ˆ 2 1.205 当分は元の母分散と一致 していると仮定する 【例題】の解答? 学年の平均値は13.75です。 いま調べました。 学年全体は、調べてないので、わかりません。 推定には定石があります① 統計的推測とは割り切り術 0.95 P 2 Z 2 推定の定石② サンプルの平均値を標準値に 直すというのは Z X /n 2 【例題】の 解答 0.95 P 2 Z 2 本当はちょっと不正確! 最初正しければ みな正し! X P 2 2 2 /n わかっている値 を代入 2 2 P 2 X 2 n n 2 未知数 2 P X 2 X 2 n n サンプル誤差 1.205 1.205 P13.75 2 13.75 2 5 5 P12.77 14.73 本当はちょっと不正確 信頼係数を90%に落とすと 信頼係数 0.90 P 1.645 Z 1.645 X P 1.645 1.645 2 n 1.205 1.205 P13.75 1.645 13.75 1.645 5 5 サンプル平均 標準誤差
© Copyright 2024 ExpyDoc