統計学 第9回 西山 第8回目のまとめ サンプルの結果から母集団の平均 信頼係数 P ① Z ① を推定する方法 X ① P ① サンプルの平均は母集団の平均を 2 n 中心にまとまる傾向 2 2 P X ① X ① サンプルの平均のばらつきを求める n n のが鍵です 再確認 前回の練習問題【1‘】 ある高校の1年生からランダムに5名を選ん で100メートル走の記録をとると、 12.32、15.28、14.19、13.72、13.26 だった。次の解答を完成させなさい。 X 13.75 ˆ 2 1.205 解答 0.68 P 1 Z 1 P13.75 ・ 1.205 ・5 13.75 ・ 1.205 5 P 13.26 X 13.75 ˆ 2 1.205 14.24 宿 題 1限目のみ 正規母集団から無作為にとった5個のデータ 171、179、164、174、170 を得た.このデータから母集団の平均値を推定しなさ い.信頼係数は95%とする. ヒント: 標本平均=171.6 不偏分散=30.3 前提 不偏分散は母集団の 分散に一致している 宿題(例題42)の解答 正規分布を使って回答する 0.95 P 1.96 Z 1.96 X P 1.96 1.96 2 n 2 2 P X 1.96 X 1.96 n n 30.3 30.3 P171.6 1.96 171.6 1.96 5 5 P166.8 176.4 教科書157ページの例題42ではT分布を利用 今日の目標 • 正規分布は使うのはまずい • T分布の使い方 • T値は標準値とほぼ同じ 教科書: T分布の定義→128頁 T値を使った推定→156頁 いままでの方法の何が問題か? 不偏分散はあくまでサンプルの結果 全体を調べて出したわけではない あてにならない 不偏分散は信用できるか!? 母集団が分散100としても <= 0 700 600 500 400 300 200 100 0 これはカイ二 乗分布の形で す 25 -5 0 75 -1 00 12 515 0 17 520 0 22 525 0 27 530 0 32 535 0 37 540 0 42 545 0 47 550 0 頻度 標本分散の分布 不偏分散の確率分布 データの分散の値 全体分散σ2 分布の中心が正しいとい うだけです 10人の結果ですから、当然、誤差が混じっています 見ているのは標準値ではない! データ値 右のボタンを押してから分布の種類と 毎回のデータ数、抽出反復回数を指 定してください。 実験開始! N(170,102) 176.47 170 Z 1.45 100 5 1回目 2回目 3回目 4回目 5回目 母集団は データ1 データ2 データ3 データ4 データ5 標本平均 173.68 175.80 162.41 172.88 170.54 171.06 166.14 167.60 173.54 156.80 176.06 168.03 174.63 174.21 179.96 165.47 162.86 171.43 168.56 178.42 156.45 166.28 183.43 170.63 185.21 185.46 174.02 159.31 178.34 176.47 Z 176.47 170 100 5 1.45 T 176.47 170 1.35 115.29 5 分散不偏 推定 26.93 56.14 49.90 112.18 115.29 T値 0.46 -0.59 0.45 0.13 1.35 それは正規分布ではない X 0.90 P 1.645 Z 1.645 P 1.645 1.645 2 ˆ / n 不偏分散には誤差がある 正しい標準化ではない! 標準化のように見えて T値と呼んでいま す 正規分布の変数 その平均値 カイ二乗分布の変数/ データ数 実は、この値の確率法則が分かっています。ステューデントのT分布! T値の発見 T X ˆ 2 n Gosset, W. S. サンプルから求めた不偏分散を、母集団の分散 の代わりに使う 1906年にペンネームStudentでT分布の存在を発見しました 正規分布÷カイ二乗→T分布 T分布は正規分布とカイ二乗分布の 子どもです。フィッシャーが1920年 までに数学的基礎を与えました。 Fisher, R.A. T Z 2 k Tの値は自由度kのT分布 k たとえて言えば 2個のサイコロを振って出た目を 割り算する 6、2 1個目のサイコロの目 2個目のサイコロの目 6 4.25 2 この値の確率分布はわかりますか? 『 T分布』のポイント T値の標本分布 1200 1000 データ:5個 800 平均値 分散 標準偏差 最大値 最小値 600 400 200 0 ~ 1 2 ~ 3 4 ~ 5 6 ~ 7 8 ~ 9 -1 ~ -3 2 ~ -5 4 ~ 6 ~ -7 0 8 頻度 R.A.Fisher T値 0.0166 1.9796 1.4070 9.2665 -7.5530 正規分布に似ています 平均はゼロ 分散は1より相当大きい! 2シグマ、3シグマの法則は通 じない.極端な値になりやすい. N-1が鍵になること.自由度. となると、T値の数値表がいる 90%圏95%圏 これは自由度 例題 正規母集団から無作為にとった5個のデータ 171、179、164、174、170 を得た.このデータから母集団の平均値を推定しなさ い.信頼係数は95%とする. ヒント: 標本平均=171.6 不偏分散=30.3 前提 不偏分散は母集団の 分散に一致している 例題の解答 T分布を使って回答する: 自由度=データ数-1 0.95 P 2.776 T 2.776 自由度=4 X 2.776 P 2.776 2 ˆ n 2 2 ˆ ˆ X 2.776 P X 2.776 n n 30.3 30.3 171.6 2.776 P171.6 2.776 5 5 P164.8 178.4 データ数が10個以下のときはT分布を必ず使うべし 練習問題【1】 ある大学の学生を対象に10名をランダムにと り身長のデータをとると結果は X 167.2 ˆ 2 10 2 100 全学生の平均はいくら位か90%信頼区間を 求めなさい. データ数が10個以下のときはT分布を必ず使うべし 【1】の解答―はじめが大事です 0.90 0.90 自由度=10-1 P 1.833 T 1.833T値を使うときは自由度 P -① T ① がいくらになるかが鍵! X P 1.833 1.833 2 X ˆ / n P-① ① 2 ˆ 2 ˆ 2 ˆ X 1.833 P X 1.833 n n n あとはデータの結果を 代入して同じように・ ・・ 100 100 P167.2 1.833 167.2 1.833 10 10 P161.4 173.0 練習問題【2】 宿題(Ⅱ限目のみ) ある高校の1年に在学する生徒から無作為に9名を選んで 100メートル走の記録をとると以下のようになった。測定単 位は秒である。 12.32, 15.28, 14.19, 13.72, 13.26 14.08, 14.06, 11.82, 12.80 学年全体の平均タイムを信頼係数95%で推定しなさい。 X ˆ 2 13.50 1.14
© Copyright 2024 ExpyDoc