モジュール1のまとめ

統計学
第9回
西山
第8回目のまとめ
サンプルの結果から母集団の平均
信頼係数
 P ①  Z  ①
を推定する方法


X


① 


P

①
サンプルの平均は母集団の平均を
2



n


中心にまとまる傾向 2
2



 P X  ① 
   X  ①
サンプルの平均のばらつきを求める

n
n

のが鍵です




再確認
前回の練習問題【1‘】
ある高校の1年生からランダムに5名を選ん
で100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。次の解答を完成させなさい。
X  13.75
ˆ 2  1.205
解答
0.68
 P 1  Z  1

 P13.75 

・
1.205
・5    13.75 
・
1.205 

5 
 P    
13.26
X  13.75
ˆ 2  1.205
14.24
宿 題
1限目のみ
正規母集団から無作為にとった5個のデータ
171、179、164、174、170
を得た.このデータから母集団の平均値を推定しなさ
い.信頼係数は95%とする.
ヒント:
標本平均=171.6
不偏分散=30.3
前提
不偏分散は母集団の
分散に一致している
宿題(例題42)の解答
正規分布を使って回答する
0.95  P 1.96  Z  1.96


X


 P  1.96 
 1.96
2



n


2
2 




 P X  1.96
   X  1.96


n
n



30.3
30.3 

 P171.6  1.96
   171.6  1.96

5
5


 P166.8    176.4
教科書157ページの例題42ではT分布を利用
今日の目標
• 正規分布は使うのはまずい
• T分布の使い方
• T値は標準値とほぼ同じ
教科書:
T分布の定義→128頁
T値を使った推定→156頁
いままでの方法の何が問題か?
不偏分散はあくまでサンプルの結果
全体を調べて出したわけではない
あてにならない
不偏分散は信用できるか!?
母集団が分散100としても
<=
0
700
600
500
400
300
200
100
0
これはカイ二
乗分布の形で
す
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
頻度
標本分散の分布
不偏分散の確率分布
データの分散の値
全体分散σ2
分布の中心が正しいとい
うだけです
10人の結果ですから、当然、誤差が混じっています
見ているのは標準値ではない!
データ値
右のボタンを押してから分布の種類と
毎回のデータ数、抽出反復回数を指
定してください。
実験開始!
N(170,102)
176.47  170
Z
 1.45
100
5
1回目
2回目
3回目
4回目
5回目
母集団は
データ1 データ2 データ3 データ4 データ5 標本平均
173.68
175.80
162.41
172.88
170.54
171.06
166.14
167.60
173.54
156.80
176.06
168.03
174.63
174.21
179.96
165.47
162.86
171.43
168.56
178.42
156.45
166.28
183.43
170.63
185.21
185.46
174.02
159.31
178.34
176.47
Z
176.47  170
100
5
 1.45
T
176.47  170
 1.35
115.29
5
分散不偏
推定
26.93
56.14
49.90
112.18
115.29
T値
0.46
-0.59
0.45
0.13
1.35
それは正規分布ではない


X


0.90  P 1.645  Z  1.645  P  1.645 
 1.645
2
ˆ / n


不偏分散には誤差がある
正しい標準化ではない!
標準化のように見えて
T値と呼んでいま
す
正規分布の変数 その平均値
カイ二乗分布の変数/ データ数
実は、この値の確率法則が分かっています。ステューデントのT分布!
T値の発見
T
X 
ˆ
2
n
Gosset, W. S.
サンプルから求めた不偏分散を、母集団の分散
の代わりに使う
1906年にペンネームStudentでT分布の存在を発見しました
正規分布÷カイ二乗→T分布
T分布は正規分布とカイ二乗分布の
子どもです。フィッシャーが1920年
までに数学的基礎を与えました。
Fisher, R.A.
T
Z

2
k
Tの値は自由度kのT分布
k
たとえて言えば
2個のサイコロを振って出た目を
割り算する
6、2
1個目のサイコロの目
2個目のサイコロの目
6

 4.25
2
この値の確率分布はわかりますか?
『 T分布』のポイント
T値の標本分布
1200
1000
データ:5個
800
平均値
分散
標準偏差
最大値
最小値
600
400
200
0
~
1
2
~
3
4
~
5
6
~
7
8
~
9
-1
~
-3
2
~
-5
4
~
6
~
-7
0
8
頻度
R.A.Fisher
T値
0.0166
1.9796
1.4070
9.2665
-7.5530
正規分布に似ています
平均はゼロ
分散は1より相当大きい!
2シグマ、3シグマの法則は通
じない.極端な値になりやすい.
N-1が鍵になること.自由度.
となると、T値の数値表がいる
90%圏95%圏
これは自由度
例題
正規母集団から無作為にとった5個のデータ
171、179、164、174、170
を得た.このデータから母集団の平均値を推定しなさ
い.信頼係数は95%とする.
ヒント:
標本平均=171.6
不偏分散=30.3
前提
不偏分散は母集団の
分散に一致している
例題の解答
T分布を使って回答する: 自由度=データ数-1
0.95  P 2.776  T  2.776
自由度=4


X 

 2.776
 P  2.776 
2


ˆ
n



2 
2

ˆ
ˆ



   X  2.776
 P X  2.776

n 
n


30.3 
30.3

   171.6  2.776
 P171.6  2.776
5 
5

 P164.8    178.4
データ数が10個以下のときはT分布を必ず使うべし
練習問題【1】
ある大学の学生を対象に10名をランダムにと
り身長のデータをとると結果は
X  167.2
ˆ 2  10 2  100
全学生の平均はいくら位か90%信頼区間を
求めなさい.
データ数が10個以下のときはT分布を必ず使うべし
【1】の解答―はじめが大事です
0.90
0.90
自由度=10-1
 P 1.833  T  1.833T値を使うときは自由度
 P -①  T  ① 
がいくらになるかが鍵!


X



 P 1.833 
 1.833

2
X 
ˆ / n 


 P-① 
 ①
2 

ˆ 2 ˆ 2 
ˆ


   X  1.833 
 P X  1.833 

n n 


n


 あとはデータの結果を 代入して同じように・
・・

100
100 

 P167.2  1.833 
   167.2  1.833 

10
10


 P161.4    173.0
練習問題【2】
宿題(Ⅱ限目のみ)
ある高校の1年に在学する生徒から無作為に9名を選んで
100メートル走の記録をとると以下のようになった。測定単
位は秒である。
12.32, 15.28, 14.19, 13.72, 13.26
14.08, 14.06, 11.82, 12.80
学年全体の平均タイムを信頼係数95%で推定しなさい。
X
ˆ 2
 13.50
 1.14