モジュール1のまとめ

数理統計学
第17回
西 山
前回までのポイント
母平均(μ)の区間推定
標準誤差が決め手。元の母集団の分
散σ2はわからない。不偏推定を母分
散のつもりで使う。
正規分布の性質から標準値で割り切
る。
95%信頼区間ならZが±2以内
今日のポイント
 不偏分散にもサンプル誤差がある
 正規分布が正しく当てはまるわけではない
 ステューデントのT分布を使う
 T分布は正規分布とカイ二乗分布の子供で
ある
サンプルから求めた不偏分散を、
母集団の分散の代わりに使う
T値の定義
T
X 
ˆ
2
n
Gosset, W. S.
母集団のσ2に近ければ
大したことではない
データ数が十分多け
ればよい
1906年にペンネームStudentでT分布の存在を発見しました
T値は標準値とは違います!
データ値
母集団は
N(170,10 )
右のボタンを押してから分布の種類と
毎回のデータ数、抽出反復回数を指
2
定してください。
176.47  170
 1.45
データ1
100 データ2
173.68
175.80
5
Z
1回目
2回目
3回目
4回目
5回目
T
166.14
174.63
168.56
185.21
167.60
174.21
178.42
185.46
176.47  170
 1.35
115.29
5
サンプルは
実験開始!
5人
データ3 データ4 データ5 標本平均
162.41
172.88
170.54
171.06
173.54
156.80
176.06
168.03
179.96
165.47
162.86
171.43
156.45
166.28
183.43
170.63
174.02
159.31
178.34
176.47
Z
176.47  170
100
5
分散不偏
推定
26.93
56.14
49.90
112.18
115.29
 1.45
T値
0.46
-0.59
0.45
0.13
1.35
平均と分散の標本分布
指定した値はμ=170、σ2=102、データ数は5個で反復
カイ二乗
分布
正規分布
標本分散の分布
標本平均の分布
187.33
152.9773
169.9806
20.43845
0.007936
0.042042
<=
33
7.
89
18
9-
3.8
18
3.
46
データの分散の値
18
18
0.4
6-
0.
02
18
2-
7.0
17
9-
17
7.
59
17
3.5
17
3.
15
17
0.1
5-
0.
72
17
2-
6.7
16
8-
16
6.
28
16
3.2
16
3.
85
15
9.8
5-
9.
41
15
6.
1-
15
6.4
815
2.9
15
最大値
最小値
平均値
分散
歪み度
尖り度
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
700
600
500
400
300
200
100
0
0
頻度
900
800
700
600
500
400
300
200
100
0
最大値
最小値
平均値
分散
歪み度
尖り度
477.6252
0.448268
79.85362
3114.514
1.367639
2.805332
正規分布÷カイ二乗→T分布
T分布は正規分布とカイ二乗分布の
子どもです。フィッシャーが1920年
までに数学的基礎を与えました。
フィッシャーの公式
T
Fisher, R.A.
Z

2
k
Tの値は自由度kのT分布
k
T値のイメージ
標準値(正規分布)
0.5
0.5
 0.45
5
4
カイ二乗値(自由度4)
5
自由度は4
シグマハットを使った標準値はT値です
①
②
X 

2

Zとなって N (0,1)
n
 Xi  X 






i 1 

n
2

 n21
②
①
はT値になるはず
n 1
Fisherの公式
T分布の特徴 ±2以内とはいえない
5個のサンプル=自由度4
T値の標本分布
平均値
分散
標準偏差
最大値
最小値
1200
1000
600
400
200
T値
9
8
~
7
6
~
5
4
~
3
2
~
1
0
~
-1
~
-3
2
~
-5
4
~
6
~
-7
0
8
頻度
800
0.0166
1.9796
1.4070
9.2665
-7.5530
T値の95%区間、90%区間
これは自由度(n-1)
90%圏 95%圏
授業は
ここまで
例題【1】
ある高校の1年生からランダムに5名を選ん
で50メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の平均を推定しなさい.信
頼係数は95%とする。
X  13.75
ˆ  1.205
2
しばらくの間、不偏分散が学年
全体の分散に一致していると、
前提します
ヒント: まず下の形で答えて下さい
0.95  P -①  T  ① 




X 


 P-① 
 ①
2
ˆ



n


2
2 

ˆ
ˆ



 P X  ① 
   X  ①


n
n


自由度は、データ数-1
例題【1】の解答
0.95  P-2.776  T  2.776 ←違いはここだけ




X 


 P-2.776 
 2.776
2
ˆ



n



1.205
1.205 

 P13.75  2.776
   13.75  2.776

5
5


自由度は、5ー1=4