モジュール1のまとめ

統計学
第11回
西山
前回までのまとめ
サンプルの結果から母集団の平均
信頼係数
 P ①  Z  ①
を推定する方法


X


① 


P

①
サンプルの平均は母集団の平均を
2



n


中心にまとまる傾向 2
2



 P X  ① 
   X  ①
サンプルの平均のばらつきを求める

n
n
標準誤差

のが鍵です




推定には手順がある
信頼係数を決める
まず標準値で区間をつくる
 95%信頼区間なら、±2以内
 90%信頼区間なら、±1.65以内
標準値の定義式で置き換える
未知数μの区間に変形する
教科書:151~156ページ
区間推定のまとめ
サンプル平均
サンプル誤差
 
母分散  2
母平均 =サンプル平均X   1.96
サンプル数 n 
母集団の分散が分らない場合は、不偏分散を求めて、代わりに使う
サンプル数が10個未満なら、必ずT分布の数値表を見て、
1.96を修正しないといけない。
復習クイズ
ある食品会社は牛肉をちょうど1Kgビニールの袋に入れよう
としている。サンプルを16袋とったところ、サンプル平均は
0.950Kgで標準偏差は0.1Kgだった。設問に回答してください。
今の母集団はどのように定義できるでしょう。
サンプル誤差の目安はいくらに評価できますか。
袋全体の平均重量(μ)を推定してください。
解答① ‐推定に二つ必要です
母平均(μ)は
サンプル平均
0.950Kg
標準誤差
0.1
 0.025
16
0.950  2  0.025
標準値とT値を補足します
• T値≒標準値です。
• ゆえに、T値は±2以内と思って基本的にOKです
(確率95%範囲)
• サンプル数が少ない時はT分布の数値表で95%
範囲を確かめる方が厳密です。
平均と分散の標本分布
母集団は、μ=170、σ2=102、サンプル数は5個
標本分散の分布
標本平均の分布
700
600
500
400
300
200
100
0
最大値
最小値
平均値
分散
歪み度
尖り度
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
<=
33
7.
89
カイ二乗分布の形
3.8
9-
18
3.
46
データの分散の値
18
18
0.4
6-
18
0.
02
17
7.0
2-
18
7.
59
17
3.5
9-
17
3.
15
17
0.1
5-
17
0.
72
16
6.7
2-
17
6.
28
16
3.2
8-
16
3.
85
16
9.
15
9.8
5-
15
1-
6.4
15
15
2.9
8-
15
6.
41
0
頻度
900
800
700
600
500
400
300
200
100
0
187.33
152.9773
169.9806
20.43845
0.007936
0.042042
最大値
最小値
平均値
分散
歪み度
尖り度
477.6252
0.448268
79.85362
3114.514
1.367639
2.805332
不偏分散は
100を中心に
分布します
推定は割り切りがポイントでした
サンプル5人
平均=170センチ
標準偏差=10センチ
X  170
ˆ 2 5
100
サンプル数が10個未満
T分布表から95%範囲を確かめよ
教科書巻末の
数値表5を参照
サンプル数が20個以上なら
2シグマの法則を使う。標準値で±2以内!
T値の95%区間、90%区間
これは自由度(n-1)
90%圏 95%圏
T値の定義
T
X 
ˆ
2
n
サンプルから求めた不偏分散を、
母集団の分散の代わりに使う
Gosset, W. S.
母集団のσ2に近ければ
大したことではない
データ数が十分多け
ればよい
1906年にペンネームStudentでT分布の存在を発見しました
正規分布÷カイ二乗→T分布
T分布は正規分布とカイ二乗分布の
子どもです。フィッシャーが1920年
までに数学的基礎を与えました。
フィッシャーの公式
T
Fisher, R.A.
Z

2
k
Tの値は自由度kのT分布
k
解答② ‐T分布表で厳密に
母平均(μ)は
サンプル平均
0.950Kg
サンプル誤差
0.1
 0.025
16
0.950  2.131  0.025