モジュール1のまとめ

数理統計学
第16回
西 山
最近のポイント
標本分散S2は母集団の分散σ2に比
べて小さくなる傾向がある.
不偏分散=σ2の近似値として使う
1 N
2
X i  X 
ˆ 

N  1 i 1
2
区間推定は2シグマ区間の応用です
今日の目標
• 区間推定を完全理解する
• 不偏分散はサンプルの結果にすぎない
• T値の意味と使い方。
復習問題
ある中学校の1年からランダムに20名を選
んで100メートル走の記録をとると、
X  13.75
ˆ 2  1.205
だった。学年全体の平均について推定し
なさい。但し、信頼係数は95%とする。
復習問題の解答
0.95
 P 1.96  Z  1.96


X 
 P  1.96 
 1.96
2

/n


2
2 




 P X  1.96
   X  1.96


n
n



1.205
1.205 

 P13.75  1.96
   13.75  1.96

20
20


 P13.27    14.23
(再掲)5人のデータだったなら
0.68
 P 1  Z  1
・
・
・
13.26    14.24 
 P X  13.75
ˆ 2  1.205
練習問題【1】
ある大学の学生を対象に10名をランダムにとり身
長のデータをとると結果は
X  167.2
ˆ 2  10 2  100
全学生の平均はいくら位か90%信頼区間を求めな
さい.不偏分散は正確だと前提します.
教科書153頁と同じですが
信頼係数が違います
【1】の解答
0.90
 P 1.645  Z  1.645


X


 P  1.645 
 1.645
2

/n


2
2 




 P X  1.645 
   X  1.645 


n
n



100
100 

 P167.2  1.645 
   167.2  1.645 

10
10


 P162.0    172.4
不偏分散は信用できるか!?
頻度
100
700
600
500
400
300
200
100
0
<=
標本分散の分布
不偏分散の分布
これはカイ二
乗分布の形
じゃ
標本分布
0
50
00
50
00
50
00
50
00
00
50
1
2
2
3
3
4
4
5
1
5555555525
2
7
2
7
2
7
2
7
75
1
1
2
2
3
3
4
4
データの分散の値
サンプルの結果ですから、値は大小さまざま、あてになりません
今までやったことは・・・


X


0.90  P 1.645  Z  1.645  P  1.645 
 1.645
2
ˆ

/n


標準化のように見えて
正規分布の変数 その平均値
カイ二乗分布の変数/ データ数
標準値といわずに、T値と呼んでいます
標準値とT値は違います!
データ値
右のボタンを押してから分布の種類と
毎回のデータ数、抽出反復回数を指
定してください。
実験開始!
N(170,102)じゃ
176.47  170
Z
 1.45
100
5
1回目
2回目
3回目
4回目
5回目
元の分布は
データ1 データ2 データ3 データ4 データ5 標本平均
173.68
175.80
162.41
172.88
170.54
171.06
166.14
167.60
173.54
156.80
176.06
168.03
174.63
174.21
179.96
165.47
162.86
171.43
168.56
178.42
156.45
166.28
183.43
170.63
185.21
185.46
174.02
159.31
178.34
176.47
Z
176.47  170
100
5
 1.45
T
176.47  170
 1.35
115.29
5
分散不偏
推定
26.93
56.14
49.90
112.18
115.29
T値
0.46
-0.59
0.45
0.13
1.35
『 T分布』のポイント
平均値
分散
標準偏差
最大値
最小値
T値の標本分布
1200
0.0166
1.9796
1.4070
9.2665
-7.5530
1000
600
400
200
T値
9
8
~
7
6
~
5
4
~
3
2
~
1
0
~
-1
~
-3
2
~
-5
4
~
6
~
-7
0
8
頻度
800
正規分布N(0,1)と同じ形
左右対称
散らばりが大きい
データ数少ないと特に問題.
となると、T値の数値表がいる
これは自由度
90%圏 95%圏
例題【1‘】
ある大学の学生を対象に10名をランダムにとり身
長のデータをとると結果は
X  167.2
ˆ 2  10 2  100
全学生の平均はいくら位か90%信頼区間を求め
なさい.全学生の分散は100にしましょう.
全学生の身長のばらつき(σ2)はわからない
例題【1‘】の解答
0.90
 1.833  T  1.833
 0P.90
 P -①  T  ① 
T値を使うときは自由度
がいくらになるかが鍵!

 P  1.833 
 1.833

2

ˆ

/n


X 


 P-① 
①
2 
2 
2 
ˆ
ˆ

ˆ





P X

1
.
833




X

1
.
833


 

n
n
n



X 
 あとはデータの結果を 代入して同じように・
・・

100
100 

 P167.2  1.833 
   167.2  1.833 

10
10


 P161.4    173.0
練習問題【2】
正規母集団から無作為にとった5個のデータ
171、179、164、174、170
を得た.このデータから母集団の平均値を推定しなさ
い.信頼係数は95%とする.
ヒント:
標本平均=171.6
分散推定=30.3
練習問題(2)の解答
教科書157ページの例題42を参照