モジュール1のまとめ

統計学
西山
平均と分散の標本分布
指定した値はμ=170、σ2=102、データ数は5個で反復
カイ二乗分布
標本平均の分布
700
600
500
400
300
200
100
0
187.33
152.9773
169.9806
20.43845
0.007936
0.042042
<=
33
7.
89
18
9-
3.8
18
3.
46
データの分散の値
18
60.4
18
2-
18
0.
02
17
7.0
17
7.
59
17
3.5
9-
3.
15
17
5-
0.1
17
2-
17
0.
72
16
6.7
16
6.
28
16
3.2
8-
3.
85
最大値
最小値
平均値
分散
歪み度
尖り度
16
5-
9.
15
9.8
15
1-
6.4
15
15
2.9
8-
15
6.
41
0
頻度
900
800
700
600
500
400
300
200
100
0
標本分散の分布
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
正規分布
不偏性
最大値
最小値
平均値
分散
歪み度
尖り度
477.6252
0.448268
79.85362
3114.514
1.367639
2.805332
母分散に対して
バイアスを含む
教科書:127ページ
分散の計算に二通りあり
言葉の定義どおりだと
1
2
S 
N
 X
N
i 1
 X
2
i
母集団の分散なら
不偏分散
こちらが主となります
N
1
2
2
X i  X 
ˆ 

N  1 i 1
 
2
2
ˆ
E 
バイアスを修正ずみ
練習問題: 推定入門<点推定>
ある高校の1年からランダムに5名を選んで100メー
トル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。
学年全体の平均値、分散はいくら位でしょう?
X  13.754
S  0.964
2
Ⅰ限:イントロ済
Ⅱ限:ここから
バイアスをとって推定する
点推定‐誤差は無視
分散の点推定
合計
平均
分散推定
記録(X)
12.32
15.28
14.19
13.72
13.26
68.770
13.754
偏差
-1.434
1.526
0.436
-0.034
-0.494
0.000
0.000
二乗偏差
2.056356
2.328676
0.190096
0.001156
0.244036
4.820
0.964
これはS2だか
らバイアスを
含む
1.205
4.820÷(5-1)
 0.964 5 


4

【例題】母平均の区間推定
ある高校の1年生からランダムに5名を選ん
で100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の平均はいくら位か誤差を
考慮してから答えなさい。
X  13.75
ˆ 2  1.205
当分は学年全体の分散と一致
していると仮定する
母平均の区間推定
ある確率  P ①  Z  ①


X 
 P  ① 
 ①
 n




 
 P X  ①
   X  ①

n標準誤差
n

2
2
2
サンプル
推定には定石があります①
第4章「統計的推測」とは
割り切り!
0.95  P 2  Z  2
推定の定石②
サンプルの平均値を標準値に
直すというのは
Z
X 
 /n
2
解答
0.95
 P 2  Z  2
本当はちょっと不正確!
最初正しければ
みな正し!


X


 P  2 
 2 
2 /n


最大偏差
標準偏差の2倍まで
わかっている値
を代入
2
2 




 P   2 
 X    2


n
n


2 未知数
2 




 P X  2 
   X  2


n
n

 標準誤差
サンプル平均

1.205
1.205 

 P13.75  2 
   13.75  2 

5
5


 P12.77    14.73
本当はちょっと不正確
信頼係数を90%に落とすと
信頼係数
0.90  P1.645  Z  1.645




X 


 P 1.645 
 1.645
2



n




1
.
205
1
.
205

 P13.75 1.645
   13.75  1.645

5
5


サンプル平均
標準誤差
推定の手順
信頼係数を決める(95%、90%、99%)
まず標準値で区間をつくる
 95%信頼区間なら、±2以内
 90%信頼区間なら、±1.65以内
 99%信頼区間なら、±2.6以内
標準値の定義式で置き換える
未知数μの区間に変形する
教科書:151~156ページ
練習問題【1】
ある高校の1年生からランダムに5名を選ん
で100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。次の解答を完成させなさい。
X  13.75
2
ˆ  1.205
練習問題【1】の解答
 P1  Z  1
・
・
・
X  13.75
2
ˆ  1.205
 P    
練習問題【1】の解答
0.68
 P1  Z  1
・
・
・
 P    
13.26
X  13.75
ˆ 2  1.205
14.24
点推定の理屈
区間推定は、
誤差をどこまで見積もるか
2

 標準誤差
サンプル平均
1.645

 1.205
  13.75  

1
5


0

幅をつけない推定法を点推定といいます
練習問題【2】
ある高校の1年生からランダムに20名を選
んで100メートル走の記録をとると、
X  13.75
2
ˆ  1.205←学年全体と一致する
だった。学年全体の平均について推定し
なさい。但し、信頼係数は95%とする。
練習問題【2】の解答
サンプルが増えた分、標準誤差が小さくなります
0.95
 P1.96  Z  1.96
Ⅱ限
ここまで
6/25


X 

 P 1.96 

1
.
96

2
 /n


2
2 




 P X 1.96
   X  1.96


n
n




1
.
205
1
.
205

 P13.75 1.96
   13.75  1.96

20
20


 P13.27    14.23
区間推定のまとめ<95%区間>
サンプル平均
標準誤差
 
母分散
母平均 =サンプル平均X   1.96
サンプル数n
2
ルートNの公式
母集団の分散が分らない場合は、不偏分散を求めて、代わりに使う
サンプル数が10個未満なら、必ずT分布の数値表を見て、
1.96を修正しないといけない(次回予定)
【例題】○○率の推定
Ⅰ限:このイントロまで
Ⅱ限:ここから
6/25
ある人気ドラマをみたかどうかを、100人の
サンプルに対して質問したところ、40人の人
が「みた」と答えた。社会全体では、何%程
度の人がこのドラマを見ただろうか。
信頼係数は95%で答えてください。
知りたいのは社会全体の視聴率です
視聴率は40%だと、
いまわかったじゃないか
社会全体のことは調べてませんから、
分かりません
ゼロイチ母集団の特徴
Ⅰ限
みた
→ 1
ここまで
6/25
みない → 0
(例)社会全体では
30%(=0.30)がみた
本当の視聴率は
母平均(μ)のこと
1の確率をpとして
―ゼロイチ母集団―
平均
分散
  1 p  0 1 p  p
  p  1 p
2
100人サンプルの視聴率は
サンプル平均
0  0 1  0
X
 サンプルの視聴率
100
○○率調査とは母平均の推定
推定の手順どおりに
サンプル平均
40
 0.40
100
標準誤差

2
n

p1  p
0.40 0.60

 0.049
n
100
母平均(μ)=0.40±2×0.049
95%信頼区間