スライド

平成 27 年度 経済統計分析入門
第 10 回 「母集団と標本」 .
原 尚幸
.
新潟大・経済
http://www.econ.niigata-u.ac.jp/˜hara/G-stat/
[email protected]
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
1 / 21
確率分布の例:χ2(カイ 2 乗) 分布
χ2(カイ 2 乗) 分布
X ∼ N (0, 1) のとき Y = X 2 の従う分布を自由度
1 の χ2 分布と言い , χ2 (1) と書く
X1 , . . . , Xn が i.i.d. で N (0, 1) に従うとき,
Y = X12 + · · · + Xn2
の従う分布を自由度 n の χ2 分布と言い , χ2 (n) と
書く
.
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
2 / 21
χ2 分布の性質
自由度 n の χ2 分布 χ2 (n) の平均, 分散は
E[Y ] = n,
V [Y ] = 2n
0.0
0.1
0.2
0.3
0.4
0.5
Y ≥ 0 で , 負の値は取らない
0
5
10
15
x
自由度 1 の χ2 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
3 / 21
χ2 分布の性質
自由度 n の χ2 分布 χ2 (n) の平均, 分散は
E[Y ] = n,
V [Y ] = 2n
0.0
0.1
0.2
0.3
0.4
0.5
Y ≥ 0 で , 負の値は取らない
0
5
10
15
x
自由度 3 の χ2 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
3 / 21
χ2 分布の性質
自由度 n の χ2 分布 χ2 (n) の平均, 分散は
E[Y ] = n,
V [Y ] = 2n
0.0
0.1
0.2
0.3
0.4
0.5
Y ≥ 0 で , 負の値は取らない
0
5
10
15
x
自由度 5 の χ2 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
3 / 21
χ2 分布の性質
自由度 n の χ2 分布 χ2 (n) の平均, 分散は
E[Y ] = n,
V [Y ] = 2n
0.0
0.1
0.2
0.3
0.4
0.5
Y ≥ 0 で , 負の値は取らない
0
5
10
15
x
自由度 7 の χ2 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
3 / 21
χ2 分布の性質
自由度 n の χ2 分布 χ2 (n) の平均, 分散は
E[Y ] = n,
V [Y ] = 2n
0.0
0.1
0.2
0.3
0.4
0.5
Y ≥ 0 で , 負の値は取らない
0
5
10
15
x
自由度 10 の χ2 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
3 / 21
χ2 分布の性質
自由度 n の χ2 分布 χ2 (n) の平均, 分散は
E[Y ] = n,
V [Y ] = 2n
0.0
0.1
0.2
0.3
0.4
0.5
Y ≥ 0 で , 負の値は取らない
0
5
10
15
x
自由度 1,3,5,7,10 の χ2 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
3 / 21
確率分布の例:t 分布
t 分布
X ∼ N (0, 1), Y ∼ χ2 (n), X と Y が独立のとき
X
t= √
Y /n
の従う分布を自由度 n の t 分布 と言い t(n) と書く
.
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
4 / 21
t(n) 分布の性質
n
(n > 2)
n−2
密度関数の形は正規分布に似ている
E[t] = 0, V [t] =
0.0
0.1
0.2
0.3
0.4
0.5
n → ∞ で標準正規分布に漸近する
−4
−2
0
2
4
x
自由度 1 の t 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
5 / 21
t(n) 分布の性質
n
(n > 2)
n−2
密度関数の形は正規分布に似ている
E[t] = 0, V [t] =
0.0
0.1
0.2
0.3
0.4
0.5
n → ∞ で標準正規分布に漸近する
−4
−2
0
2
4
x
自由度 3 の t 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
5 / 21
t(n) 分布の性質
n
(n > 2)
n−2
密度関数の形は正規分布に似ている
E[t] = 0, V [t] =
0.0
0.1
0.2
0.3
0.4
0.5
n → ∞ で標準正規分布に漸近する
−4
−2
0
2
4
x
自由度 5 の t 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
5 / 21
t(n) 分布の性質
n
(n > 2)
n−2
密度関数の形は正規分布に似ている
E[t] = 0, V [t] =
0.0
0.1
0.2
0.3
0.4
0.5
n → ∞ で標準正規分布に漸近する
−4
−2
0
2
4
x
自由度 7 の t 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
5 / 21
t(n) 分布の性質
n
(n > 2)
n−2
密度関数の形は正規分布に似ている
E[t] = 0, V [t] =
0.0
0.1
0.2
0.3
0.4
0.5
n → ∞ で標準正規分布に漸近する
−4
−2
0
2
4
x
自由度 10 の t 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
5 / 21
t(n) 分布の性質
n
(n > 2)
n−2
密度関数の形は正規分布に似ている
E[t] = 0, V [t] =
0.0
0.1
0.2
0.3
0.4
0.5
n → ∞ で標準正規分布に漸近する
−4
−2
0
2
4
x
自由度 1,3,5,7,10 の t 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
5 / 21
t 分布の性質
密度関数は原点対称
t ∼ t(n) とする
tα : t(n) 分布の上側 α 点
P (t > tα ) = α
そのとき −tα = t1−α
P (t > −tα ) = 1 − α
f (t)
t1−α = −tα
H. Hara (Niigata U.)
0
t
母集団と標本
tα
June 24, 2015
6 / 21
確率分布の例:F 分布
F 分布
X ∼ χ2 (m), Y ∼ χ2 (n), X と Y が独立のとき
F =
X/m
Y /n
の従う分布を自由度 (m, n) の F 分布と言い F (m, n)
と書く
.
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
7 / 21
F 分布の性質
0.0
0.2
0.4
0.6
0.8
F ≥ 0 で , 負の値は取らない
平均, 分散なども計算できるが覚えなくてよい
0
1
2
3
4
5
x
自由度 (1, 1) の F 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
8 / 21
F 分布の性質
0.0
0.2
0.4
0.6
0.8
F ≥ 0 で , 負の値は取らない
平均, 分散なども計算できるが覚えなくてよい
0
1
2
3
4
5
x
自由度 (3, 3) の F 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
8 / 21
F 分布の性質
0.0
0.2
0.4
0.6
0.8
F ≥ 0 で , 負の値は取らない
平均, 分散なども計算できるが覚えなくてよい
0
1
2
3
4
5
x
自由度 (5, 5) の F 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
8 / 21
F 分布の性質
0.0
0.2
0.4
0.6
0.8
F ≥ 0 で , 負の値は取らない
平均, 分散なども計算できるが覚えなくてよい
0
1
2
3
4
5
x
自由度 (7, 7) の F 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
8 / 21
F 分布の性質
0.0
0.2
0.4
0.6
0.8
F ≥ 0 で , 負の値は取らない
平均, 分散なども計算できるが覚えなくてよい
0
1
2
3
4
5
x
自由度 (10, 10) の F 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
8 / 21
F 分布の性質
0.0
0.2
0.4
0.6
0.8
F ≥ 0 で , 負の値は取らない
平均, 分散なども計算できるが覚えなくてよい
0
1
2
3
4
5
x
自由度 1,3,5,7,10 の F 分布
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
8 / 21
確率分布のまとめ
確率分布はほかにも多数存在するが , 現段階では
正規分布, χ2 分布, t 分布, F 分布を知っていれば
十分である.
逆にこれらの確率分布はの推測統計学で本質的に
重要な役割を果たす .
密度関数などは覚える必要はない .
しかしそれぞれの分布の定義は覚える必要がある.
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
9 / 21
母集団と標本
定義 「母集団と標本」
調査対象の全体を母集団と言う
夫婦世帯全体
日本の成人男子全体
日本の製造業全体
世界の国全体
経済経営統計入門の履修者全体
母集団の部分集合を標本と言う
夫婦世帯 1000 世帯
日本の成人男子 10000 人
H. Hara (Niigata U.)
母集団と標本
.
June 24, 2015
10 / 21
公営賃貸住宅家賃のデータ
2011 年都道府県別公営住宅家賃
(円, 1ヶ月, 3.3m2 あたり)
北海道
青森県
岩手県
宮城県
秋田県
山形県
福島県
茨城県
栃木県
群馬県
埼玉県
千葉県
1449
1011
1038
1469
1213
1094
1078
1196
1328
1242
2618
2827
東京都
神奈川県
新潟県
富山県
石川県
福井県
山梨県
長野県
岐阜県
静岡県
愛知県
三重県
3521
3280
1393
1068
1212
1081
1251
1235
931
1622
2055
1035
滋賀県
京都府
大阪府
兵庫県
奈良県
和歌山県
鳥取県
島根県
岡山県
広島県
山口県
徳島県
1730
2128
1944
2137
2532
1409
946
989
854
1218
968
970
香川県
愛媛県
高知県
福岡県
佐賀県
長崎県
熊本県
大分県
宮崎県
鹿児島県
沖縄県
1163
880
1023
1887
1129
1277
1353
1162
1040
1314
1357
出典 : 教えて! 全国ランキング
http://www.japan-now.com
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
11 / 21
母集団の分布の分析
6
0
2
4
Frequency
8
10
12
母集団:47 都道府県
統計学 ⇔ 母集団の分布に関する情報の抽出
家賃の例の場合は全都道府県のデータが入手可能
正確な母集団分布の情報を得ることができる
1000
1500
2000
2500
3000
3500
Rent
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
12 / 21
統計的推測とは
例 日本の夫婦世帯全体の所得の分布に関する
情報を知りたい
所得の平均は?
所得のバラツキは?
所得配分の公平性は? etc...
日本の夫婦世帯全体のデータを集めるのは時間的
にもコスト 的にも困難
何世帯かの標本を抽出して, 標本の情報から母集
団全体の分布に関する推測を行う
標本の情報をもとに母集団について推測すること
を統計的推測という
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
13 / 21
統計的推測
統計的推測
.
母集団から抽出された標本を用いて母集団分布を推測
すること
.
母集団分布は未知
未知の母集団分布の情報を標本から抽出
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
14 / 21
統計的推測
母集団
X1 , X2 , . . . , Xn , . . . , XP
標本
X1 , X2 , . . . , Xn
n < P : Xn+1 , . . . , XP の情報がない
統計的推測
母集団 X1 , X2 , . . . , Xn , . . . , XP の分布を標本
X1 , X2 , . . . , Xn の情報を用いて推測すること
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
15 / 21
無作為標本
定義「無作為標本」
母集団 X1 , X2 , . . . , Xn , . . . , XP から偏りなく抽出され
た標本 X1 , . . . , Xn を母集団から抽出された大きさ
n
.
の 無作為標本 であると言う
そのとき X1 , . . . , Xn は iid で母集団の分布に
したがうと考えることができる
.
母集団のよい「縮図」
n を標本の大きさ, 標本のサイズという
以降, 単に標本と言ったときには無作為標本を
あらわすものとする
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
16 / 21
母集団分布
定義「母集団分布・母平均・母分散」
母集団の分布のことを母集団分布という
母集団の平均を母平均
.
母集団の分散を母分散
母集団分布・母平均・母分散をそれぞれ
真の分布
真の平均
真の分散
.
という言い方もする
「真の」=「分析者の本当の興味」
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
17 / 21
基本的な統計的推測の流れ
未知の母集団分布が (近似的に) 正規分布 N (µ, σ 2 )
であると仮定
ex) 家計所得の母集団分布に正規分布 N (µ, σ 2 ) を仮定
正規分布による母集団分布の近似は , 多くの場合よい
近似とされる
正規分布にしたがう母集団を正規母集団という
f (x)
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
18 / 21
正規母集団の統計的推測
正規分布は平均 µ, 分散 σ 2 が決まると定まる
しかし µ, σ 2 は未知
正規母集団分布の推測
⇒ (無作為) 標本を用いて真の平均 µ, 分散 σ 2
に関する情報を抽出すること
問題
いかに精度よく µ, σ 2 の情報を抽出するか
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
19 / 21
統計量
統計量
統計的推測では (無作為) 標本 X1 , . . . , Xn の関数
T (X1 , . . . , Xn ) を用いて, 正規母集団に関する推測
を行う.
母平均 µ の値は?
母分散 σ 2 の値は?
母平均 µ が 0 より大きいか?
・
・
・
この関数 T (X1 , . . . , Xn ) のことを 統計量 という
.
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
20 / 21
標本平均・標本分散
定義「標本平均・標本分散」
X1 , . . . , Xn : サイズ n の標本
X1 , . . . , Xn の平均, 分散
1∑
X̄ :=
Xi ,
n i=1
1∑
S :=
(Xi − X̄)2
n i=1
.
をそれぞれ 標本平均, 標本分散という
n
n
2
標本平均は母平均の近似
標本分散は母分散の近似
H. Hara (Niigata U.)
母集団と標本
June 24, 2015
21 / 21