平成 27 年度 経済統計分析入門 第 10 回 「母集団と標本」 . 原 尚幸 . 新潟大・経済 http://www.econ.niigata-u.ac.jp/˜hara/G-stat/ [email protected] H. Hara (Niigata U.) 母集団と標本 June 24, 2015 1 / 21 確率分布の例:χ2(カイ 2 乗) 分布 χ2(カイ 2 乗) 分布 X ∼ N (0, 1) のとき Y = X 2 の従う分布を自由度 1 の χ2 分布と言い , χ2 (1) と書く X1 , . . . , Xn が i.i.d. で N (0, 1) に従うとき, Y = X12 + · · · + Xn2 の従う分布を自由度 n の χ2 分布と言い , χ2 (n) と 書く . H. Hara (Niigata U.) 母集団と標本 June 24, 2015 2 / 21 χ2 分布の性質 自由度 n の χ2 分布 χ2 (n) の平均, 分散は E[Y ] = n, V [Y ] = 2n 0.0 0.1 0.2 0.3 0.4 0.5 Y ≥ 0 で , 負の値は取らない 0 5 10 15 x 自由度 1 の χ2 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 3 / 21 χ2 分布の性質 自由度 n の χ2 分布 χ2 (n) の平均, 分散は E[Y ] = n, V [Y ] = 2n 0.0 0.1 0.2 0.3 0.4 0.5 Y ≥ 0 で , 負の値は取らない 0 5 10 15 x 自由度 3 の χ2 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 3 / 21 χ2 分布の性質 自由度 n の χ2 分布 χ2 (n) の平均, 分散は E[Y ] = n, V [Y ] = 2n 0.0 0.1 0.2 0.3 0.4 0.5 Y ≥ 0 で , 負の値は取らない 0 5 10 15 x 自由度 5 の χ2 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 3 / 21 χ2 分布の性質 自由度 n の χ2 分布 χ2 (n) の平均, 分散は E[Y ] = n, V [Y ] = 2n 0.0 0.1 0.2 0.3 0.4 0.5 Y ≥ 0 で , 負の値は取らない 0 5 10 15 x 自由度 7 の χ2 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 3 / 21 χ2 分布の性質 自由度 n の χ2 分布 χ2 (n) の平均, 分散は E[Y ] = n, V [Y ] = 2n 0.0 0.1 0.2 0.3 0.4 0.5 Y ≥ 0 で , 負の値は取らない 0 5 10 15 x 自由度 10 の χ2 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 3 / 21 χ2 分布の性質 自由度 n の χ2 分布 χ2 (n) の平均, 分散は E[Y ] = n, V [Y ] = 2n 0.0 0.1 0.2 0.3 0.4 0.5 Y ≥ 0 で , 負の値は取らない 0 5 10 15 x 自由度 1,3,5,7,10 の χ2 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 3 / 21 確率分布の例:t 分布 t 分布 X ∼ N (0, 1), Y ∼ χ2 (n), X と Y が独立のとき X t= √ Y /n の従う分布を自由度 n の t 分布 と言い t(n) と書く . H. Hara (Niigata U.) 母集団と標本 June 24, 2015 4 / 21 t(n) 分布の性質 n (n > 2) n−2 密度関数の形は正規分布に似ている E[t] = 0, V [t] = 0.0 0.1 0.2 0.3 0.4 0.5 n → ∞ で標準正規分布に漸近する −4 −2 0 2 4 x 自由度 1 の t 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 5 / 21 t(n) 分布の性質 n (n > 2) n−2 密度関数の形は正規分布に似ている E[t] = 0, V [t] = 0.0 0.1 0.2 0.3 0.4 0.5 n → ∞ で標準正規分布に漸近する −4 −2 0 2 4 x 自由度 3 の t 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 5 / 21 t(n) 分布の性質 n (n > 2) n−2 密度関数の形は正規分布に似ている E[t] = 0, V [t] = 0.0 0.1 0.2 0.3 0.4 0.5 n → ∞ で標準正規分布に漸近する −4 −2 0 2 4 x 自由度 5 の t 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 5 / 21 t(n) 分布の性質 n (n > 2) n−2 密度関数の形は正規分布に似ている E[t] = 0, V [t] = 0.0 0.1 0.2 0.3 0.4 0.5 n → ∞ で標準正規分布に漸近する −4 −2 0 2 4 x 自由度 7 の t 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 5 / 21 t(n) 分布の性質 n (n > 2) n−2 密度関数の形は正規分布に似ている E[t] = 0, V [t] = 0.0 0.1 0.2 0.3 0.4 0.5 n → ∞ で標準正規分布に漸近する −4 −2 0 2 4 x 自由度 10 の t 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 5 / 21 t(n) 分布の性質 n (n > 2) n−2 密度関数の形は正規分布に似ている E[t] = 0, V [t] = 0.0 0.1 0.2 0.3 0.4 0.5 n → ∞ で標準正規分布に漸近する −4 −2 0 2 4 x 自由度 1,3,5,7,10 の t 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 5 / 21 t 分布の性質 密度関数は原点対称 t ∼ t(n) とする tα : t(n) 分布の上側 α 点 P (t > tα ) = α そのとき −tα = t1−α P (t > −tα ) = 1 − α f (t) t1−α = −tα H. Hara (Niigata U.) 0 t 母集団と標本 tα June 24, 2015 6 / 21 確率分布の例:F 分布 F 分布 X ∼ χ2 (m), Y ∼ χ2 (n), X と Y が独立のとき F = X/m Y /n の従う分布を自由度 (m, n) の F 分布と言い F (m, n) と書く . H. Hara (Niigata U.) 母集団と標本 June 24, 2015 7 / 21 F 分布の性質 0.0 0.2 0.4 0.6 0.8 F ≥ 0 で , 負の値は取らない 平均, 分散なども計算できるが覚えなくてよい 0 1 2 3 4 5 x 自由度 (1, 1) の F 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 8 / 21 F 分布の性質 0.0 0.2 0.4 0.6 0.8 F ≥ 0 で , 負の値は取らない 平均, 分散なども計算できるが覚えなくてよい 0 1 2 3 4 5 x 自由度 (3, 3) の F 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 8 / 21 F 分布の性質 0.0 0.2 0.4 0.6 0.8 F ≥ 0 で , 負の値は取らない 平均, 分散なども計算できるが覚えなくてよい 0 1 2 3 4 5 x 自由度 (5, 5) の F 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 8 / 21 F 分布の性質 0.0 0.2 0.4 0.6 0.8 F ≥ 0 で , 負の値は取らない 平均, 分散なども計算できるが覚えなくてよい 0 1 2 3 4 5 x 自由度 (7, 7) の F 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 8 / 21 F 分布の性質 0.0 0.2 0.4 0.6 0.8 F ≥ 0 で , 負の値は取らない 平均, 分散なども計算できるが覚えなくてよい 0 1 2 3 4 5 x 自由度 (10, 10) の F 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 8 / 21 F 分布の性質 0.0 0.2 0.4 0.6 0.8 F ≥ 0 で , 負の値は取らない 平均, 分散なども計算できるが覚えなくてよい 0 1 2 3 4 5 x 自由度 1,3,5,7,10 の F 分布 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 8 / 21 確率分布のまとめ 確率分布はほかにも多数存在するが , 現段階では 正規分布, χ2 分布, t 分布, F 分布を知っていれば 十分である. 逆にこれらの確率分布はの推測統計学で本質的に 重要な役割を果たす . 密度関数などは覚える必要はない . しかしそれぞれの分布の定義は覚える必要がある. H. Hara (Niigata U.) 母集団と標本 June 24, 2015 9 / 21 母集団と標本 定義 「母集団と標本」 調査対象の全体を母集団と言う 夫婦世帯全体 日本の成人男子全体 日本の製造業全体 世界の国全体 経済経営統計入門の履修者全体 母集団の部分集合を標本と言う 夫婦世帯 1000 世帯 日本の成人男子 10000 人 H. Hara (Niigata U.) 母集団と標本 . June 24, 2015 10 / 21 公営賃貸住宅家賃のデータ 2011 年都道府県別公営住宅家賃 (円, 1ヶ月, 3.3m2 あたり) 北海道 青森県 岩手県 宮城県 秋田県 山形県 福島県 茨城県 栃木県 群馬県 埼玉県 千葉県 1449 1011 1038 1469 1213 1094 1078 1196 1328 1242 2618 2827 東京都 神奈川県 新潟県 富山県 石川県 福井県 山梨県 長野県 岐阜県 静岡県 愛知県 三重県 3521 3280 1393 1068 1212 1081 1251 1235 931 1622 2055 1035 滋賀県 京都府 大阪府 兵庫県 奈良県 和歌山県 鳥取県 島根県 岡山県 広島県 山口県 徳島県 1730 2128 1944 2137 2532 1409 946 989 854 1218 968 970 香川県 愛媛県 高知県 福岡県 佐賀県 長崎県 熊本県 大分県 宮崎県 鹿児島県 沖縄県 1163 880 1023 1887 1129 1277 1353 1162 1040 1314 1357 出典 : 教えて! 全国ランキング http://www.japan-now.com H. Hara (Niigata U.) 母集団と標本 June 24, 2015 11 / 21 母集団の分布の分析 6 0 2 4 Frequency 8 10 12 母集団:47 都道府県 統計学 ⇔ 母集団の分布に関する情報の抽出 家賃の例の場合は全都道府県のデータが入手可能 正確な母集団分布の情報を得ることができる 1000 1500 2000 2500 3000 3500 Rent H. Hara (Niigata U.) 母集団と標本 June 24, 2015 12 / 21 統計的推測とは 例 日本の夫婦世帯全体の所得の分布に関する 情報を知りたい 所得の平均は? 所得のバラツキは? 所得配分の公平性は? etc... 日本の夫婦世帯全体のデータを集めるのは時間的 にもコスト 的にも困難 何世帯かの標本を抽出して, 標本の情報から母集 団全体の分布に関する推測を行う 標本の情報をもとに母集団について推測すること を統計的推測という H. Hara (Niigata U.) 母集団と標本 June 24, 2015 13 / 21 統計的推測 統計的推測 . 母集団から抽出された標本を用いて母集団分布を推測 すること . 母集団分布は未知 未知の母集団分布の情報を標本から抽出 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 14 / 21 統計的推測 母集団 X1 , X2 , . . . , Xn , . . . , XP 標本 X1 , X2 , . . . , Xn n < P : Xn+1 , . . . , XP の情報がない 統計的推測 母集団 X1 , X2 , . . . , Xn , . . . , XP の分布を標本 X1 , X2 , . . . , Xn の情報を用いて推測すること H. Hara (Niigata U.) 母集団と標本 June 24, 2015 15 / 21 無作為標本 定義「無作為標本」 母集団 X1 , X2 , . . . , Xn , . . . , XP から偏りなく抽出され た標本 X1 , . . . , Xn を母集団から抽出された大きさ n . の 無作為標本 であると言う そのとき X1 , . . . , Xn は iid で母集団の分布に したがうと考えることができる . 母集団のよい「縮図」 n を標本の大きさ, 標本のサイズという 以降, 単に標本と言ったときには無作為標本を あらわすものとする H. Hara (Niigata U.) 母集団と標本 June 24, 2015 16 / 21 母集団分布 定義「母集団分布・母平均・母分散」 母集団の分布のことを母集団分布という 母集団の平均を母平均 . 母集団の分散を母分散 母集団分布・母平均・母分散をそれぞれ 真の分布 真の平均 真の分散 . という言い方もする 「真の」=「分析者の本当の興味」 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 17 / 21 基本的な統計的推測の流れ 未知の母集団分布が (近似的に) 正規分布 N (µ, σ 2 ) であると仮定 ex) 家計所得の母集団分布に正規分布 N (µ, σ 2 ) を仮定 正規分布による母集団分布の近似は , 多くの場合よい 近似とされる 正規分布にしたがう母集団を正規母集団という f (x) H. Hara (Niigata U.) 母集団と標本 June 24, 2015 18 / 21 正規母集団の統計的推測 正規分布は平均 µ, 分散 σ 2 が決まると定まる しかし µ, σ 2 は未知 正規母集団分布の推測 ⇒ (無作為) 標本を用いて真の平均 µ, 分散 σ 2 に関する情報を抽出すること 問題 いかに精度よく µ, σ 2 の情報を抽出するか H. Hara (Niigata U.) 母集団と標本 June 24, 2015 19 / 21 統計量 統計量 統計的推測では (無作為) 標本 X1 , . . . , Xn の関数 T (X1 , . . . , Xn ) を用いて, 正規母集団に関する推測 を行う. 母平均 µ の値は? 母分散 σ 2 の値は? 母平均 µ が 0 より大きいか? ・ ・ ・ この関数 T (X1 , . . . , Xn ) のことを 統計量 という . H. Hara (Niigata U.) 母集団と標本 June 24, 2015 20 / 21 標本平均・標本分散 定義「標本平均・標本分散」 X1 , . . . , Xn : サイズ n の標本 X1 , . . . , Xn の平均, 分散 1∑ X̄ := Xi , n i=1 1∑ S := (Xi − X̄)2 n i=1 . をそれぞれ 標本平均, 標本分散という n n 2 標本平均は母平均の近似 標本分散は母分散の近似 H. Hara (Niigata U.) 母集団と標本 June 24, 2015 21 / 21
© Copyright 2025 ExpyDoc