統計解析 第9回 第9章 正規分布、第11章 理論分布 今日学ぶこと •正規分布 •連続分布 •一様分布 •中心極限定理 二項分布の復習 2択の問題、てきとーに答えれば当たる確率は1/2 全部で100問。 全部で10問。 全部で4問。正解回数の確率分布は? 0.3 0.09 0.4 3 11 4 5 22 6 7 33 8 9 44 10 98 1 00 2 91 0 84 00 77 0.01 0 0 70 0.0625 63 4 0.1 0.1 0.02 0.05 0.05 0.05 56 0.25 49 3 42 0.375 35 2 0.04 0.15 0.1 0.15 0.03 28 0.25 14 21 1 0.25 0.25 0.05 0.15 0.2 0.2 7 0.0625 0 0 0.08 0.4 0.25 0.35 0.07 0.35 0.3 0.3 0.2 0.06 対称でない二項分布 4択の問題。てきとーに答えれば当たる確率は1/4 98 10 91 94 84 8 77 70 73 63 6 56 25 49 4 42 13 28 2 14 21 0 01 7 何かに近づいて いきそう。 0 問題数が多ければ、 確率分布の形は 似てくる。 0.1 0.3 0.45 0.09 0.4 0.25 0.08 0.35 0.07 0.2 0.3 0.06 0.25 0.15 0.05 0.2 0.04 0.1 0.15 0.03 0.1 0.02 0.05 0.05 0.01 000 35 全部で100問。 全部で10問。 全部で4問。正解回数の確率分布は? 正規分布と確率密度関数 •x = μに関して対称 •x = μで最大値 •x→±∞のとき、f(x)→0 •曲線下の面積 = 1 正規分布(ガウス分布) e μとσに適切な値を設定すると 以下の曲線を表す関数になる μ:平均 σ:標準偏差 0.09 98 91 x 84 98 91 84 77 70 63 56 49 42 35 28 14 21 7 0 77 0.01 70 0.02 63 0.03 56 0.04 49 0.05 42 0.06 35 0.07 28 0.1 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 0.08 0 f(x) X~N(μ,σ2)であらわす 14 21 2 2 2 2 7 1 0 f x x 2 確率密度関数と確率 P6 X 8 f x dx この計算は大変! x 2 8 8 1 6 6 2 2 2 2 e dx 0.3 0.25 6から8 の値をとる 確率 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 正規化 X~N(μ,σ2)とする一般に F x P X x x の計算は大変なので PZ z F z f x dx z x z 1 2 2 e z2 2 x 1 2 x 2 2 e 2 2 とすると dz dz z Zを標準化変量と呼ぶ。 となる。この計算の結果は正規分布表として 教科書の表A1(P294,295)で与えられている。 1 e 2 dx dx z2 2 より dz 平均0 標準偏差1 標準正規分布 計算例 X~N(1,22)とする の計算は大変なので x 1 z 2 とすると P(X<3)=P(Z<1)=F(1) =0.8413… つまり、平均1、標準偏差2の分布において、 3以下の値をとる確率は0.8413…である。 表にはF(-1)などはない、マイナスの場合を計算したい場合には F(-z) = 1 – F(z) を利用する。 ちょっと練習問題 変量Xは平均が10、標準偏差が5の正規分布にしたがう。このとき、 •13以下の値が出る確率 •7以下の値が出る確率 •8以上11以下の値が出る確率 を求めてみよう。 ちなみに記号で書くとX~N(10,52)に従うということ z=(x-10)/5とすると P(x<13)=P(z<3/5)=F(0.6)=0.7257 ? P(x<7)=P(z<-3/5)=1-F(0.6)=1-0.7257=0.2743 P(8<x<11)=P(-2/5<z<1/5)=F(0.2)-1+F(0.4) =0.5793-1+0.6554=0.23… その他理論分布 正規分布 一様分布 f x 1 2 2 x 2 e 2 2 1 , a xb f x b a 0, その他 関数が与えられれば、平均と分散を求められる。 確率密度関数からの平均と分散の計算 離散 連続 xf x xf x dx 全ての x 一様分布 の平均 b a 2 2 b 1 1 b a ab 2 x dx x a ba 2b a 2(b a) 2 x f x dx 2 2 一様分布の分散 b a ab x 2 2 1 dx ba b 1 2 x a b x a b a a b 2 4 d x a b 2 12 収入 A方式 B方式 1月 40 36 2月 36 36 3月 35 36 4月 33 36 5月 39 37.75 6月 39 37.75 7月 37 37.75 8月 36 37.75 9月 33 34 10月 40 34 11月 31 34 12月 32 34 合計 431 431 平均 35.9166 35.9166 標準偏差 3.17542 1.60018 中心極限定理の例 45 40 35 30 25 20 15 10 5 0 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 収入が不安定な場合 A:毎月もらう B:4ヶ月ごとの平均をもらう 12ヶ月で見た場合、合計も平均も同じ ただし、標準偏差(及び分散)は異なる 平均を見たほうが安定していそう どのくらい安定しているのか?→中心極限定理 中心極限定理 独立に同一な分布(平均μ、標準偏差σ) に従うn個の変数の平均は 平均μ、標準偏差 の正規分布 に従う n 前の例で言うならば A方式(独立に同一な分布に従っている): 平均35.9…、標準偏差3.1754… B方式(4個の平均): 平均35.9…、標準偏差1.600… 確かに、平均は同じで 標準偏差は 1 1 倍くらいになっている 4 2
© Copyright 2024 ExpyDoc