データ解析 第5回 確率分布2 - 連続確率分布 H26年11月6日 全 眞嬉 1 連続確率変数 連続型確率変数(continuous probability variable ) ◦ 実現値が連続した値(任意の実数値) をとる確率変数。連続 型確率変数の分布を連続型確率分布という。 確率密度関数(probability density function) ◦ 確率を分配する規則を表す連続曲線。単に密度関数とも呼 ばれる。 f ( x) X 2 確率密度関数 (probability density function) 累積分布関数が連続で微分可能なとき, その 導関数を確率密度関数と言う 連続型確率変数Xが開空間(a,b)に入る確率は、 この区間での確率密度関数とX軸との間の 面積で表される b P(a < X < b) = ∫ f ( x)dx a f ( x) a b X 3 確率密度関数の性質 b f ( x) ≥ 0, ∫ f ( x)dx = 1 a Xが期待値aをとる確率はX = aという線分の面積 a P( x = a) = P(a ≤ X ≤ a) = ∫ f ( x)dx = 0 a となる。このことから P ( a ≤ X ≤ b) = P ( a < X ≤ b) = P ( a ≤ X < b) = P ( a < X < b) が成立する。 4 正規分布(Normal Distribution) 平均値の付近に集積するようなデータの 分布を表した連続的な変数に関する確率 分布 統計学で最も多用される分布 自然現象や社会現象の多くの確率現象を 説明するために利用される 5 正規分布(Normal Distribution) 次の確率密度関数に従う確率分布を正規分 布と言う ( x− µ ) 2 − 2σ 2 1 f ( x) = e µ − σ µ µ + σ 2π σ この分布に従う確率変数Xの平均値はµ , 分散はσ 2となる 2 µ σ 正規分布は平均値 と分散 によって決 2 ( , ) と表記する N µ σ まり、 6 正規分布の確率密度関数 確率密度関数f(x)のグラフの形は分散 σ 2 の値だけで決まる 平均値 µ は頂点の横軸を決める N (0,0.52 ) N (0,12 ) N (0,2 2 ) 7 正規分布 正規分布とは N (0,0.52 ) ◦ ある標本集団のばらつきが、その平均値を 境として前後同じ程度にばらついている状 態を示す ◦ 表した分布図で見ると、平均値を線対称軸 とした左右対称の釣鐘型でなだらかな曲線 を描く ◦ つまり、平均値の周辺にサンプルが多く集 まり、値が大小の左右の裾野に向かうとサ ンプル数が急激に減る 8 正規分布関数 正規分布の分布関数は次のようになる F ( x) = P( X ≤ x) ∞ ∞ −∞ −∞ = ∫ f (t )dt = ∫ 1 e 2π σ − (t − µ )2 2σ 2 dt 積分値を解析的に求めることはできないの で,正規分布表を用いて確率を求める 平均値はµ , 分散はσ 2の正規分布をN ( µ , σ 2 )と表す 確率変数Xが正規分布N ( µ , σ 2 )に従うことを X ~ N ( µ , σ 2 )と書く 9 正規曲線 正規分布の確率密度関 数をグラフで表すと次 の様になる。これを正 規曲線と呼ぶ。 ,σ 2 ) N ( µ 正規曲線の特徴 正規曲線は正の値をと り、正規曲線の下側の 面積は1 正規曲線は平均 x = µ に関して左右対称 正規曲線の平均、メ ディアン、モードはす べて等しくµ となる µ − 2σ µ − σ µ µ + σ µ + 2σ 10 パーセント点 上側100p%点と両側100p%点 ◦ 確率密度関数の上側又は両側の確率がpに なる時の確率変数Xの値xのこと ◦ パーセント点と呼ばれる 数式 上側100 p%点:P ( X ≥ x) = p p 両側100 p %点:P ( X ≥ x) = 2 11 パーセント点 確率密度関数のグラフ 確率p 上側100 p %点のx 確率 p 2 確率 p 2 両側100 p %点のx 12 正規分布の両側5%点、両側1%点 ,σ 2 ) 推定や検定で利用される正規分布 N ( µ のパーセント点 N ( µ ,σ 2 ) 合計確率 0.05 µ − 1.96σ µ − σ µ µ + σ µ + 1.96σ N ( µ ,σ 2 ) 合計確率 0.01 µ − 2σ µ − σ µ µ + σ µ + 2σ µ − 2.58σ µ + 2.58σ P ( µ − 1.96σ ≤ X ≤ µ + 1.96σ ) = 0.95 P( µ − 2.58σ ≤ X ≤ µ + 2.58σ ) = 0.99 13 正規分布の上側5%点、上側1%点 ,σ 2 ) 推定や検定で利用される正規分布 N ( µ のパーセント点 N ( µ ,σ 2 ) 確率 0.05 µ − σ µ µ + σ µ + 1.64σ P( X ≤ µ + 1.64σ ) = 0.95 N ( µ ,σ 2 ) 確率 0.01 µ − 2σ µ − σ µ µ + σ µ + 2σ µ + 2.33σ P( X ≤ µ + 2.33σ ) = 0.99 14 標準正規分布 (Standard Normal Distribution) 2 平均値が0、分散が1の正規分布 N (0,1 ) 次の確率密度関数に従う確率分布を標準正 規分布と言う x2 − 2 1 f ( x) = e 2π この分布に従う確率変数Xの平均値は0, 分散は12となる 15 正規分布における標準化 = E[ X ] を引き、標準偏差 確率変数Xから期待値 µ σ = σ ( X ) で割った変数zを確率変数Xの標準化された 変数と言う X −µ Z= σ 標準化を行うことによって、任意の正規分布 を標準正規分布に変換できる。 N ( µ , σ 2 ) とすると X ~ N ( µ , σ 2 ) Z= X −µ σ とおけば、確率変数Zは E[ Z ] = 0,V [ Z ] = 1 16 正規分布における標準化 確率変数うXが正規分布N ( µ , σ 2 )に従う時 X −µ これを標準化を行う Z = σ この標準化された分布は標準分布N(0,12 )になる N (0,12 ) N (µ ,σ 2 ) 標準 17 正規分布表 N (0,12 ) N (0,12 ) P ( Z > zα ) = α 0 zα 18 標準正規分布表 N (0,12 ) P( Z > 1.96) = 0.025 0.025 0 1.96 19 標準正規分布の両側5%点、両側1%点 N (0 ,1 ) ,12 ) N (0 2 合計確率 0.05 − 1.96 0 1.96 合計確率 0.01 − 2.58 0 2.58 20 標準正規分布の上側5%点、上側1%点 ,12 ) N (0 ,12 ) N (0 確率 0.05 1.65 確率 0.01 2.33 21 t分布(t Distribution) 小さな標本を使っての母平均の推定に使う 分布 ◦ 母平均を推定した時には、母集団の分散が分 かっていない 次の確率密度関数に従う確率分布を自由度 nのt分布という 2 − n+1 x 2 f ( x) = k (1 + ) (kは定数) n この分布に従う確率変数Xの平均値µ , 分散σ 2 n 2 µ = 0, σ = n−2 22 t分布 t分布は自由度nの値だけで決まる グラフは正規分布に似た釣鐘型 自由度nを大きくするとt分布は標準正 規分布に近づく 自由度=5 ,1 ) N (0 2 t分布 自由度=10 ,12 ) N (0 t分布 23 t分布表 自由度nが10のとき 両側5%点は2.229 24 t分布の確率密度関数 自由度1 自由度2 自由度3 自由度∞ 25 χ 分布 2 母集団から標本を抽出しそれから不偏分散 を求める この不偏分散に関する分布 母集団の分散を探る重要な役割 次の確率密度関数に従う確率分布を自由度 2 χ nの 分布と言う f ( x) = kx n x −1 − 2 2 e この分布に従う確率変数Xの平均値µ , 分散σ 2 µ = n, σ 2 = 2 n 26 χ 分布の確率密度関数 2 自由度1 自由度2 自由度3 自由度4 自由度5 27 χ 分布表 2 28 エクセルの関数 分布名 Excel 関数名 説明 正規分布 NORMDIST 正規分布の累積分布関数 正規分布の%点逆引 NORMINV 標準正規分布 NORMDIST の「逆関数」 NORMSDIST 標準正規分布の累積分布関数 NORMSDIST の「逆関数」 標準正規分布の%点逆引 NORMSINV カイ2乗分布 CHIDIST カイ2乗分布の上側確率 カイ2乗分布の%点逆引 CHIINV CHIDIST の「逆関数」 F分布 FDIST F分布の上側確率 F分布の%点逆引 FINV FDISTの「逆関数」 t 分布 TDIST t 分布の片側・両側尾部確率(x 以上・± x 以遠) t 分布の%点逆引 TINV TDIST の「逆関数」 29
© Copyright 2024 ExpyDoc