第 2 回 1 変量分布 村澤 康友 2014 年 4 月 16 日 目次 確率変数と確率分布 1 1.1 確率変数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 確率分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 期待値と積率 8 2.1 期待値 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2 積率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 積率母関数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1 2 1 確率変数と確率分布 1.1 確率変数 定義 1. 試行の結果によって値が決まる変数を確率変数という. 例 1. コイントスに対して { 1 (表) X := 0 (裏) とすれば X は確率変数. 定義 2. 確率変数の分布を確率分布という. 注 1. 度数分布と似た概念. 1.2 確率分布 1.2.1 累積分布関数 確率変数 X の確率分布を表現する. 定義 3. 任意の x に対して Pr[X ≤ x] を与える関数を X の累積分布関数(cumulative distribution function, cdf)という. 1 1.0 0.8 0.6 0.0 0.2 0.4 Fn(x) 0 1 2 3 4 5 x 図1 サイコロの目の cdf 注 2. FX (.) で表す.すなわち FX (x) := Pr[X ≤ x]. 注 3. 弱い不等号 ≤ で定義する. 注 4. 度数分布の累積相対度数に相当. 例 2. X をサイコロの目の数とすると 1 . X = .. 6 X の cdf は with pr. 1/6 with pr. 1/6 0 1/6 . FX (x) = .. 5/6 1 for x < 1 for 1 ≤ x < 2 for 5 ≤ x < 6 for 6 ≤ x FX (.) のグラフは図 1 の通り. FX (.) は以下の性質をもつ. 定理 1 (増加関数). x1 < x2 =⇒ FX (x1 ) ≤ FX (x2 ) 2 6 7 証明. x1 < x2 なら FX (x2 ) := Pr[X ≤ x2 ] = Pr[X ≤ x1 ] + Pr[x1 < X ≤ x2 ] ≥ Pr[X ≤ x1 ] = FX (x1 ) 定理 2. lim FX (x) = 0, lim FX (x) = 1 x→−∞ x→∞ 証明. lim FX (x) = lim Pr[X ≤ x] x→−∞ (N ) ∩ = lim P (−∞, −n] x→−∞ N →∞ ( =P lim N →∞ n=1 N ∩ ) (−∞, −n] n=1 = P (∅) =0 lim FX (x) = lim Pr[X ≤ x] x→∞ (N ) ∪ = lim P (−∞, n] x→∞ N →∞ ( =P lim N →∞ n=1 N ∪ ) (−∞, n] n=1 = P (R) =1 定理 3 (右連続). 任意の x0 において lim FX (x) = FX (x0 ) x↓x0 証明. lim FX (x) = lim Pr[X ≤ x] x↓x0 (N ( ]) ∩ 1 = lim P −∞, x0 + N →∞ n n=1 ( ]) N ( ∩ 1 =P lim −∞, x0 + N →∞ n n=1 x↓x0 = P ((−∞, x0 ]) = Pr[X ≤ x0 ] = FX (x0 ) 3 注 5. 左連続とは限らない.なぜなら lim FX (x) = lim Pr[X ≤ x] x↑x0 (N ( ]) ∪ 1 = lim P −∞, x0 − N →∞ n n=1 ( ]) N ( ∪ 1 =P lim −∞, x0 − N →∞ n n=1 x↑x0 = P ((−∞, x0 )) = Pr[X < x0 ] 注 6. 逆に以上の性質をもつ F (.) は cdf.例えば 0 for x < 0 一様分布: F (x) := x for 0 ≤ x ≤ 1 1 for 1 < x { 0 for x < 1 パレート分布: F (x) := 1 − 1/x for x ≥ 1 { 0 for x < 0 指数分布: F (x) := x 1 − 1/e for x ≥ 0 ロジスティック分布: F (x) := ex 1 + ex それぞれのグラフは図 2 の通り. 1.2.2 確率密度関数 ■離散分布 定義 4. 取りうる値の集合が可算である確率変数を離散確率変数という. 定義 5. 離散確率変数の確率分布を離散分布という. 定義 6. 任意の x に対して Pr[X = x] を与える関数を X の確率関数という. 注 7. pX (.) で表す.すなわち pX (x) := Pr[X = x]. 注 8. 度数分布の相対度数に相当. 注 9. cdf の定義より,任意の x について FX (x) := Pr[X ≤ x] ∑ = Pr[X = x′ ] x′ ≤x = ∑ x′ ≤x 4 pX (x′ ) 0.8 0.0 0.4 ppareto(x) 0.8 0.4 0.0 punif(x) -2 -1 0 1 2 -4 -2 -2 0 4 2 2 4 0.0 0.2 0.4 0.6 0.8 1.0 plogis(x) -4 2 x 0.0 0.2 0.4 0.6 0.8 1.0 pexp(x) x 0 4 -4 x -2 0 x 図 2 cdf の例 また ∑ pX (x) = 1 x 逆にこれを満たす非負の p(.) は確率関数. 例 3. X をサイコロの目の数とすると,X の確率関数は { 1/6 pX (x) = 0 for x = 1, . . . , 6 elsewhere pX (.) のグラフは図 3 の通り. ■連続分布 ルーレットの円周は非可算無限個の点から成る.この場合,個々の点で止まる確率は 0(無限小) なので,確率関数は役に立たない. 定義 7. 連続な cdf をもつ確率変数を連続確率変数という. 5 0.20 0.15 0.10 0.00 0.05 p 0 1 2 3 4 5 x 図3 サイコロの目の確率関数 注 10. FX (.) が連続なら pX (x) := Pr[X = x] = Pr[X ≤ x] − Pr[X < x] = FX (x) − lim FX (x′ ) ′ x ↑x = FX (x) − FX (x) =0 定義 8. 連続確率変数の確率分布を連続分布という. 定義 9. 任意の x について ∫ FX (x) = x −∞ fX (t) dt となる fX (.) を X の(確率)密度関数という. 注 11. 任意の a, b について ∫ Pr[a < X ≤ b] = b fX (x) dx a 図 4 を参照.また ∫ ∞ −∞ fX (x) dx = 1 逆にこれを満たす非負の f (.) は密度関数. 注 12. FX (.) が微分可能ならば,微分積分学の基本定理より ′ fX (x) := FX (x) 6 6 7 0.4 0.3 0.2 0.0 0.1 dnorm (x) -4 -2 0 2 4 x 図4 密度関数による確率の評価 例 4. 例えば cdf が 0 for x < 0 F (x) := x for 0 ≤ x ≤ 1 1 for 1 < x { 0 for x < 1 F (x) := 1 − 1/x for x ≥ 1 { 0 for x < 0 F (x) := x 1 − 1/e for x ≥ 0 F (x) := ex 1 + ex なら対応する密度関数は 0 for x < 0 f (x) = 1 for 0 ≤ x ≤ 1 0 for 1 < x { 0 for x < 1 f (x) = 1/x2 for x ≥ 1 { 0 for x < 0 f (x) = x 1/e for x ≥ 0 f (x) = ex (1 + ex )2 それぞれのグラフは図 5 の通り. 定義 10. 確率関数と密度関数をまとめて確率密度関数(probability density function, pdf)という. 7 0.8 0.0 0.4 ppareto(x) 0.8 0.4 0.0 dunif(x) -2 -1 0 1 2 -4 -2 2 4 2 4 x 0.05 0.15 dlogis(x) 0.4 0.0 dexp(x) 0.8 0.25 x 0 -4 -2 0 2 4 -4 -2 x 0 x 図5 密度関数の例 2 期待値と積率 2.1 期待値 X を確率変数とする. 定義 11. X の期待値は {∑ xpX (x) (離散) xfX (x) dx (連続) −∞ ∫ ∞x E(X) := 注 13. X の関数 g(X) の期待値は次のように定義する. {∑ E(g(X)) := g(x)pX (x) (離散) g(x)fX (x) dx (連続) −∞ ∫ ∞x 例 5. X を次のような確率変数とする. { X := 1 with pr. p 0 with pr. 1 − p 8 期待値は E(X) := 1 · p + 0 · (1 − p) =p 定理 4. 任意の a, b について E(aX + b) = a E(X) + b 証明. X が連続なら ∫ ∞ E(aX + b) := (ax + b)fX (x) dx ∫ xfX (x) dx + b −∞ ∫ ∞ ∞ −∞ −∞ =a fX (x) dx = a E(X) + b 離散の場合も同様. 注 14. より一般的に (X, Y ) の 2 変量分布について E(aX + bY ) = a E(X) + b E(Y ) 2.2 積率 定義 12. X の k 次の積率(モーメント)は ( ) µX,k := E X k 定義 13. 1 次の積率を平均という. 注 15. µX と表す. 定義 14. X の k 次の中心積率は ( ) µ′X,k := E (X − µX )k 定義 15. 2 次の中心積率を分散という. 注 16. var(X) と書く.すなわち ( ) var(X) := E (X − µX )2 例 6. X を次のような確率変数とする. { X := 1 with pr. p 0 with pr. 1 − p µX = p より var(X) := (1 − p)2 · p + (0 − p)2 · (1 − p) = p(1 − p)2 + p2 (1 − p) = p(1 − p) 9 定理 5. ( ) var(X) = E X 2 − µ2X 証明. ( ) var(X) := E (X − µX )2 ( ) = E X 2 − 2µX X + µ2X ( ) = E X 2 − 2µX E(X) + µ2X ( ) = E X 2 − µ2X 定理 6. 任意の a, b について var(aX + b) = a2 var(X) 証明. ( ) var(aX + b) := E (aX + b − E(aX + b))2 ( ) = E [aX + b − (a E(X) + b)]2 ( ) = E [a(X − E(X))]2 ( ) = E a2 (X − E(X))2 ( ) = a2 E (X − E(X))2 = a2 var(X) 定義 16. 分散の平方根を標準偏差という. 注 17. σX と表す. 定義 17. 確率変数から平均を引き標準偏差で割る変換を標準化という. 注 18. 平均を 0,分散を 1 にする. 定義 18. 標準化した変量の 3 次の積率を歪度という. 注 19. すなわち (( αX,3 := E X − µX σX )3 ) pdf が対称なら αX,3 = 0. 定義 19. 標準化した変量の 4 次の積率を尖度という. 注 20. すなわち (( αX,4 := E X − µX σX )4 ) 正規分布なら αX,4 = 3.これを基準に尖度を αX,4 − 3 と定義することもある. 10 2.3 積率母関数 定義 20. X の積率母関数(moment generating function, mgf)は ( ) MX (t) := E etX 定理 7. 任意の k について ( ) d MX (0) = E X k k dt k 証明. 任意の k について k k ( ) d d MX (t) = E etX dtk dtk ( ) k d tX =E e dtk ( ) = E X k etX ( ) t = 0 なら E X k . 例 7. X を次のような確率変数とする. { X := 1 with pr. p 0 with pr. 1 − p mgf は ( ) MX (t) := E etX = et·1 · p + et·0 · (1 − p) = pet + 1 − p 微分すると ′ MX (t) = pet ′′ MX (t) = pet 1・2 次の積率は ′ E(X) = MX (0) ( E X 2 ) =p ′′ = MX (0) =p 分散は ( ) var(X) = E X 2 − E(X)2 = p − p2 = p(1 − p) 11
© Copyright 2024 ExpyDoc