数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回 1 確率変数の特性量 期待値E[X]:Xがしたがう確率分布の平均 分散V[X]:Xのバラツキ度合 標準偏差:√分散 これらは,どのように計算し,どのような意味を 持つのだろうか. 数理統計学第2回 2 年末ジャンボ宝くじの期待値 1枚300円×1000万本=30億円 1等:2億円×2本=4億円 1等前後賞:5千万円×4本=2億円 1等組違い賞:10万円×198本=1980万円 2等:1千万円×3本=3千万円 3等:100万円×40本=4千万円 4等:1万円×1000本=1000万円 5等:3000円×10万本=3億円 6等:300円×100万本=3億 さよなら20世紀賞:5万円×3千本=1億5千万円 賞金合計総額:14億4980万円。 数理統計学第2回 期待値: 14億4980万円/1000万=144.98円 3 数理統計学第2回 4 期待値計算の操作 1枚くじをかったときの賞金金額(確率変数) n本の宝くじ,a通りの起こり得る場合(賞金) 度数 f1 f2 ・・・ fa 賞金 x1 x2 ・・・ xa 相対度数 p1 p2 ・・・ pa xi/n a E[ X ] x i 1 n i fi xa f a x1 f1 x 2 f 2 n n n a xi pi x1 p1 x 2 p 2 x a p a i 1 数理統計学第2回 5 確率変数Xの期待値 E[X]:期待値(expected value) Σx・p(x) 離散分布 E[X]= ∫x・f(x)dx 連続分布 期待値の公式 E[a1X1+ a2X2+・・・+ anXn] =a1 E[X1]+ a2 E[X2]+・・・+ an E[Xn] 宝くじを5枚買ったときの期待値は? 数理統計学第2回 6 人はなぜ宝くじを 買うのだろうか? 夢を買うため? 2本に1本300円当たる宝くじを買う人が いるだろうか? 一攫千金狙い 期待値は145円だが,SDは95053円 300円で10万円弱のバラツキの期待感 数理統計学第2回 7 宝くじの購入理由 http://www.takarakuji.nippon-net.ne.jp/data2.html#4 数理統計学第2回 8 分散 平均値μ=E[X]からどれくらい離れた点にばら つくか? (X-μ)2 の期待値:V[X]=E[(X-μ)2] =E[X2]-2μE[X]+μ2 = E[X2]-μ2 Σ(x-μ)2・p(x) 離散分布 V [X]= ∫(x-μ)2・f(x)dx 連続分布 数理統計学第2回 9 期待値の計算例(二項分布) B(n, p ) : p( x) n C x p (1 p) x n x n n! x n x E[ x] x p (1 p ) x!(n x)! x 0 n x 0 n (n 1)! x 1 n x p p (1 p) ( x 1)!(n x)! (n 1)! x 1 n x np p (1 p ) np x 1 ( x 1)!( n x )! n 数理統計学第2回 10 疑問点 Σは0からnまでのはず,1からnまででいいの か? 二項分布(4,p)の場合 0・4C0p0(1-p)4 0 +1・4C1p1(1-p)3 + 4p1(1-p)3 E[X]= +2・4C2p2(1-p)2 = +12p2(1-p)2 +3・4C3p3(1-p)1 +12p3(1-p)1 +4・4C4p4(1-p)0 + 4p4(1-p)0 数理統計学第2回 11 疑問点の続き 4p・ p0(1-p)3 4p・3C0p0(1-p)3 E[X]=+ 4p・3p1(1-p)2 = + 4p・3C1p1(1-p)2 + 4p・3p2(1-p)1 + 4p・3C2p2(1-p)1 + 4p・ p3(1-p)0 + 4p・3C3p3(1-p)0 =4p 期待値計算にはx=0の項は寄与しない. 黒字は{p+(1-p)}3なので1 数理統計学第2回 12 分散の計算例(二項分布) V [ X ] E[ X 2 ] 2 x 2 p ( x ) ( np) 2 2 x p( x) x( x 1) p( x) x p( x) n! x n x x ( x 1 ) p ( x ) x ( x 1 ) p ( 1 p ) x!( n x )! n( n 1)(n 2)! 2 x 2 p p (1 p ) n x ( x 2)!( n x)! ( n 2)! 2 x2 n x n( n 1) p p (1 p ) ( x 2)!( n x)! n( n 1) p 2 2 2 V [ X ] n( n 1) p 2 np n p np(1 p ) 数理統計学第2回 13 期待値・分散の計算例(一様分布) f(x)=1 (0≦x≦1) =0 (x<0, x>1) E[X]=∫xf(x) dx= ∫01xdx=[x2/2] 01 =1/2-0=1/2 V[X]=E[X2]-μ2 =∫x2dx-1/4 =[x3/3] 01-1/4 = 1/3-0-1/4=1/12 数理統計学第2回 14 モーメント 原点周りのk次のモーメントμ(ミュー) 離散分布:μk=Σxk・p(x) 連続分布:μk=∫xk・f(x)dx 平均周りのk次のモーメントν(ニュー) 離散分布:ν k=Σ(x- μ1)k・p(x) 連続分布:νk=∫(x- μ1)k・f(x)dx 数理統計学第2回 15 代表的なモーメント統計量 μ1 :平均 ν2 :分散 β1 = ν3/σ3:歪度(ワイド) skewness β2 = ν4/σ4 -3 :尖度(センド) kurtosis 正規分布: μ1=μ, ν2= σ2 , β1=0, β2=0 二項分布: μ1=nπ, ν2=nπ(1ーπ) 数理統計学第2回 16 積率母関数 モーメント統計量を求めることは簡単ではない. 積率母関数M(θ):moment generating function モーメントを計算するための道具 離散分布: M(θ)=E[eθx]= Σ eθx・p(x) 連続分布: M(θ)=E[eθx]= ∫ eθx・f(x)dx 数理統計学第2回 17 マクローリン展開 関数 f(x) の x=a におけるテイラー展開 f (a)(x a) f ( x) f (a) f (a)(x a) 2! k k f (a)(x a) k! k k f (a)(x a) k! k 0 数理統計学第2回 2 18 テイラー展開において、特に a=0 とし たときの級数をマクローリン展開という。 f (0) x f ( x) f (0) f (0) x 2! k k f (0) x k! k k f (0) x k! k 0 数理統計学第2回 2 19 f(x)= eθxの微分 f(x)= eθx ⇒ f(0)= e0 =1 f'(x)=θeθx ⇒ f'(0)=θe0=θ f''(x)=θ2eθx ⇒ f''(0)=θ2e0=θ2 ・・・ fk(x)=θk eθx ⇒ fk(0)=θke0=θk 数理統計学第2回 20 積率母関数とモーメント 3 3 2 2 x x x e 1 x 3! 2! 3 3 2 2 E[ X ] E[ X ] x M ( ) E (e ) 1 E[ X ] 3! 2! 2 d M ( ) dM ( ) 2 0 E[ X ] 0 E[ X ] 2 d d k d M ( ) k 0 E[ X ] k d 数理統計学第2回 21 積率母関数 (1)M(θ)を1階微分してθ=0とすると, E[X](期待値)が得られる. (2)M(θ)を2階微分してθ=0とすると, E[X2]が得られる. (3)M(θ)をk階微分してθ=0とすると, E[Xk]が得られる. 積率母関数を用いれば,原点周りのモーメントが 容易に計算できる. 数理統計学第2回 22 正規分布の例 1 f ( x) 2 2 x exp 2 2 M ( ) E[e ] x 1 2 2 1 2 2 e x 2 f ( x) dx x 2 exp x dx 2 2 x 2 2 2x exp dx 2 2 数理統計学第2回 23 正規分布の例 2 2 2 1 x 2x 2 x dx exp 2 2 2 2 ( x ( )) 2 dx exp 2 2 2 2 1 2 2 2 4 2 2 2 4 2 ( x ( 2 ))2 1 dx exp exp 2 2 2 2 2 2 2 2 exp( / 2) 数理統計学第2回 24 正規分布のモーメント M(θ)=exp(μθ+σ2θ2/2) M’(θ)=(μ+ σ2θ) exp(μθ+σ2θ2/2) M’(0)= E[X]=μ M’’(θ)= σ2 exp(μθ+σ2θ2/2) + (μ+σ2θ) 2exp(μθ+σ2θ2/2) M’’(0)= E[X2]=σ2 +μ2 V[X]=E[X2]- E[X] 2 = σ2 +μ2 - μ2 = σ2 数理統計学第2回 25 2項分布の例 p ( x) n C x p (1 p ) x n x M ( ) E[e ] e n C x p (1 p) x x n C x ( pe ) (1 p ) ( pe 1 p ) x x n x n x n M ' ( ) npe ( pe 1 p) n 1 M ' (0) E[ x] np 数理統計学第2回 26 2項分布の例 M ' ( ) npe ( pe 1 p ) n 1 M ' ' ( ) npe ( pe 1 p ) n 1 n(n 1) pe pe ( pe 1 p ) n2 M ' ' (0) E[ X ] 2 n( n 1) p np 2 V [ X ] E[ X ] E[ X ] 2 2 n( n 1) p np n p np(1 p ) 2 2 数理統計学第2回 2 27 演習問題1 Xが1,2,・・・,10までの値を等しく0.1の確 率でとる確率変数であるとする. 1)確率関数 2)累積分布関数 3)期待値 4)原点周りの2次のモーメント 5)分散 6)標準偏差 7)メディアン を求めよ. 数理統計学第2回 28 演習問題2 1.Y=X 2 は確率変数と考えられるか. 2.Yの確率関数と分布関数を示すこと 3.Yの期待値,分散,標準偏差は? 4.E[Y]をXの特性量を用いて 表すと 確率変数の関数はまた確率変数となる 数理統計学第2回 29 SASでのサイコロの目の発生 一様分布を用いてもいいが, RANTBL(seed,p1,..pi,..pn) returns a random variate from a tabled probability 数理統計学第2回 30 サイコロの目の発生プログラム例 data data; do i=1 to 1000; y=rantbl(4989,1/6,1/6,1/6,1/6,1/6,1/6); output; end; proc freq;tables y; run; 数理統計学第2回 31 データの平均と分布の平均 • 平均 – データの平均 x = (x1 + x2 +…+ xn)/n – 分布の平均 x f(x) dx – 平均という統計量X = (X1 + X2 + … + Xn) / n • 経験分布(nが大きい世界で,母集団分布を データの分布で近似する)という概念を導入 すると上の二つは同じになる.3番目はその 統計量版(確率変数版) 数理統計学第2回 32
© Copyright 2024 ExpyDoc