統計学 11/19(月) 担当:鈴木智也 1 講義の全体構成 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し 確率論入門 確率変数と確率分布 主な確率分布 ←ここ! ☆中間試験はここまで 第3部 推測統計:データから全体像を推測 2 主な確率分布 • 二項分布(離散型) これが基本型。 • ポアソン分布(離散型) 二項分布から導出できる。 • 正規分布(連続型) これも二項分布から導出できる。 3 二項分布とは ☆結果が二通り(例:SかF)しかない実験 • 結果がSとなる確率をpで表す。 • 結果がFとなる確率は、q(=1-p)である。 • この実験をn回行い、結果がSとなる回数を Xとする。 ⇒Xは確率変数であり、その分布は二項分 布(n, p)に従う。 4 二項分布:例題 • 実験:じゃんけん • その結果 S=勝つ F=勝たない(負け、あいこ) • 勝つ確率:p=1/3 勝たない確率:q=2/3 Q:3回のじゃんけんで1回勝つ確率は? (n=3、x=1) 5 二項分布:例題の答え • ケースA:一回目に勝つ場合の確率 (1/3)×(2/3)×(2/3)=(1/3)×(2/3)2 • ケースB:二回目に勝つ場合の確率 (2/3)×(1/3)×(2/3)=(1/3)×(2/3)2 • ケースC:三回目に勝つ場合の確率 (2/3)×(2/3)×(1/3)=(1/3)×(2/3)2 注:A、B、Cは互いに排反。 ⇒3回中1回だけ勝つ確率は、3×(1/3)×(2/3)2。 6 二項分布の公式 • X=xjという値を取る確率は P(xj)=nCx px qn-x =for j=1,…,n. • nCx は、n 個のものから x 個のものを選び 出す公式であり、 nCx = n!/{x!(n-x)!}。 • 注:n! は n の階乗であり、 n!=n×(n-1) ×(n-2) ×…×2×1である。 7 二項分布:期待値と分散 確率変数Xが二項分布に従う場合、 • 期待値:E(X)=np • 分散:V(X)=npq=np(1-p) (証明は省略) 例:3回のじゃんけんで勝つ回数の期待値は 1回。 8 二項分布からポアソン分布へ ☆次のような例を考えよう。 • 不動産業界で大型契約が成立する確率は 低い。→ p=0.001(=0.1%)とする。 • 1000人の顧客と商談を行った( n=1000 )と きに、5件の大型契約を成功させる確率は いくらか? ⇒理論上は、ポアソン分布で計算できる。 P(X=5) =1000C5 0.0015 0.99995。 9 二項分布からポアソン分布へ② • しかし、現実には計算が煩雑すぎる。 (1000C5 がいくつになるか試算してみよ。) • この例のように、n→∞、p→0の場合、 np→m(定数) なら、二項分布はポアソン分布で近似する。 注:“A→B”は「Aの値がBに近づく」と読む。 10 ポアソン分布の公式 二項分布において、n→∞、p→0の場合、 X=xjの確率は P(xj)=(mxe-m)/x! で近似的に計算できる。 (注)なお、eは指数であり、m= npである 。 11 ポアソン分布:期待値と分散 • 確率変数Xがポアソン分布に従う場合、 • 期待値:E(X)=m • 分散:V(X)=m 証明:二項分布の場合、期待値がnpであるこ とから、ポアソン分布での期待値はmとな る。分散も同様に証明できる。 12 正規分布 • 連続型の確率分布で中心となるのが「正 規分布(Normal Distribution)である。 • 正規分布は、期待値μを挟んで左右対称 で、釣鐘型(教科書P.163の図)。 ☆特徴:期待値μと分散σ2が分れば、正規分 布の形状は把握できる。 13 標準正規分布 • 確率変数Xが、期待値μで分散σ2の正規分 布に従うとする。 X~N(μ,σ2) • このとき、Xは次のように「標準化」できる。 Z=(X-μ)/σ~ N(0,1) • 期待値0で分散が1の正規分布を「標準正 規分布」(←この分布は頻出)と呼ぶ。 14 標準正規分布N(0,1)の性質 • どのような正規分布であっても、前頁の式 によって、 N(0,1)に変換できる。 ⇒ N(0,1)の性質を調べればよい。 • Z~ N(0,1)のとき、確率変数 Z が z という 値を取る確率を P で表すと、 P(-1.96 < z < 1.96) = 0.95 P(z >1.96) =0.025, P(z<-1.96) =0.025 であることが知られている。 15 正規分布と二項分布の関係 ☆二項分布 Bi(n,p)で • n→∞, p→0のとき、二項分布は ポアソン分布で近似できる。 • n→∞で、 pが小さくないとき、二項分布は 正規分布で近似できる。 16 第3部にむけて 第3部で習う重要なことがらは、「t‐検定」で あり、それを理論的に支えるのが「中心極 限定理」と「t‐分布」である。 ①中心極限定理で「正規分布」を使う。 ②また、その正規分布は「標準正規分布」に 変換された後、t‐分布で近似される。 17
© Copyright 2024 ExpyDoc