統計学 11/13(月)

統計学
11/13(月)
担当:鈴木智也
1
講義の全体構成
第1部 記述統計:データの特性を記述
第2部 確率論:推測統計への橋渡し
確率論入門
確率変数と確率分布
主な確率分布 ←ここ!
☆中間試験はここまで
第3部 推測統計:データから全体像を推測
2
主な確率分布
• 二項分布(離散型)
これが基本型。
• ポアソン分布(離散型)
二項分布から導出できる。
• 正規分布(連続型)
これも二項分布から導出できる。
3
二項分布とは
☆結果が二通り(例:SかF)しかない実験
• 結果がSとなる確率をpで表す。
• 結果がFとなる確率は、q(=1-p)である。
• この実験をn回行い、結果がSとなる回数を
Xとする。
⇒Xは確率変数であり、その分布は二項分
布(n, p)に従う。
4
二項分布:例題
• 実験:じゃんけん
• その結果 S=勝つ
F=勝たない(負け、あいこ)
• 勝つ確率:p=1/3 勝たない確率:q=2/3
Q:3回のじゃんけんで1回勝つ確率は?
(n=3、x=1)
5
二項分布:例題の答え
• ケースA:一回目に勝つ場合の確率
(1/3)×(2/3)×(2/3)=(1/3)×(2/3)2
• ケースB:二回目に勝つ場合の確率
(2/3)×(1/3)×(2/3)=(1/3)×(2/3)2
• ケースC:三回目に勝つ場合の確率
(2/3)×(2/3)×(1/3)=(1/3)×(2/3)2
注:A、B、Cは互いに排反。
⇒3回中1回だけ勝つ確率は、3×(1/3)×(2/3)2。
6
二項分布の公式
• X=xjという値を取る確率は
P(xj)=nCx px qn-x =for j=1,…,n.
• nCx は、n 個のものから x 個のものを選び
出す公式であり、 nCx = n!/{x!(n-x)!}。
• 注:n! は n の階乗であり、
n!=n×(n-1) ×(n-2) ×…×2×1である。
7
二項分布:期待値と分散
確率変数Xが二項分布に従う場合、
• 期待値:E(X)=np
• 分散:V(X)=npq=np(1-p)
(証明は略)
例:3回のじゃんけんで勝つ回数の期待値は
1回。
8
二項分布からポアソン分布へ
☆次のような例を考えよう。
• 不動産業界で大型契約が成立する確率は
低い。→ p=0.001(=0.1%)とする。
• 1000人の顧客と商談を行った( n=1000 )と
きに、5件の大型契約を成功させる確率は
いくらか?
⇒理論上は、ポアソン分布で計算できる。
P(X=5) =1000C5 0.0015 0.99995。
9
二項分布からポアソン分布へ②
• しかし、現実には計算が煩雑すぎる。
(1000C5 がいくつになるか試算してみよ。)
• この例のように、n→∞、p→0の場合、
np→m(定数)
なら、二項分布はポアソン分布で近似する。
注:“A→B”は「Aの値がBに近づく」と読む。
10
ポアソン分布の公式
二項分布において、n→∞、p→0の場合、
X=xjの確率は
P(xj)=(mxe-m)/x!
で近似的に計算できる。
(注)なお、eは指数であり、m= npである 。
11
ポアソン分布:期待値と分散
• 確率変数Xがポアソン分布に従う場合、
• 期待値:E(X)=m
• 分散:V(X)=m
証明:二項分布の場合、期待値がnpであるこ
とから、ポアソン分布での期待値はmとな
る。分散も同様に証明できる。
12
正規分布
• 連続型の確率分布で中心となるのが「正
規分布(Normal Distribution)である。
• 正規分布は、期待値μを挟んで左右対称で、
釣鐘型(教科書P.163の図)。
☆特徴:期待値μと分散σ2が分れば、正規分
布の形状は把握できる。
13
標準正規分布
• 確率変数Xが、期待値μで分散σ2の正規分
布に従うとする。
X~N(μ,σ2)
• このとき、Xは次のように「標準化」できる。
Z=(X-μ)/σ~ N(0,1)
• 期待値0で分散が1の正規分布を「標準正
規分布」(←この分布は頻出)と呼ぶ。
14
標準正規分布N(0,1)の性質
• どのような正規分布であっても、前頁の式
によって、 N(0,1)に変換できる。
⇒ N(0,1)の性質を調べればよい。
• Z~ N(0,1)のとき、確率変数 Z が z という
値を取る確率を P で表すと、
P(-1.96 < z < 1.96) = 0.95
P(z >1.96) =0.025, P(z<-1.96) =0.025
であることが知られている。
15
正規分布と二項分布の関係
☆二項分布 Bi(n,p)で
• n→∞, p→0のとき、二項分布は
ポアソン分布で近似できる。
• n→∞で、 pが小さくないとき、二項分布は
正規分布で近似できる。
16
第3部にむけて
第3部で習う重要なことがらは、「t‐検定」で
あり、それを理論的に支えるのが「中心極
限定理」と「t‐分布」である。
①中心極限定理で「正規分布」を使う。
②また、その正規分布は「標準正規分布」に
変換された後、t‐分布で近似される。
17