統計学 11/13（月）

統計学
11/13（月）
担当：鈴木智也
1
講義の全体構成
第１部記述統計：データの特性を記述
第２部確率論：推測統計への橋渡し
確率論入門
確率変数と確率分布
主な確率分布 ←ここ！
☆中間試験はここまで
第３部推測統計：データから全体像を推測
2
主な確率分布
• 二項分布（離散型）
これが基本型。
• ポアソン分布（離散型）
二項分布から導出できる。
• 正規分布（連続型）
これも二項分布から導出できる。
3
二項分布とは
☆結果が二通り（例：SかF）しかない実験
• 結果がSとなる確率をpで表す。
• 結果がFとなる確率は、q（=1－p）である。
• この実験をn回行い、結果がSとなる回数を
Xとする。
⇒Xは確率変数であり、その分布は二項分
布（n, p）に従う。
4
二項分布：例題
• 実験：じゃんけん
• その結果 S＝勝つ
F＝勝たない（負け、あいこ）
• 勝つ確率：p＝1/3 勝たない確率：q=2/3
Q：３回のじゃんけんで1回勝つ確率は？
(n=3、x=1)
5
二項分布：例題の答え
• ケースA：一回目に勝つ場合の確率
（1/3）×（2/3）×（2/3）=（1/3）×（2/3）2
• ケースB：二回目に勝つ場合の確率
（2/3）×（1/3）×（2/3）=（1/3）×（2/3）2
• ケースC：三回目に勝つ場合の確率
（2/3）×（2/3）×（1/3）=（1/3）×（2/3）2
注：A、B、Cは互いに排反。
⇒３回中１回だけ勝つ確率は、3×（1/3）×（2/3）2。
6
二項分布の公式
• X＝xjという値を取る確率は
P(xj)=nCx px qn-x =for j=1,…,n.
• nCx は、n 個のものから x 個のものを選び
出す公式であり、 nCx = n!/{x!(n-x)!}。
• 注：n! は n の階乗であり、
n!=n×(n-1) ×(n-2) ×…×2×1である。
7
二項分布：期待値と分散
確率変数Xが二項分布に従う場合、
• 期待値：E(X)=np
• 分散：V(X)=npq=np(1-p)
（証明は略）
例：３回のじゃんけんで勝つ回数の期待値は
１回。
8
二項分布からポアソン分布へ
☆次のような例を考えよう。
• 不動産業界で大型契約が成立する確率は
低い。→ p=0.001（=0.1%）とする。
• 1000人の顧客と商談を行った（ n=1000 ）と
きに、5件の大型契約を成功させる確率は
いくらか？
⇒理論上は、ポアソン分布で計算できる。
P(X=5) =1000C5 0.0015 0.99995。
9
二項分布からポアソン分布へ②
• しかし、現実には計算が煩雑すぎる。
（1000C5 がいくつになるか試算してみよ。）
• この例のように、n→∞、p→0の場合、
np→m（定数）
なら、二項分布はポアソン分布で近似する。
注：“A→B”は「Aの値がBに近づく」と読む。
10
ポアソン分布の公式
二項分布において、n→∞、p→0の場合、
X＝xjの確率は
P(xj)=(mxe-m)/x!
で近似的に計算できる。
（注）なお、eは指数であり、m= npである。
11
ポアソン分布：期待値と分散
• 確率変数Xがポアソン分布に従う場合、
• 期待値：E(X)=m
• 分散：V(X)=m
証明：二項分布の場合、期待値がnpであるこ
とから、ポアソン分布での期待値はmとな
る。分散も同様に証明できる。
12
正規分布
• 連続型の確率分布で中心となるのが「正
規分布（Normal Distribution)である。
• 正規分布は、期待値μを挟んで左右対称で、
釣鐘型（教科書P.163の図）。
☆特徴：期待値μと分散σ2が分れば、正規分
布の形状は把握できる。
13
標準正規分布
• 確率変数Xが、期待値μで分散σ2の正規分
布に従うとする。
X～N（μ，σ2）
• このとき、Xは次のように「標準化」できる。
Z=（X－μ）/σ～ N（0，1）
• 期待値0で分散が1の正規分布を「標準正
規分布」（←この分布は頻出）と呼ぶ。
14
標準正規分布N（0，1）の性質
• どのような正規分布であっても、前頁の式
によって、 N（0，1）に変換できる。
⇒ N（0，1）の性質を調べればよい。
• Z～ N（0，1）のとき、確率変数 Z が z という
値を取る確率を P で表すと、
P(-1.96 < z < 1.96) = 0.95
P(z >1.96) =0.025, P(z<-1.96) =0.025
であることが知られている。
15
正規分布と二項分布の関係
☆二項分布 Bi（n,p）で
• n→∞, p→0のとき、二項分布は
ポアソン分布で近似できる。
• n→∞で、 pが小さくないとき、二項分布は
正規分布で近似できる。
16
第3部にむけて
第３部で習う重要なことがらは、「ｔ‐検定」で
あり、それを理論的に支えるのが「中心極
限定理」と「ｔ‐分布」である。
①中心極限定理で「正規分布」を使う。
②また、その正規分布は「標準正規分布」に
変換された後、ｔ‐分布で近似される。
17

Download Report