確率と統計

確率と統計
平成18年12月21日
&
平成19年1月11日
いろいろな分布
•
•
•
•
•
•
•
2項分布
正規分布
ポアソン分布
一様分布
χ2分布
t分布
F分布 などなど
2項分布
• 1回の試行で事象Aの起こる確率がpで、起こ
らない確率がqとする。このとき、n回の反復
試行で事象Aがk回起こる確率は、次のように
なる。
P(X=k)=nCk p^kq^(n-k)
(k=0,1,2,3,4,…,n)
この分布であることを、B(n,p)と書くことがあ
る。
教科書 p.97 参照のこと
例
• 1枚の硬貨をn回投げる。
2項分布B(n,p)の平均と分散
• 平均 = np
• 分散 = npq
有名かつ便利な公式
教科書 p.101 式 (2) 参照のこと
正規分布
• 測定誤差や身長のデータのヒストグラムを作
ると釣鐘型になる。このときのヒストグラムの
形を近似的に表す曲線を正規分布曲線と
い、このときの分布を正規分布という。
正規分布曲線は、平均μと分散σ2できまるの
で、N(μ, σ2 ) と書くことがある。
正規分布
•
•
•
•
分布関数
確率密度関数
正規分布曲線(定義)
正規分布の特徴
正規分布のグラフ
正規分布のグラフ
左右対称
変曲点
ほとんどゼロ
教科書 p.102 図3 参照のこと
正規分布曲線の式
f ( x) 
1
2 
e

2
(x )
2
2
(  x  )
正規分布曲線の式
平均
f ( x) 
1
2 
e

2
(x )
2
2
(  x  )
標準偏差
重要な性質(再)
• 左右対称
• X=σは変曲点(上凸と下凸の変わり目)
• 平均 = 中央値 = モード
他の重要な性質
正規分布のグラフ
68%
正規分布のグラフ
95%
正規分布のグラフ
99.7%
標準化の公式
z
2
N(μ,σ )
x

N(0,1)
標準化の公式
z
平均μ、分散σ2
(正規分布)
2
N(μ,σ )
x

平均ゼロ、分散1
(標準正規分布)
N(0,1)
これについての情報が標準正
規分布表として与えられている。
練習問題
• 問題1: 正しく作られたコインを100回投げる
とき、表が40回から60回出る確率を求めよ。
• 問題1のヒント:
– コイン投げの繰り返しは2項分布Bとなるので、定
義に従って計算しても良いが、
– 繰り返しの回数が多い場合は、平均がnp、分散
がnpqの正規分布で近似できる。
– このことを使うと比較的楽に計算できる。
• 問題1の答:
–
–
–
–
–
–
μ= np = (100)×(1/2) = 50
σ2= npq = (100)×(1/2)×(1-1/2) = 25 = 52
Z=(X-μ)/σ = (X – 50) / 5 とすると
Z1=(40-50)/5 = -2
Z2=(60-50)/5 = +2
標準正規分布曲線の -2 ~ +2 の部分の面積が求める
確率。
– 標準正規分布表(教科書p.295)より
約0.95 (= 0.4772×2)
•
問題2:両側検定と片側検定について以下
の問に答えよ。
(1)両側検定とは何か。
(2)片側検定とは何か。
(3)コインを何回か投げた結果に基づい
て、
コインが正しく作られているかを調べた
い。このときは、両側検定を使うべき
か、
片側検定を使うべきか。
• 問題2のヒント:
教科書のp.163~167をよく読むこと。
両側検定、片側検定の区別、使い分けは
重要なので、何かの機会に一度調べておくこ
とを勧める。
• 問題3:ある人種では4つの血液型を持つ人
の割合が 0.16, 0.48, 0.20, 0.16 であるとい
う。他の人種の人について同様の調査をした
ところ、それぞれの血液型を持つ人が180,
360, 130, 100 人であった。これら人種間で
血液型の人数比は同じといえるか?
• 問題3のヒント:
– カイ2乗検定を利用する。
– 教科書第10章を参照のこと。
– 教科書 p.229 の問題2と同じ。
– 自由度の求め方を覚えると良い。
– カイ2乗分布の表は教科書p.298 。
– (カイ2乗検定は利用価値が高いですので、是非
覚えて使ってください。)
• 問題4:ある図書館での本の貸し出しを調べたら以下
のようになった。「曜日により貸し出し冊数は変わらな
い」かどうか検定せよ。なお、有意水準を5%とせよ。
貸し出
し冊数
月曜
135
火曜
108
水曜
120
木曜
114
金曜
146
• 問題4のヒント:
月曜
火曜
水曜
木曜
金曜
観測値
135
108
120
114
146
理論値
T/5
T/5
T/5
T/ 5
T/5
T=135 + 108 + 120 + 114 + 146
その他
• カイ2乗検定の1つに、分割表(教科書p.225)
があります。便利なので勉強してください。授
業でもやりましたよね!
• カイ2乗検定は、分散分析の特殊な場合と
なっています。分散分析はとても強力な手法
ですので、勉強しましょう。
• 統計は慣れることが大切です。継続的に勉強
してください。理論より実践です。
最後に
• 統計を知っている人と知らない人とでは、今
後大きな差になってきます。統計をすべて勉
強することは無理です。自分に関係のある分
野で、必要なものから慣れていってください。
Good luck!
2つ目のレポート提出忘れないように!