確率と統計

確率と統計
メディア学部2009年
2009年12月17日(木)
確率分布
• 検定を行う際、確率計算が必要になります。
• そのためには、分析対象が従うそれぞれの
確率値の在り様(確率分布)を知り、その
性質・特徴を上手く利用することになります。
東京工科大学 確率と統計2009
P.2
いろいろな確率分布
•
•
•
•
•
•
•
2項分布
正規分布
ポアソン分布
一様分布
χ2分布
t分布
F分布 などなど
2項分布
• 1回の試行で事象Aの起こる確率がpで、
起こらない確率がqとする。このとき、n回
の反復試行で事象Aがk回起こる確率は、
次のようになる。
k
n k
P( X  k )n Ck  p  q (k  1,2,3,, n)
この分布であることを B(n, p) と書くことが
ある。
教科書 p.97 参照のこと
例
• 1枚の硬貨をn回投げる。
2項分布B(n, p)の平均と分散
• 平均 = np
• 分散 = npq
有名かつ便利な公式
教科書 p.101 式 (2) 参照のこと
正規分布
• 測定誤差や身長のデータのヒストグラムを
作ると釣鐘型になる。このときのヒストグラ
ムの形を近似的に表す曲線を正規分布曲
線とい、このときの分布を正規分布という。
正規分布曲線は、平均μと分散σ2できまる
ので、N(μ, σ2 ) と書くことがある。
正規分布
•
•
•
•
分布関数
確率密度関数
正規分布曲線(定義)
正規分布の特徴
正規分布のグラフ
正規分布のグラフ
左右対称
変曲点
ほとんどゼロ
教科書 p.102 図3 参照のこと
正規分布曲線の式
f ( x) 
1
2 
e

2
(x )
2
2
(  x  )
正規分布曲線の式
f ( x) 
標準偏差
1
2 
e

平均
2
(x )
2
2
(  x  )
重要な性質(再)
• 左右対称
• X=σは変曲点(上凸と下凸の変わり目)
• 平均 = 中央値 = モード
他の重要な性質
正規分布のグラフ
68%
正規分布のグラフ
95%
正規分布のグラフ
99.7%
標準化の公式
z
2
N(μ,σ )
x

N(0,1)
標準化の公式
z
x

平均μ、分散σ2
平均ゼロ、分散1
(正規分布)
(標準正規分布)
2
N(μ,σ )
N(0,1)
これについての情報が標準正規
分布表として与えられている。
練習問題
• 問題1: 正しく作られたコインを100回投
げるとき、表が40回から60回出る確率を
求めよ。
• 問題1のヒント:
– コイン投げの繰り返しは2項分布Bとなるので、
定義に従って計算しても良いが、
– 繰り返しの回数が多い場合は、平均がnp、分
散がnpqの正規分布で近似できる。
– このことを使うと比較的楽に計算できる。
• 問題1の答:
–
–
–
–
–
–
μ= np = (100)×(1/2) = 50
σ2= npq = (100)×(1/2)×(1-1/2) = 25 = 52
Z=(X-μ)/σ = (X – 50) / 5 とすると
Z1=(40-50)/5 = -2
Z2=(60-50)/5 = +2
標準正規分布曲線の -2 ~ +2 の部分の面積が求
める確率。
– 標準正規分布表(教科書p.295)より
約0.95 (= 0.4772×2)
•
問題2:両側検定と片側検定について以
下の問に答えよ。
(1)両側検定とは何か。
(2)片側検定とは何か。
(3)コインを何回か投げた結果に基づい
て、コインが正しく作られているかを調べ
たい。このときは、両側検定を使うべき
か、片側検定を使うべきか。
• 問題2のヒント:
教科書のp.163~167をよく読むこと。
両側検定、片側検定の区別、使い分けは
重要なので、何かの機会に一度調べてお
くことを勧める。
• 問題3:ある人種では4つの血液型を持つ
人の割合が 0.16, 0.48, 0.20, 0.16 であ
るという。他の人種の人について同様の
調査をしたところ、それぞれの血液型を持
つ人が180, 360, 130, 100 人であった。
これら人種間で血液型の人数比は同じと
いえるか?
• 問題3のヒント:
–
–
–
–
–
カイ2乗検定を利用する。
教科書第10章を参照のこと。
教科書 p.229 の問題2と同じ。
自由度の求め方を覚えると良い。
カイ2乗分布の表は教科書p.298 。
– (カイ2乗検定は利用価値が高いですので、
是非
覚えて使ってください。)
• 問題4:ある図書館での本の貸し出しを調べたら以下
のようになった。「曜日により貸し出し冊数は変わらな
い」かどうか検定せよ。なお、有意水準を5%とせよ。
貸し出
し冊数
月曜
135
火曜
108
水曜
120
木曜
114
金曜
146
• 問題4のヒント:
月曜
火曜
水曜
木曜
金曜
観測値
135
108
120
114
146
理論値
T/5
T/5
T/5
T/ 5
T/5
T=135 + 108 + 120 + 114 + 146
その他
• カイ2乗検定の1つに、分割表(教科書
p.225)があります。便利なので勉強してく
ださい。授業でもやりましたよね!
• カイ2乗検定は、分散分析の特殊な場合
となっています。分散分析はとても強力な
手法ですので、勉強しましょう。
• 統計は慣れることが大切です。継続的に
勉強してください。理論より実践です。
最後に
• 統計を知っている人と知らない人とでは、
今後大きな差になってきます。統計をすべ
て勉強することは無理です。自分に関係
のある分野で、必要なものから慣れていっ
てください。
練習あるの
み
次回3つ目のレポート課題を提示します.