統計学 第5回 10/26

統計学
10/25(木)
鈴木智也
1
今日の講義の位置づけ
全三部構成
第一部 記述統計:データの特性を記述
第二部 確率論:推測統計への橋渡し
・確率論入門 ← 今はここ!
・確率変数と確率分布
第三部 推測統計:データから全体像を推測
2
確率とは?
• 何が起こるのか前もって分からない時に、
ある事象が起こる確からしさを測る。
⇒事象Aが起こる確率を P(A) と表す。
• 0≦P(A)≦1である。
• 事象Aが確実に起こる時、P(A)=1。
• 事象Aが決して起こらない時、P(A)=0。
3
確率を測る代表的な方法
• 先験的アプローチ
起こり得る結果について、あらゆる場合の
数 n と、ある事象Aの起こる場合の数 nAを
数え上げて計算する。 ⇒ P(A)=nA/n
• 経験的アプローチ
実際にデータを取ってみて、相対頻度(第
3回講義で履修)を確率として代用する。
4
例題:先験的アプローチ
• サイコロを振って、3の目が出る確率は?
⇒サイコロの目は全部で6通り。そのうちの
一つなので、3の目が出る確率は1/6。
• グーを出して、じゃんけんで勝つ確率は?
⇒相手がチョキなら勝ち、グーならあいこ、
パーなら負け、の三通りなので、1/3。
5
先験的と経験的
例:ある金融資産の投資収益率が10%に
なる確率はいくらか?
⇒先験的には分らない。
⇒経験的(実験的)アプローチを使う。
データを取り、そのデータのうち、何回10%
の収益率を記録したかを調べる。
6
例題:経験的アプローチ
• 松井秀喜選手(NYヤンキース)が次の打
席で安打を放つ確率は何%か?
⇒解答例:先シーズンの成績は、629打数で
192安打であった。
⇒安打を放った相対頻度は、192/629=0.305
⇒30.5%と予想される。
7
関連語:余事象
☆余事象の確率
• 「Aではない」という事象をAの余事象とい
い、その確率は 1-P(A) で計算する。
• 例:「松井選手が試合中に少なくとも1安打
を放つ」をAとすれば、その余事象は「松井
選手が試合中に1安打も放たない」になる。
8
確率の性質 ①
☆ 確率の加法定理
• 二つの事象AとBが同時には起こり得ない
時、AとBは互いに「排反」であるという。
• AとBが排反事象の時、AまたはBが起こる
確率は次のように計算できる。
P(A∪B)=P(A)+P(B)。
9
確率の性質 ②
☆確率の乗法定理(続)
• AとBが排反事象ではない場合、
P(A∪B)=P(A)+P(B)-P(A∩B)
ただし、P(A∩B)はAとBが同時に起こる確
率である。
⇒P(A∩B)についての計算規則は?
10
条件つき確率(準備)
• 阪神タイガースの今季の勝率は0.617。
⇒次の試合で勝つ確率は61.7%。
↑相手がどこかは関係ない(無条件)
では、相手が中日なら阪神の勝率は?
⇒中日との対戦成績は今季11勝11敗。
⇒中日に勝つ確率は50%。(条件つき確率)
11
条件つき確率(公式)
• Bが起こった場合に、Aが起こる確率は
P(A|B)と表す。
超重要な公式:P(A|B)=P(AB)/P(B)。
⇒変形:P(AB)=P(A|B)×P(B)
ここで、P(AB)はABが同時に起こる確率。
また、P(B)をAの「周辺確率」と呼ぶ。
12
公式の項目の説明
事象W:阪神が勝つ
事象D:対戦相手が中日になる
P(W|D):対戦相手が中日だと決まってい
る場合に、阪神が勝つ確率
P(WD):対戦相手が中日になり、なおかつ
阪神が勝利を挙げる確率
P(D):対戦相手が中日になる確率
13
公式の使用例
• 対戦相手は11チームの一つ。
⇒ P(D)=1/11=0.091 (9.1%)
• 昨季の中日戦22試合中11勝。
⇒ P(W|D)=11/22=0.5 (50%)
• 阪神の対戦相手が中日に決まって、なお
かつ勝つ確率。
⇒ P(WD)=0.091×0.5=0.045 (4.5%)
14
重要:ベイズ定理
• 阪神勝利のニュースから、対戦相手が中
日だった確率(事後確率)を推測すると
公式より、P(WD)=P(W|D)×P(D)。
⇒P(WD)=P(D|W)×P(W)とも書ける。
⇒定理: P(D|W)=P(WD)/P(W)。
↑使い方については練習問題を参照。
15