統計の基礎 第5回 各種統計量 5月27日

統計の基礎
第9回
確率の基礎/二項分布
6月17日
確率の基礎
【目標】
• 確率の考え方を理解し、確率を求める方法を
習得する。
【構成】
1.はじめに(確率の把握)
(1)日常的確率の理解
(2) 確率の把握
(3)統計と確率
2.確率の諸用語
(1)用語
(2)ベン図
3.確率の公式
(1) 公理
(2) 定理
(3)ベイズの定理
1.はじめに(確率の把握)
(1) 日常的確率の理解
• 相対度数で判断
・・・コイン、サイコロの例から
• 全体で100%
• 「100p%」の表記
(2) 確率の把握
①理論的確率
• 事象の頻度の計測
・・・限度あり
• 標本空間の全事象を数え上げそれぞれが等
しく起こるとする
「同様に確からしい」を根拠とする
②実験的確率(体験的確率)
• 結果としての比率
・・・・毎回異なる
• 実験を無限に繰り返した場合に近づく値→確率
• 日常的には困難
大規模調査・実験の繰返し
近年では大量の情報収集
③主観的確率
• ヒューリスティックな判断
カン、期待
例えばギャンブラーの判断
※確率は直感的には分からない
• 説明しても、説明者と同じ理解構造にならな
いと通じない
• 一旦、理解したと思っても、しばしば分からな
くなる
※確率は直感では分らない
・ベースレート問題
• 40歳の女性が乳がんにかかる確率は1%。
• 乳がん患者が、X線検査で陽性になる確率は
90%である。
• 乳がんではなかったとして、それでも検査結
果が陽性になる確率は9%である。
• あなたの検査結果が陽性と出た場合、実際
に乳がんである確率は?
・現在像の誤解
• 対等な個別事象を識別できない
(理論的判断も容易でない)
モンティホール問題
3人の囚人問題
モンティホール問題
• 3つのドア、後に車、ヤギ、ヤギ
• あなたは1つのドアを選択
• 後を知っている司会者が残りのドアのうちヤ
ギのドアを開く
• あなたは選択を変えるか
3人の囚人問題
• 王様の結婚により、3人の死刑囚のうち一人に恩
赦、無作為に選出・・・1/3
• 囚人が、看守から他の囚人のうち恩赦にならない
者の名前を聞く。
• 恩赦にならないのは、
他の一人の囚人か自分・・・・・1/2?
・条件設定の曖昧さ
• 二人とも女の子の確率
無条件
上は女
1人は女
・ヒューリスティックな判断_1
具体的な内容の選択
どちらの災害がより起きそうか
• a.「1000人が津波で死亡する東海大地震」
• b.「1000人が死亡する日本国内での大地震」
・ヒューリスティクな判断_2
(人間的で必ずしも合理的でない)な
判断をしがち
• 負け続けのギャンブラー
• 勝ち続けのギャンブラー
• 宝くじの購入(?)
今後こそは
今度も
・ビッグ・データの危うさ
DNAの一致による犯人断定
• 一致は10万人に一人
• 犯人に間違いないと考えてよいか
• この都市の人口は100万人
※検討の歴史は古くない
・・・不確実性を計測する発想は新しい
• ギリシャ・ローマでは発展しなかった
• カルターノ「偶然のゲームに関する書」16世紀
• カール・ピアソン 19世紀
(3) 統計と確率
• 統計は確率の問題であり、
かなり外れることもある
2.確率の諸用語
(1) 用語
• 事象
偶然性を伴う実験の結果
例えば、コイン投げの結果
• 根元事象
それ以上細分できない単一の事象
• 複合事象
2回のコイン投げなど
• 標本空間
事象を検討する場
• 全体集合
起こりうるすべての結果(事象)の集合 { }
• 部分集合
• 排反
同時に起こらない事象(の集合)
• 試行
•
•
•
•
余事象 A’⇒ A∪A’全体集合
和事象 ∪ cup
積事象 ∩ cap (同時確率)
空事象φ A∪A’
3.確率の公式
(1) 公理
①0≦Pr(A)≦1
②Pr(Ω)=1
範囲 0~1
総和 排反事象の総和=1
③A∩B=φ ⇒ Pr(A∪B)=Pr(A)+Pr(B)
生起確率=根元事象の総和
(2) 定理
①加法
Pr(A∪B)=Pr(A)+Pr(B)-Pr(A∩B)
②条件付き確率
Pr(B│A)=Pr(A∩B)/Pr(A)
③乗法
• Pr(A∩B)=Pr(B│A)*Pr(A)
• ツリーダイアグラム
枝分かれした事象の確率を乗法で求めていく
(3)ベイズの定理
• ある事象が起こった時の
特定の原因が起こった(起こっている)確率
• Pr(A│B)=Pr(A)*Pr(B│A)/Pr(B)
3つの確率が分かっている場合に最
後の確率をみつけだす
• 40歳の女性が乳がんにかかる確率は1%。
• 乳がん患者が、X線検査で陽性になる確率は90%
である。
• 乳がんではなかったとして、それでも検査結果が
陽性になる確率は9%である。
• あなたの検査結果が陽性と出た場合、実際に乳が
んである確率は?
• A;健康者、 'A;患者
• B;陽性、 'B;陰性
• P(A)=健康者比率=99%
• P(B│A)=健康者陽性比率=9%
• P(B)=陽性比率=健康者比率×健康者陽性
比率+患者比率×患者陽性比率
=99%×9%+(1-99%)×90%
• 陽性者健康比率
= P(A│B)
=P(A)・P(B│A)/P(B)
=(99%×9%)/( 99%×9%+(1-99%)×90%)
=90.8%
二項分布
【目標】
• ベルヌーイ試行の確率について考えるとともに、
Excelでのシミュレーションを理解する。
【構成】
1.ベルヌーイ試行
2.ツリー図から確率を考える
3.順列組合せから確率を求める
4.Excelによる確率計算とシミュレーション
1.ベルヌーイ試行
• 結果が二種類のみの試行
(これを繰り返す試行)
例
コイントスの表・裏
サイコロで奇数・偶数
サイコロで2以下・3以上
紅白玉の抜出しで紅・白
一般に特定の結果が起こる確率をpとし、
他の結果の確率をq=1-pとする。
説明上、片方の結果を「成功」、
他方を「不成功」と表現する。
2.ツリー図から確率を考える
• 試行毎に枝分かれするツリーを描く
• 確率の検討は、根元事象を数え上げることが
基本。
• 各枝端に達する確率は
p^i*q^(n-i)
3.順列組合せから確率を求める
• 一定回数の試行を何度も繰り返した場合で、
成功がi回の場合の確率
→成功がi回となる枝を数える
• 繰返し回数n個の数からi個取り出す
組合せの数に相当
• 階乗 n!
• 順列 n個の数の並べ方 n!
• n個の内i個だけの数の並べ方
→後部のn-i個の枝別れを落す n!/(n-i)!
• i個の組合せ→i個の並べ方 i!
• n個のうちi個の組合せ方 n!/((n-i)!*i!)
• 求める確率
n!/((n-i)!*i!)*p^i*q^(n-i)
• この確率の分布
→ 二項分布 Excel_File (binomdist.xlsx)
4.Excelによる確率計算と
シミュレーション
→Excel_file 二項分布シミュレーショ(ex091_1.xlsx)
• 確率計算・・・理論確率
n!/((n-i)!*i!)*p^i*q^(n-i) に値を入れ
ヒストグラムを作成する
• n!/((n-i)!*i!)
→BINOMDIST(成功数、試行回数、成功確率、形式)
形式 0;確率密度、1;累積確率
シミュレーション・・・実験確率
• 成功の場合1、不成功の場合0を出す
乱数 RAND() [0.1)の値 F9キーで再計算
確率pで成功 INT(RAND()+p)
•
一定回数並べ成功の回数を数える
SUM()
• 一定回数の試行を多数回繰返し成功回数の
出現頻度を数える
COUNTIF()
•
ヒストグラムを描く
• 試行の繰返し回数をできるだけ増やす
【提出課題】 6月17日出題
• 一定回数のベルヌーイ試行を繰り返すシミュ
レーションを行い、成功回数のヒストグラムを
描く。
【時間末レポート】 6月17日
• サイコロを振り、
出た目を二乗した得点が当たる試行を繰り返し
た場合に
期待される平均値を求めてください。
• (計算過程も明記すること。)