統計の基礎 第9回 確率の基礎/二項分布 6月17日 確率の基礎 【目標】 • 確率の考え方を理解し、確率を求める方法を 習得する。 【構成】 1.はじめに(確率の把握) (1)日常的確率の理解 (2) 確率の把握 (3)統計と確率 2.確率の諸用語 (1)用語 (2)ベン図 3.確率の公式 (1) 公理 (2) 定理 (3)ベイズの定理 1.はじめに(確率の把握) (1) 日常的確率の理解 • 相対度数で判断 ・・・コイン、サイコロの例から • 全体で100% • 「100p%」の表記 (2) 確率の把握 ①理論的確率 • 事象の頻度の計測 ・・・限度あり • 標本空間の全事象を数え上げそれぞれが等 しく起こるとする 「同様に確からしい」を根拠とする ②実験的確率(体験的確率) • 結果としての比率 ・・・・毎回異なる • 実験を無限に繰り返した場合に近づく値→確率 • 日常的には困難 大規模調査・実験の繰返し 近年では大量の情報収集 ③主観的確率 • ヒューリスティックな判断 カン、期待 例えばギャンブラーの判断 ※確率は直感的には分からない • 説明しても、説明者と同じ理解構造にならな いと通じない • 一旦、理解したと思っても、しばしば分からな くなる ※確率は直感では分らない ・ベースレート問題 • 40歳の女性が乳がんにかかる確率は1%。 • 乳がん患者が、X線検査で陽性になる確率は 90%である。 • 乳がんではなかったとして、それでも検査結 果が陽性になる確率は9%である。 • あなたの検査結果が陽性と出た場合、実際 に乳がんである確率は? ・現在像の誤解 • 対等な個別事象を識別できない (理論的判断も容易でない) モンティホール問題 3人の囚人問題 モンティホール問題 • 3つのドア、後に車、ヤギ、ヤギ • あなたは1つのドアを選択 • 後を知っている司会者が残りのドアのうちヤ ギのドアを開く • あなたは選択を変えるか 3人の囚人問題 • 王様の結婚により、3人の死刑囚のうち一人に恩 赦、無作為に選出・・・1/3 • 囚人が、看守から他の囚人のうち恩赦にならない 者の名前を聞く。 • 恩赦にならないのは、 他の一人の囚人か自分・・・・・1/2? ・条件設定の曖昧さ • 二人とも女の子の確率 無条件 上は女 1人は女 ・ヒューリスティックな判断_1 具体的な内容の選択 どちらの災害がより起きそうか • a.「1000人が津波で死亡する東海大地震」 • b.「1000人が死亡する日本国内での大地震」 ・ヒューリスティクな判断_2 (人間的で必ずしも合理的でない)な 判断をしがち • 負け続けのギャンブラー • 勝ち続けのギャンブラー • 宝くじの購入(?) 今後こそは 今度も ・ビッグ・データの危うさ DNAの一致による犯人断定 • 一致は10万人に一人 • 犯人に間違いないと考えてよいか • この都市の人口は100万人 ※検討の歴史は古くない ・・・不確実性を計測する発想は新しい • ギリシャ・ローマでは発展しなかった • カルターノ「偶然のゲームに関する書」16世紀 • カール・ピアソン 19世紀 (3) 統計と確率 • 統計は確率の問題であり、 かなり外れることもある 2.確率の諸用語 (1) 用語 • 事象 偶然性を伴う実験の結果 例えば、コイン投げの結果 • 根元事象 それ以上細分できない単一の事象 • 複合事象 2回のコイン投げなど • 標本空間 事象を検討する場 • 全体集合 起こりうるすべての結果(事象)の集合 { } • 部分集合 • 排反 同時に起こらない事象(の集合) • 試行 • • • • 余事象 A’⇒ A∪A’全体集合 和事象 ∪ cup 積事象 ∩ cap (同時確率) 空事象φ A∪A’ 3.確率の公式 (1) 公理 ①0≦Pr(A)≦1 ②Pr(Ω)=1 範囲 0~1 総和 排反事象の総和=1 ③A∩B=φ ⇒ Pr(A∪B)=Pr(A)+Pr(B) 生起確率=根元事象の総和 (2) 定理 ①加法 Pr(A∪B)=Pr(A)+Pr(B)-Pr(A∩B) ②条件付き確率 Pr(B│A)=Pr(A∩B)/Pr(A) ③乗法 • Pr(A∩B)=Pr(B│A)*Pr(A) • ツリーダイアグラム 枝分かれした事象の確率を乗法で求めていく (3)ベイズの定理 • ある事象が起こった時の 特定の原因が起こった(起こっている)確率 • Pr(A│B)=Pr(A)*Pr(B│A)/Pr(B) 3つの確率が分かっている場合に最 後の確率をみつけだす • 40歳の女性が乳がんにかかる確率は1%。 • 乳がん患者が、X線検査で陽性になる確率は90% である。 • 乳がんではなかったとして、それでも検査結果が 陽性になる確率は9%である。 • あなたの検査結果が陽性と出た場合、実際に乳が んである確率は? • A;健康者、 'A;患者 • B;陽性、 'B;陰性 • P(A)=健康者比率=99% • P(B│A)=健康者陽性比率=9% • P(B)=陽性比率=健康者比率×健康者陽性 比率+患者比率×患者陽性比率 =99%×9%+(1-99%)×90% • 陽性者健康比率 = P(A│B) =P(A)・P(B│A)/P(B) =(99%×9%)/( 99%×9%+(1-99%)×90%) =90.8% 二項分布 【目標】 • ベルヌーイ試行の確率について考えるとともに、 Excelでのシミュレーションを理解する。 【構成】 1.ベルヌーイ試行 2.ツリー図から確率を考える 3.順列組合せから確率を求める 4.Excelによる確率計算とシミュレーション 1.ベルヌーイ試行 • 結果が二種類のみの試行 (これを繰り返す試行) 例 コイントスの表・裏 サイコロで奇数・偶数 サイコロで2以下・3以上 紅白玉の抜出しで紅・白 一般に特定の結果が起こる確率をpとし、 他の結果の確率をq=1-pとする。 説明上、片方の結果を「成功」、 他方を「不成功」と表現する。 2.ツリー図から確率を考える • 試行毎に枝分かれするツリーを描く • 確率の検討は、根元事象を数え上げることが 基本。 • 各枝端に達する確率は p^i*q^(n-i) 3.順列組合せから確率を求める • 一定回数の試行を何度も繰り返した場合で、 成功がi回の場合の確率 →成功がi回となる枝を数える • 繰返し回数n個の数からi個取り出す 組合せの数に相当 • 階乗 n! • 順列 n個の数の並べ方 n! • n個の内i個だけの数の並べ方 →後部のn-i個の枝別れを落す n!/(n-i)! • i個の組合せ→i個の並べ方 i! • n個のうちi個の組合せ方 n!/((n-i)!*i!) • 求める確率 n!/((n-i)!*i!)*p^i*q^(n-i) • この確率の分布 → 二項分布 Excel_File (binomdist.xlsx) 4.Excelによる確率計算と シミュレーション →Excel_file 二項分布シミュレーショ(ex091_1.xlsx) • 確率計算・・・理論確率 n!/((n-i)!*i!)*p^i*q^(n-i) に値を入れ ヒストグラムを作成する • n!/((n-i)!*i!) →BINOMDIST(成功数、試行回数、成功確率、形式) 形式 0;確率密度、1;累積確率 シミュレーション・・・実験確率 • 成功の場合1、不成功の場合0を出す 乱数 RAND() [0.1)の値 F9キーで再計算 確率pで成功 INT(RAND()+p) • 一定回数並べ成功の回数を数える SUM() • 一定回数の試行を多数回繰返し成功回数の 出現頻度を数える COUNTIF() • ヒストグラムを描く • 試行の繰返し回数をできるだけ増やす 【提出課題】 6月17日出題 • 一定回数のベルヌーイ試行を繰り返すシミュ レーションを行い、成功回数のヒストグラムを 描く。 【時間末レポート】 6月17日 • サイコロを振り、 出た目を二乗した得点が当たる試行を繰り返し た場合に 期待される平均値を求めてください。 • (計算過程も明記すること。)
© Copyright 2024 ExpyDoc