富山大学知能情報工学科 「統計学」第4回 ホーエル『初等統計学』 第3章 確率(前半) 高 尚策 (コウ ショウサク) 准教授 Email: [email protected] 前回演習問題の答え • 課題1 (1)標本分散の変形: 1 1 2 2 2 ( X X ) ( X i i 2X i X X ) n 1 n 1 1 2 ( X i 2 X i X X 2 ) (2行目) n 1 1 2 2 ( X i 2 X X i nX ) (3行目) n 1 2 1 2 ( X 2 n X nX 2 ) (4行目) i n 1 1 2 ( X i nX 2 ) (5行目) n 1 1 1 2 { X n ( X i )2} i (6行目) n 1 n 1 1 2 { X i ( X i ) 2 } n 1 n 前回演習問題の答え (2)偏差平方和をnで割る場合の,分散の定義式の変形: (2行目) (3行目) (4行目) (5行目) 1 1 2 2 2 ( X X ) ( X 2 X X X ) i i i n n 1 2 ( X i 2 X i X X 2 ) n 1 2 2 ( X i 2 X X i nX ) n 2 1 2 ( X i 2nX nX 2 ) n 1 2 ( X i nX 2 ) n 1 2 X i X 2 n この式は,偏差平方和をn - 1で割る不偏分散を求めるときにも使うことができる.データ からこの式で分散を計算した後,その値をn倍して(これで,nで割る前に戻る),あらため てn - 1で割ればよい.「2乗の平均-平均の2乗」という式は覚えやすいので,これは有 用な計算方法である. 前回演習問題の答え 課題2 章末問題29のデータを用いて,度数分布表に 分類されたデータから分散の計算を行おう。 元の観測値 階級境界値と 階級の幅を設定する 度数分布表 最大値:31.6 最小値:7.6 階級境界値を設定する際の工夫: • 測定単位よりもひとつ下の桁で境界値を設定するのは、ちょうど境界値をとったデータ をどちらの階級に入れるか迷わないようにするための工夫である。 • 測定単位の桁で境界値を設定してもよい。 前回演習問題の答え 課題2 章末問題29のデータを用いて,度数分布表に 分類されたデータから分散の計算を行おう。 度数分布表 分類されたデータに対する分散の計算公式 1 k x xi f i n i 1 1 k 2 s ( x x ) fi i n 1 i 1 2 1.序節 統計の授業なのに確率? • 統計的な問題に対する解は確率的な表現に よって与えられる. • 母集団から標本を無作為抽出すれば,標本 においてどのような統計量(平均,分散など) が得られるかは,確率的に決まる. – 第4章以降での基本的考え方 • 近年注目されているベイズ統計学は,第3章 で学習するベイズの定理が基本. 確率 P ある結果が必ず起きる … 確率 P = 1 決して起きない … 確率 P = 0 起きるか起きないか不確実 … 0 < 確率 P < 1 例:天気予報「明日雨が降る確率 30%」 P=0.3 意味:「明日雨が降る」という予想 それが当たる確率 P = 0.3 客観的側面 (頻度論) 同条件で何度も繰り返した時、その予想が当たって いる割合。(実際には同一条件の繰り返しは困難) 主観的側面 その予報の信頼度 学習目標 • 確率に関する概念を理解する. – – – – – – • • • • 試行 (trial) 標本空間 Ω (sample space) 事象 E (event) 単一事象 (simple event) 複合事象 (composite even) 事象演算 確率の公理 排反の概念と,加法定理を理解する. 条件つき確率と,乗法定理を理解する. 独立事象の概念を理解する. 2.標本空間 • 同一の条件のもとで繰り返し行うことのできる「実 験」を考える. – 例:コインを2回投げて,表および裏の系列を観察する. – 同一の条件のもとで繰り返されることが前提とされてい る実験や観察において,1つの事象を生起させる過程 を試行(trial)という.芝・渡部・石塚『統計用語辞典』(新曜社) – つまり、ある 1 回または 1 組の実験や現象。 – コインを2回投げる実験での,1回のコイン投げ. • 標本空間( sample space):実験における可能 な結果を表す点(「標本点」と呼ぶ)全体の集 合のこと. 「Ω」で表す. • 個々の可能な結果を単一事象(simple event) あるいは根元事象(original event)と呼ぶ. 「ei」で表す – 例:2回のコイン投げでの,表と裏の系列. – ややこしいことに,1回の試行の結果も事象と呼 ばれる.何を観察するかである. • Ω = { e1 , e2, … } • 例:1枚の硬貨を2回投げる実験において,可能な結 果は,HH, HT, TH, TT の4通り.これらの結果をそれぞ れひとつの点で表す. HH HT TH TT e1 e2 e3 e4 𝜴={HH, HT, TH, TT} ={e1, e2, e3, e4} 2つのサイコロの目の標本空間 • 例:2つのサイコロ … 6×6 = 36個の根元事象 ( 1, 6 ) ( 2, 6 ) ( 3, 6 ) ( 4, 6 ) ( 5, 6 ) ( 6, 6 ) ( 1, 5 ) ( 2, 5 ) ( 3, 5 ) ( 4, 5 ) ( 5, 5 ) ( 6, 5 ) ( 1, 4 ) ( 2, 4 ) ( 3, 4 ) ( 4, 4 ) ( 5, 4 ) ( 6, 4 ) ( 1, 3 ) ( 2, 3 ) ( 3, 3 ) ( 4, 3 ) ( 5, 3 ) ( 6, 3 ) ( 1, 2 ) ( 2, 2 ) ( 3, 2 ) ( 4, 2 ) ( 5, 2 ) ( 6, 2 ) ( 1, 1 ) ( 2, 1 ) ( 3, 1 ) ( 4, 1 ) ( 5, 1 ) ( 6, 1 ) • 確率の問題では,適切な標本空間を構成す ることが基本. – 可能な結果一覧を表現する. – 1回の実験(試行)で,いずれかひとつの単一事 象だけが生じる. • 少し複雑な問題では,標本点を図示するのに, 樹形図(テキスト p.58,確率の木)を用いると よい.あとで具体例を示す. • 2回の試行の標本空間は,2次元で表現する こともできる. – 例:章末問題2 赤(R),黒(B),緑(G)球が 1個ずつ入った箱から,2個 の球を取り出すときの標本空 間. (1度取り出した球は箱に戻さ ない) G B R R B G • 練習問題 黒球が2個、白球が1個入った箱がある。この箱か ら同時に2個の球を取り出す実験で、 (a)6個の標本点を用いる標本空間、 (b)3個の標本点を用いる標本空間、をつくれ (答え) W B2 W B1 B B1 B2 (a) W B W (b) 3.(単一)事象の確率 • 標本空間を構成したら,各点に確率(probability)を付与する. • 実験を繰り返したとき,全実験回数に対する,特定の単一事象 が生起した割合を考えることができる.これをその単一事象の相 対度数(relative frequency)と呼ぶ.すべての単一事象にわたっ て相対度数を合計すると1になる. • ある単一事象が生起する,経験的あるいは理論的な相対度数を, その単一事象の確率とする.標本点 e1 に付与された確率を P(e1) で表す. • 標本空間を構成する n 個の単一事象の生起頻度(相対度数)が すべて同じ(「同様に確からしい」)と考えられるならば, 1 P(ei ) n (i 1,2,, n) • 例:1枚の硬貨を2回投げる実験において, 起こりうる結果は,HH, HT, TH, TT の4通り.こ の実験を何度も繰り返し行えば,それぞれの 結果が生じる相対度数は ¼ となるだろう.そ こで,それぞれの事象に確率 ¼ を付与する. HH HT TH TT e1 e2 e3 e4 𝑃 𝑒1 = 1 4 𝑃 𝑒2 1 = 4 𝑃 𝑒3 = 1 4 𝑃 𝑒4 = 1 4 4.複合事象の確率 • 単一事象の集まりを複合事象(composite event)と呼ぶ. • 複合事象 A がおこる確率は,A を構成している単一事象の確率 の和である.(テキストp.42) 例:硬貨を3枚投げた時,表が2回出る確率 P(A) を考える. 標本空間を構成する8つの単一事象のうち,これに該当する のは,HHT, HTH, THHの3つ.それぞれの単一事象の確率は 1/8 だから, HHH HHT HTH THH HTT THT TTH TTT e1 e2 e3 e4 e5 1 1 1 3 P( A) 8 8 8 8 e6 e7 e8 • 事象(event) : 標本空間Ωの部分集合 例:サイコロ投げを考えよう.ただし, Ω ={1, 2, 3, 4, 5, 6}とする. このとき,サイコロを投げたときに偶数の目が出る事象Eとは,サ イコロ投げによって得られた結果(サイコロの目)(ei ) が, ei ∈ E={2, 4, 6}を満たすことをいう Ω • 事象の演算 E Ω Ω Ω E Ω E E E 𝐸∪𝐹 F𝐹 𝐸∩ 𝐸−𝐹 F F F (事象)例:「統計学」でどのような成績(評点)が得ら れるか,その確率的な情報も含めて議論をしたい. 情報科学類では「履修放棄(X)は評点には用いてはならな い」とされていることを反映させると, 標本空間Ω ={A+,A,B,C,D}となる. このとき,「統計学の単位が取れる」という事象Eは, E ={A+,A,B,C}と表すことができる. 「評点B以下は良い成績とはみなさない」という人で あれば,「良い成績で単位が取れる」という事象Fは, F = {A+, A}と表すことになる. • 2つの事象 E と Fが,一方が起これば他方は決して起こらないとい う性質をもつとき,これらの事象は互いに排反(mutually exclusive) であるという. つまり、E∩ 𝐹=∅ 事象E = { e1 (E) , e2 (E), … } ⊂ Ω • 標本空間 Ω の任意の部分集合。 例:目の和が奇数 E = { (1, 2), (2,1), …, (5, 6) } 目の和が偶数 F={ (1, 1), (3,1), …, (6, 6) } EとFは互いに排反 2つのサイコロの目の標本空間 ( 1, 6 ) ( 2, 6 ) ( 3, 6 ) ( 4, 6 ) ( 5, 6 ) ( 6, 6 ) 事象 E の起きる 確率 P(E) = 事象 E を構成する各根元事象の確率の和 P(E) = P(e1 (E)) + P(e2 (E)) + … 例: 1/36 + … + 1/36 = 18/36 = 1/2 ( 1, 5 ) ( 2, 5 ) ( 3, 5 ) ( 4, 5 ) ( 5, 5 ) ( 6, 5 ) ( 1, 4 ) ( 2, 4 ) ( 3, 4 ) ( 4, 4 ) ( 5, 4 ) ( 6, 4 ) ( 1, 3 ) ( 2, 3 ) ( 3, 3 ) ( 4, 3 ) ( 5, 3 ) ( 6, 3 ) ( 1, 2 ) ( 2, 2 ) ( 3, 2 ) ( 4, 2 ) ( 5, 2 ) ( 6, 2 ) ( 1, 1 ) ( 2, 1 ) ( 3, 1 ) ( 4, 1 ) ( 5, 1 ) ( 6, 1 ) 確率の定義について (1) 数学的確率 ある試行において,同程度の確からしさで起こることが期待される 場合の数をN,そのうち,あることがらAが起こる場合の数をrとする とき, r/Nを「Aが起こる確率」という. 【前提】1.Nは有限確定 2.試行の結果として起こり得る各場合は,「同程度の確から しさ」を持つ 例1)「正しく作られたサイコロ」を振ったときに「1の目が出る確率 は1/6」である. 例2)成田からフランクフルトへ向かう直行便に乗ることになった.航空 機がハイジャックされることを恐れる人にとっては,自分が乗る便がハ イジャック「される」,「されない」の2通りの場合がある.だからとい って,「これから乗るフランクフルト行き直行便がハイジャックされる 確率は1/2である」といってよいだろうか? 確率の定義について (2)統計的確率 n回の試行に対してAの起こる相対度数r/nを考える.nを 十分大きくしていくとき, r/nがほぼ一定値pに近づくな らば,pを「Aが起こる確率」という. 【前提】同一条件の下で,何度でも反復して「Aが起こる か否か」を試すことが許される (問題)1.どれくらいのnであれば「十分大きい」とい えるのだろうか? 2.n → ∞ のとき,r/n → p となる保証はあるのだろうか? (これについては,「大数の法則」で詳述する) 確率の公理(コルモゴロフ) [公理1] 任意の事象 E⊂Ω について 0 ≦ P(E) ≦ 1 (万が一、百万人に1人 → 値の標準化) [公理2] P(Ω) = 1 (必ず一つの根元事象が起きること = 書き忘れている根元事象が無いこと) [公理3] 5.加法定理 • 加法定理(addition rule):2つの事象 Aと B が 互いに排反ならば, 𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃(𝐵) 条件つき確率 • ある特定の事象 A1 が起きた時に,事象 A2 が 起こる条件つき確率(conditional probability ) を P(A2|A1) と表わす. • 標本空間を構成する単一事象の確率がすべ て等しいとき,事象 A1 に該当する単一事象 の数を n(A1) ,事象 A1 と A2 の両方に該当す る単一事象の数を n(A1 and A2) とすると, n( A1 and A2 ) P( A2 | A1 ) n( A1 ) 積事象の確率と乗法定理 • 確率 P(A1) と,条件つき確率 P(A2|A1)がわ かっているとき,積事象の確率 P(A1 ∩A2)を求 めることができる. • 乗法定理(multiplication rule): 𝑃 𝐴1 ∩ 𝐴2 = 𝑃(𝐴1 ) × 𝑃(𝐴2 |𝐴1 ) A1 を時間的あるいは概念的に先行する事象にす ると考えやすい. 条件つき確率:例 箱の中から球を ひとつ取り出す 1 P(1番 |白玉) 3 1 2 2 1 2 2 2 1 P(1番 | 青玉) 4 もとの標本空間とは分母が異なる! 例題 • 10本のくじのうち,3本があたりである.Aさ んが最初にくじをひき,つぎにBさんがくじを 引く.Bさんがあたりくじを引く確率はいくつか. 引いたくじは元には戻さないものとする. 例題の標本空間 10本のくじのうち,3本があたりである.Aさんが最初にくじをひき, つぎにBさんがくじを引く. 引いたくじは元には戻さないものとする Bの結果 あたり 4つの事象は 互いに排反 はずれ Aの結果 あたり はずれ • この例題で,10本のくじすべてを区別した場 合は,90個の標本点を含む標本空間が構成 される. – 各標本点に付与される確率は 1/90 • ここで提示した標本空間は,90個の点を含む 標本空間において,区別しない点をまとめた ものと考えられる.(章末問題7参照) – それぞれの標本点に付与される確率は,まとめ られた点の数に対応する. 加法定理 3 2 7 3 3 P 10 9 10 9 10 「Aあたり,Bあたり」 「Aはずれ,Bあたり」 互いに排反 P(Bあたり|Aあたり)=2/9 P(Bあたり|Aはずれ)=3/9 条件つき確率 「Aあたり,Bあたり」 「Aはずれ,Bあたり」 3 2 7 3 3 P 10 9 10 9 10 加法定理 乗法定理 P(Bあたり) =P(Aあたり ∩ Bあたり) + P(Aはずれ ∩ Bあたり) = P(Aあたり)P(Bあたり|Aあたり)+P(Aはずれ)P(Bあたり|Aはずれ) 樹形図(確率の木)での標本空間 3/10 7/10 2/9 Bあたり 7/9 Bはずれ 3/9 Bあたり 6/9 Bはずれ Aあたり Aはずれ 「合計が1」になっているのはどこ? 樹形図 乗法定理 条件つき確率 2/9 3/10 7/10 Aあたり 3/10 * 2/9 Bはずれ 3/10 * 7/9 3/9 Bあたり 7/10 * 3/9 6/9 Bはずれ 7/10 * 6/9 7/9 Aはずれ Bあたり 「合計が1」になっているのはどこ? 3 2 3 7 7 3 7 6 6 + 21 + 21 + 42 × + × + × + × = =1 10 9 10 9 10 9 10 9 90 樹形図の描き方 • 特定の場面で生じるすべての事象の枝を描く. – 枝分かれの繰り返しは時間順.あるいは考えや すさの順. – 次回学習するベイズの定理では,最初に「仮説」 で分岐させ,次に「データ」で分岐させる. • 記入するもの – 事象のラベル – その事象が生じる条件つき確率 独立な事象 • 2つの事象 A1,A2について,一方の事象の生 起が,もう一方の事象の生起に影響しないと き,これら2つの事象は独立(independent)で あるという. – 模擬試験の判定と,入試結果は独立ではない. – 入試の朝にコインを投げる.コインの裏表と,入 試結果は独立である. 「確率論」と「力学」は一般には異なる学問体系に属する科目 である.両科目に対する学生の嗜好や興味を持つ(持たない) 理由も同一ではないのがふつうであろう.したがって,「確率論」 の試験で優秀な成績をおさめることが,「力学」の試験で優秀 な成績をおさめることを意味することはない.すなわち,「確率 論」でよい成績を修めることと,「力学」でよい成績を修めること は,独立事象であると考えてもよい. 「確率論」を担当しているI教授が茶目っ気を起こして,今年の 「確率論」の試験問題は,今年度の「力学」の講義内容に即した 応用問題の文脈で作成してみようと考えたなら,話は別である. そのような「確率論」の試験問題は,「力学」が得意な学生にとっ ては願ってもないものであろう.試験後に成績を調べたとき,ま だ「確率論」の成績が入力されていないものの「力学」の評点が 「A」となっていることが確認できれば,やがて「確率論」の評点欄 に「A」が記載される可能性は高いと期待できよう.すなわち,「確 率論」で好成績を修めることと,「力学」で好成績を修めることが 独立事象であるとは考えにくい. 独立な事象の乗法定理 • 2つの事象が独立ならば,条件つき確率を考 えるときでも,条件を考慮する必要がない. 𝑃 𝐴2 𝐴1 = 𝑃(𝐴2 ) • 独立な事象の乗法定理 𝑃 𝐴1 ∩ 𝐴2 = 𝑃 𝐴1 𝑃(𝐴2 ) 排反と独立 • 事象の排反と独立を混同しないように! – 排反:2つの事象が同時には生じないこと – 独立:一方の事象の生起が,もう一方の事象の 生起に影響しない(情報を与えない)こと. • 2つの事象 A,B が排反ならば,これら2つの 事象は独立ではない. – A が生じたという情報が,B の生起に関する情報 を与えている.A と B が排反ならば,P(B|A)= 0 で ある.P(B)≠ 0 ならば,P(B|A) ≠ P(B). 補足:確率の性質 確率の性質: 証明(1) 確率の性質: 証明(2) 演習課題 課題1: (事象の演算に関する) A,B,Cを三つの事象とする.次の各場合を表す式を書け. 例)Aだけが起こる. 答え)A ∩ 𝐵c ∩ 𝐶 c 説明)Aは起きるが、B,Cは起きないから 1 )A,Bが起きるがCは起こらない. 2 )少なくとも一つが起こる. 3 )少なくとも二つが起こる. 4 )一つだけが起こる. 5 )二つ起こるが三つともは起こらない. 演習課題 課題2: (条件つき確率に関する) A君は一目惚れの彼女に熱烈な手紙を出したが遂に返事は こなかった.ただし出した先は,私信を検閲することで悪 名高い女子寮である。このとき,検閲に引っかかって彼女 の手に渡らない確率は30%,彼女がそれを見て好意を抱 いてくれても羞恥心から返事を書かない確率は70%,見 ても一笑してくずかごに投げ込む確率は50%だとする. A君には何%の割合で望みが残されているだろうか. 名前と学籍番号をご記入のうえ、解答用紙(A4)を提出する。 提出先:工学部大学院棟7階 締め切り時間: NO.7708室のドアのポストに入れてください 来週月曜日(5月18日) 午後5時まで
© Copyright 2024 ExpyDoc