確率の考え方の基礎 二項分布と正規分布 2006年1月25日 作成:本間聡 アウトライン 設問1:打者はヒットを打てるのか? 演習問題1:設問1の内容の繰り返し 二項分布から正規分布へ 設問2:サイコロを170回振る. 1の目が25~35回出る確率は? 正規分布表の使い方 演習問題2:設問2の内容の繰り返し 例題:試験で上位の人の得点を求める 設問1 打率が1/3のバッターがいる.3打席で少な くとも1本のヒットを打つ確率は? その確率は1となるか? 「打率が1/3」の本質 ヒットを○,アウトを×とする. ある打者の成績 1 2 3 ○ 7 8 9 4 5 ○ ○ 10 11 6 打率= 12 ヒットを打った打席数 13 14 15 16 17 ○ ○ ○ 18 全打席数 成績を見ると,打率1/3と言っても, 3打席中に必ず1本のヒットが出るわけではないことがわかる 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は? 3打席で,ヒット・アウトはどのように 発生するのか? 発生する事象と確率 ヒット・アウトになる確率 ヒット:1/3 アウト:1-1/3=2/3 各事象の発生確率は 1打席 2打席 3打席 × × × 2/3× 2/3× 2/3=(2/3)3 ○ × × 1/3× 2/3× 2/3= (1/3) (2/3)2 × ○ × 2/3× 1/3× 2/3= (1/3) (2/3)2 × × ○ 2/3× 1/3× 2/3= (1/3) (2/3)2 ○ ○ × 1/3× 1/3× 2/3= (1/3)2 (2/3) ○ × ○ 1/3× 2/3× 1/3= (1/3)2 (2/3) × ○ ○ 2/3× 1/3× 1/3= (1/3)2 (2/3) ○ ○ ○ 1/3× 1/3× 1/3= (1/3)3 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は? 3打席で少なくとも1本のヒットを 打つ確率は? 少なくとも1本のヒットを打つ確率 =1ー(1本もヒットを打たない確率) =1-(2/3)3 =0.704 つまり,3打席で少なくとも1本のヒットを打つ確率は約70% 打率1/3というのは,3打席中に必ず1本のヒットを打つことではない. データ(成績)にはばらつきがあることを頭に入れること. 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は? 数学としての整理1 ヒットになる確率p,アウトになる確率q(=1-p)とする 各事象の確率 1打席 2打席 3打席 × × × q3 ○ × × pq2 × ○ × pq2 × × ○ pq2 ○ ○ × p2q ○ × ○ p2q × ○ ○ p2q ○ ○ ○ p3 ヒット0本の確率 q3 ヒット1本の確率 3pq2 ヒット2本の確率 3p2q ヒット3本の確率 p3 0q3 3C0 p 1q2 C p 3 1 2q1 3C2 p 3q0 C p 3 3 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は? 数学としての整理2 1回の試行で,事柄Aの起こる確率がpの試行を独立にn 回繰り返した時,事柄Aの起こる回数Xとするとその確率 は P(X=k)=nCkpkqn-k (k=0,1…, n) Xに対するP(X)の分布を2項分布Bin(n,p)と呼ぶ 二項分布の大原則は,試行毎に確率が変動しない.また, 事象が起こる,起こらないと事のみを対象とする. (つまりは,先の打席の問題で,二塁打,ホームランなど とは考えず,ヒットを打ったかどうかが重要) 数学としての整理3 打率が1/3のバッターがいる.p=1/3,q=2/3 3打席で0本のヒットを打つ確率は? →P(0)=3C0p0q3 = 0.296 3打席で1本のヒットを打つ確率は? →P(1)=3C1p1q2 = 0.444 3打席で2本のヒットを打つ確率は? →P(2)=3C2p2q1 = 0.222 3打席で3本のヒットを打つ確率は? →P(3)=3C3p3q0 = 0.037 0.5 0.4 確率P(X) Bin(3, 1/3) 0.3 0.2 0.1 0.0 0 1 2 X 3 組み合わせの関数のプログラム (octave,MATLAB) nCr を計算する関数C(n,r)の定義 >>function y=C(n,r) k=1; for m=0:r-1 k=k*(n-m)/(r-m); end y=k; end n! r!(n r )! n (n 1) (n r 1) (n r ) (n r 1) 1 r (r 1) (r 2) 1 (n r ) (n r 1) 1 n (n 1) (n 2) (n r 1) 約分 r (r 1) (r 2) 1 n Cr C(5,3)と打てば,5C3の結果を出力する スライド9のグラフ作成のプログラム ←試行回数を入力 >>p=1/3; ←事象Aが起きる確率 >>q=1-p; ←事象Aが起こらない確率 >>for m=0:n ←事象Aの起きる回数X B(m+1)=C(n,m)*p^m*q^(n-m); ←Xに対する発生する確率 end BはP(X=k)=nCkpkqn-k (k=0,1…, n)を >>X=0:1:n; 計算している >>stem(X,B) >>n=3; 演習問題1 セールスマンがある製品を売るために20件の家庭を訪問 する.この製品が売れる確率は10%(p = 0.1) であるとい う.以下の問題に答えよ. 全く売れない確率を求めよ. 2 個まで売れる確率を求めよ. 3 個以上売れる確率を求めよ. サイコロを10回振る.1の目がX回出る確率P(X)を求めよ. さらにXに対するP(X)のグラフを作成せよ. 試行回数が増えるとどうなる? 打率1/3の打者の話に戻そう.スライド9を見直すと,3 回の打席で1本のヒットを打つ確率が最も高い値と なったが,次に高い値となったのが1本もヒットを打て ない場合. 打席数を増やしたらどうなるだろうか? 試行回数が増えるとどうなる?2 試行回数に対する確率分布の形状変化 試行数nが大きくなると n/3を中心とする 対称な分布になる. →正規分布で近似される 確率 P (X) 0.4 n=50 n=20 n=10 n=5 0.3 0.2 0.1 0.0 10 20 30 X 40 50 設問2 サイコロを170回振る. 1の目が25~35回出る確率は? 設問2の一つの回答(1) スライド8より,1回の試行で,事柄Aの起こる確率がpの試行 を独立にn回繰り返した時,事柄Aの起こる回数Xとするとそ の確率は P(X=k)=nCkpkqn-k (k=0,1…, n) 先ほどのプログラムで,1回の試行で事柄A が起こる確率をp=1/6とし,試行回数を170と して,回数X(=25~35)に対するP(X)を計算 し,ぞれぞれを足し合わせる. 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は? 設問2の一つの回答(2) 0.09 0.08 約0.709 つまりは 約71% 0.07 0.06 確率P(X) 右図のX=25~35の範囲 の確率を足し合わせる Bin(170,1/6) 0.05 0.04 0.03 0.02 0.01 0 0 20 40 60 80 100 120 回数X 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は? 140 160 180 正規分布を利用する理由 試行回数が多い場合,条件となるXについてすべての 確率を求め,足し合わせるのは非常に時間と労力がか かる. スライド14と17を比較すると,試行回数が多い場合は 設問1,設問2の確率分布は形が非常によく似ている. →正規分布で近似 期待値と分散値: 正規分布を利用するために必要なパラメータ 正規分布に行く前に,期待値と分散値について 二項分布Bin(n,p)に従う確率変数Xの期待値と分散を求める 確率pで起こる事柄Aが,n回の試行で起こる回数がX 第i回目の試行の結果について,以下の確率変数X1,X2・・・Xnを考える ) 1 ( Aが起こったとき Xi 0 ( Aが起こらないとき) 事象Aが起きるか起きないかが 重要で,事象自体には値はな い物とする 各Xi の確率分布は Xi P 1 p 0 計 q 1 但しq=1-p 2項分布の期待値と分散値 第i回目の試行の結果について,以下の確率変数X1,X2・・・Xnを考 える 各Xiの期待値: E ( X i ) xk pk 1 p 0 q p k V ( X i ) xk E ( X i ) pk 1 p p 0 p q 2 各Xiの分散値 k pqq p pq n回試行を繰り返した場合(n倍して) 期待値及び分散値は E ( X ) np V ( X ) npq 2 正規分布と確率 スライド12より試行回数nが大きくなると,期待値を中心に左右 対称の確率分布になる. これは期待値E(x)=μ,分散値V(x)=σ2とした場合の正規曲線で近 似される. y 1 2 N ( , ) 2 x 2 e 2 2 変曲点 変曲点 積分すると1となる μ-σ μ+σ Y Axis Title 正規分布の特性 μ-σ μ+σ 約68%が含まれる μ-2σ μ+2σ 約95%が含まれる μ-3σ μ+3σ 約99.7%が含まれる 二項分布と正規分布の比較 サイコロを170回振った場合の1の目が出る確率に ついて 0.09 line 3 0.08 赤:二項分布Bin(170,1/6) 青:正規分布N(28.33,23.61) 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 0 20 40 60 80 100 120 140 160 180 正規分布の標準化(1) 正規分布N(μ,σ2)を標準正規分布N(0,1)に変換す ることで,より使い勝手が良くなる X μ-σ μ μ+σ Y -σ 0 ①μだけずらして平均を0とする(Y=X-μ) σ Z -1 0 1 ②σで割って標準偏差を1とする Z=Y/σ=(X-μ)/σ 正規分布の標準化(2) 標準正規分布に変換するとは X とすること.その場合, Z 期待値,分散値は→ XはN(μ,σ2)に従う 1 X 1 E (Z ) E E ( X ) 0 1 2 X 1 V (Z ) V 2 V (X ) 2 1 ZはN(1,0)に従う P ( a X b) P ( a X b ) 重要! a X b P b a P Z 正規分布表の使用方法(1) 横軸上のメモリzから,色がつ いている領域の面積 I (z)を求 めるものが正規分布表 使用例) z 1.25 正規分布表よりz=1.25 に対する値を探してみま しょう. 縦軸より 1.2 横軸より 0.05 →青の範囲の確率は 0.3944となる 正規分布表の使用方法(2) Zが負となる領域も含む場合 + z=-0.67 z=-0.67 z=1.12 z=1.12 + I (0.67) =0.2486 zが負の領域は 正に折り返して計算する z=0.67 I (1.12) =0.3686 z=1.12 合計:0.6172 設問2の解法(1) サイコロを170回振る. 1の目が25~35回出る確率は? まず,期待値E,分散値Vを求める. E=npより,E=28.33・・・ V=npqより,V=23.61・・・ いま求める確率はP(45≤X ≤60). b a 25 28.33 35 23.61 P ( a X b) P Z より, P Z 23.61 23.61 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は? 設問2の解法(2) 25 28.33 35 23.61 P Z 23.61 23.61 P 0.686 Z 1.372 青の領域の面積を求める + z=-0.69 z=-0.69 z=1.37 I (0.69) =??? z=1.37 I (1.37) =??? + z=0.69 z=1.37 設問2の解法(3) 標準正規分布表より求めた結果は? →0.667 二項分布より求めた結果は →0.709 試行回数が小さいと誤差が生じる. 試行回数が小さい場合は,以下のように補正値を加えると良い b 0.5 a 0.5 P Z →0.715 試行回数が大きい場合は補正は必要ない 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は? 演習問題2 打率0.25の打者がいる.年間500回打席がまわってく る.ヒット(ホームランも含む)を140本以上打つ確率 を求めよ. 標準正規分布表を使って 余裕のある方は二項分布を使って真の値を求めよ. (計算機を使って) サイコロを360回振って,1または2の目の出る回数 がX=100~120となる確率を求めよ. 追加)センター試験の例題 ある年の大学入試センター試験のある科目で,受験者数 450000人の得点は,平均点65点,標準偏差20点の正規分 布に従うものとする. 70~90点の受験生は,ほぼ何人と考えられるか? P(70≤X ≤90)を求めればよい →自分でやること 得点上位50000人目の得点はいくらか? 50000人目とは上位から50000/450000=0.111である. (次のスライドに解法を書いているので参照すること) 得点上位10000人目の得点はいくらか? 自分で求めること 追加)センター試験の例題の続き 上位 ヒント)Z1はいくらになるか? これを求めるには赤 の領域を考える 0.5-0.111 =0.389 0.111 Z1 となるので,I(Z1)=0.389より,正規分布表で 条件に合うZ1の値を求める.→Z1=1.22 最後にZからXの値に変換する. Z X 65 1.22 20 Xは約89点 設問の内容:得点上位50000人目の得点はいくらか? 50000人目とは上位から50000/450000=0.111である.
© Copyright 2024 ExpyDoc