確率と統計 メディア学部2009年 2009年12月17日(木) 確率分布 • 検定を行う際、確率計算が必要になります。 • そのためには、分析対象が従うそれぞれの 確率値の在り様(確率分布)を知り、その 性質・特徴を上手く利用することになります。 東京工科大学 確率と統計2009 P.2 いろいろな確率分布 • • • • • • • 2項分布 正規分布 ポアソン分布 一様分布 χ2分布 t分布 F分布 などなど 2項分布 • 1回の試行で事象Aの起こる確率がpで、 起こらない確率がqとする。このとき、n回 の反復試行で事象Aがk回起こる確率は、 次のようになる。 k n k P( X k )n Ck p q (k 1,2,3,, n) この分布であることを B(n, p) と書くことが ある。 教科書 p.97 参照のこと 例 • 1枚の硬貨をn回投げる。 2項分布B(n, p)の平均と分散 • 平均 = np • 分散 = npq 有名かつ便利な公式 教科書 p.101 式 (2) 参照のこと 正規分布 • 測定誤差や身長のデータのヒストグラムを 作ると釣鐘型になる。このときのヒストグラ ムの形を近似的に表す曲線を正規分布曲 線とい、このときの分布を正規分布という。 正規分布曲線は、平均μと分散σ2できまる ので、N(μ, σ2 ) と書くことがある。 正規分布 • • • • 分布関数 確率密度関数 正規分布曲線(定義) 正規分布の特徴 正規分布のグラフ 正規分布のグラフ 左右対称 変曲点 ほとんどゼロ 教科書 p.102 図3 参照のこと 正規分布曲線の式 f ( x) 1 2 e 2 (x ) 2 2 ( x ) 正規分布曲線の式 f ( x) 標準偏差 1 2 e 平均 2 (x ) 2 2 ( x ) 重要な性質(再) • 左右対称 • X=σは変曲点(上凸と下凸の変わり目) • 平均 = 中央値 = モード 他の重要な性質 正規分布のグラフ 68% 正規分布のグラフ 95% 正規分布のグラフ 99.7% 標準化の公式 z 2 N(μ,σ ) x N(0,1) 標準化の公式 z x 平均μ、分散σ2 平均ゼロ、分散1 (正規分布) (標準正規分布) 2 N(μ,σ ) N(0,1) これについての情報が標準正規 分布表として与えられている。 練習問題 • 問題1: 正しく作られたコインを100回投 げるとき、表が40回から60回出る確率を 求めよ。 • 問題1のヒント: – コイン投げの繰り返しは2項分布Bとなるので、 定義に従って計算しても良いが、 – 繰り返しの回数が多い場合は、平均がnp、分 散がnpqの正規分布で近似できる。 – このことを使うと比較的楽に計算できる。 • 問題1の答: – – – – – – μ= np = (100)×(1/2) = 50 σ2= npq = (100)×(1/2)×(1-1/2) = 25 = 52 Z=(X-μ)/σ = (X – 50) / 5 とすると Z1=(40-50)/5 = -2 Z2=(60-50)/5 = +2 標準正規分布曲線の -2 ~ +2 の部分の面積が求 める確率。 – 標準正規分布表(教科書p.295)より 約0.95 (= 0.4772×2) • 問題2:両側検定と片側検定について以 下の問に答えよ。 (1)両側検定とは何か。 (2)片側検定とは何か。 (3)コインを何回か投げた結果に基づい て、コインが正しく作られているかを調べ たい。このときは、両側検定を使うべき か、片側検定を使うべきか。 • 問題2のヒント: 教科書のp.163~167をよく読むこと。 両側検定、片側検定の区別、使い分けは 重要なので、何かの機会に一度調べてお くことを勧める。 • 問題3:ある人種では4つの血液型を持つ 人の割合が 0.16, 0.48, 0.20, 0.16 であ るという。他の人種の人について同様の 調査をしたところ、それぞれの血液型を持 つ人が180, 360, 130, 100 人であった。 これら人種間で血液型の人数比は同じと いえるか? • 問題3のヒント: – – – – – カイ2乗検定を利用する。 教科書第10章を参照のこと。 教科書 p.229 の問題2と同じ。 自由度の求め方を覚えると良い。 カイ2乗分布の表は教科書p.298 。 – (カイ2乗検定は利用価値が高いですので、 是非 覚えて使ってください。) • 問題4:ある図書館での本の貸し出しを調べたら以下 のようになった。「曜日により貸し出し冊数は変わらな い」かどうか検定せよ。なお、有意水準を5%とせよ。 貸し出 し冊数 月曜 135 火曜 108 水曜 120 木曜 114 金曜 146 • 問題4のヒント: 月曜 火曜 水曜 木曜 金曜 観測値 135 108 120 114 146 理論値 T/5 T/5 T/5 T/ 5 T/5 T=135 + 108 + 120 + 114 + 146 その他 • カイ2乗検定の1つに、分割表(教科書 p.225)があります。便利なので勉強してく ださい。授業でもやりましたよね! • カイ2乗検定は、分散分析の特殊な場合 となっています。分散分析はとても強力な 手法ですので、勉強しましょう。 • 統計は慣れることが大切です。継続的に 勉強してください。理論より実践です。 最後に • 統計を知っている人と知らない人とでは、 今後大きな差になってきます。統計をすべ て勉強することは無理です。自分に関係 のある分野で、必要なものから慣れていっ てください。 練習あるの み 次回3つ目のレポート課題を提示します.
© Copyright 2024 ExpyDoc