統計の基礎 第10回 確率の展開/各種確率分布 6月24日 確率の展開 【目標】 • 連続的確率変数の取り扱いについて理解する。 【構成】 1.期待値 2.離散的確率から連続的確率へ (1) 視点の移行 (2) 密度関数 (3) 累積関数 3.大数の法則 1.期待値 • 期待値=変数(確率変数)と確率の積和 加重平均の加重を確率に置き換え積和を求め る操作 母集団の統計量については確率であり期待値 として区別されることがある • 変数xの期待値 =E(x) ⇒平均 • 偏差平方の期待値 =E((x-μ)^2) ⇒分散 日常的に使われる「期待値」と概ね同じもの 1枚300円の宝くじの期待金額 (ある年のグリーンジャンボでの事例) 等級 当選金額(円) 当選本数(本) 当選確率 期待値 1等 300,000,000 17 0.0000001 30 1等の前後賞 1等の組違い 賞 2等 100,000,000 34 0.0000002 20 100,000 1,683 0.0000099 0.99 10,000,000 68 0.0000004 4 3等 1,000,000 1,700 0.00001 10 4等 50,000 34,000 0.0002 10 5等 10,000 170,000 0.001 10 6等 3,000 1,700,000 0.01 30 7等 300 17,000,000 0.1 30 - - - - 144.99 2.離散的確率から連続的確率へ (1) 視点の移行 • 離散的変数から、連続的変数に視点を移行 • ヒストグラムで区間を細かくした場合 細かくて煩雑、データの欠落する区間 ヒストグラムでの表現は困難になる ⇒ヒストグラムの包絡線(上端を包み込む線)を 描くこととなる。 (2) 密度関数 • 包絡線の高さをどのように描くか? 区間を細かくすれば頻度が減少 高さが低くなる • 全体を1とした場合の割合で各区間(各変数値)の 頻度(密度)を表現 • 横軸単位長当たりの割合で表現 ⇒密度関数としての表現 (3) 累積関数 • 密度の分布 イメージの把握には好都合 数値分析には用い難い • グラフの左端からの累積面積で表現 ⇒累積関数 • Excelの確率分布関数 型を区別するパラメータ 密度(0)と累積(1) Excelでは、密度を確率質量と表現 離散的事象、連続的事象での 平均値の求め方 3.大数の法則 • チェビシェフの不等式の相対度数を期待値と して捉える ⇒母集団についての法則 • 標本平均の期待値はμ • 分散はσ/√n =s^2 • 絶対値の部分(ε;誤差)を一定値に固定し 標本数(n)を大きくすれば、kも大きくなる • 平均(μ)が一定の誤差内に収まる確率が1に 限りなく近くなる 大数の法則 標本数(n)を大きくすれば標本平均(m)は母集 団平均(μ)に限りなく近づく 各種確率分布 【目標】 • 主な統計分布の意味について理解する。 • 正規分布の特性を知り、標準偏差と確率の 関係を活用できるようになる。 【構成】 1.いろいろな確率分布 (1)自然現象・社会現象で現れる分布 (2)統計分析のために用いられる分布 2.正規分布の利用 (1)正規分布とは (2)正規分布の型 (3)Zテーブル(数表)の使い方 (4)正規分布の応用 (5)Excelの関数を使う 1.いろいろな確率分布 (1)自然現象・社会現象で現 れる分布 i. 離散分布 • グラフの横軸 • グラフの高さ 各区間 各階層の度数の構成比 ①一様分布(離散) ②ベルヌーイ分布 • 2種の状態があり、それぞれが出る確率分布 ③二項分布 • ベルヌーイ試行を一定回数(n)繰り返した場合の分布 ④ポアソン分布 • 一定時間内の来客人数の分布 ⑤幾何分布 • 特定の事象が出現するまでベルヌーイ試行を繰 り返す場合の繰返し回数に関する分布 ii.連続分布 ①一様分布(連続) ②正規分布 • 平均と標準偏差で分布型が決定 ③指数分布 • 一様分布で求まった多数のデータについて、 隣接するデータ間の距離についての分布 (2)統計分析のための分布 ①χ2分布 • 分散等に関する分布 ②t分布 • 小標本から平均を推定するための分布 ③F分布 • 分散の比に関する分布 2.正規分布の利用 (1) 正規分布とは • 自然界でしばしば生じる分布 情報がなければまず正規分布として扱う 身長・体重、気温、・・・ 成績(?) ※大学の成績は2コブ分布 (2) 正規分布の型 • 平均と標準偏差で形が決定 (3) Zテーブル(数表)の使い方 • 確率変数xについて、平均からの偏差が標準 偏差の何倍かによって、xと平均の間の確率 (面積)が決まる。 • 基準化した正規分布;N(0,1~2)ついての確率 変数と確率の対応表(Zテーブル)を利用して、 この確率を求める。 • Z=(X-μ)/σ • Zテーブルは、 0とZ値との間の面積(確率)を表示 P(0≦z≦Z) Z=1 P=0.3413 Z=2 P=0.4772 P=0.45 Z=1.645 両側で90%の範囲 P=0.475 Z=1.96 両側で95%の範囲 (4) 正規分布の応用 • 偏差が一定の値になる確率を求める • 確率を一定値になる偏差を求める (5) Excelの関数を使う • NORMDIST 確率密度関数(型=0)、累積関数(型=1) NORMSDIST 標準正規分布 • NORMINV 逆関数 確率から変数を求める シミュレーション等に利用 NORMSINV 【提出課題】6月24日 Kadai06.xlsx • 問題; 長期的な売上平均11万円、売上標準 偏差1万円の場合に、9日間の売上平均が、 10.4万円以下となる可能性を10000回のシ ミュレーションで検討してください。 • 問題の趣旨; これまでの売上の平均額が10 万円/日で標準偏差が1万円の店で、11万円/ 日への売上拡大を狙って改装した。9日間の 結果は、10.4万円/日であったが、このことか ら効果がどうであったと判断するか。 【時間末レポート】6月24日 A. B. C. D. E. F. 平均60点、標準偏差10、得点45点 Z値? Z値 2.5 右側確率? Z値 -3 左側確率? Z値 -2~2 中間確率? 右側確率 0.025 Z値? 中間確率 0.9 Z値の区間? G. 1,000人が受験した試験で、平均70点、標 準偏差10点の場合、85点の人は、上から何番 目程度と考えられるか。
© Copyright 2024 ExpyDoc