統計の基礎 第5回 各種統計量 5月27日

統計の基礎
第10回
確率の展開/各種確率分布
6月24日
確率の展開
【目標】
• 連続的確率変数の取り扱いについて理解する。
【構成】
1.期待値
2.離散的確率から連続的確率へ
(1) 視点の移行
(2) 密度関数
(3) 累積関数
3.大数の法則
1.期待値
• 期待値=変数(確率変数)と確率の積和
加重平均の加重を確率に置き換え積和を求め
る操作
母集団の統計量については確率であり期待値
として区別されることがある
• 変数xの期待値 =E(x) ⇒平均
• 偏差平方の期待値 =E((x-μ)^2) ⇒分散
日常的に使われる「期待値」と概ね同じもの
1枚300円の宝くじの期待金額
(ある年のグリーンジャンボでの事例)
等級
当選金額(円) 当選本数(本) 当選確率 期待値
1等
300,000,000
17 0.0000001
30
1等の前後賞
1等の組違い
賞
2等
100,000,000
34 0.0000002
20
100,000
1,683 0.0000099
0.99
10,000,000
68 0.0000004
4
3等
1,000,000
1,700
0.00001
10
4等
50,000
34,000
0.0002
10
5等
10,000
170,000
0.001
10
6等
3,000
1,700,000
0.01
30
7等
300
17,000,000
0.1
30
-
-
-
-
144.99
2.離散的確率から連続的確率へ
(1) 視点の移行
• 離散的変数から、連続的変数に視点を移行
• ヒストグラムで区間を細かくした場合
細かくて煩雑、データの欠落する区間
ヒストグラムでの表現は困難になる
⇒ヒストグラムの包絡線(上端を包み込む線)を
描くこととなる。
(2) 密度関数
• 包絡線の高さをどのように描くか?
区間を細かくすれば頻度が減少
高さが低くなる
• 全体を1とした場合の割合で各区間(各変数値)の
頻度(密度)を表現
• 横軸単位長当たりの割合で表現
⇒密度関数としての表現
(3) 累積関数
• 密度の分布
イメージの把握には好都合
数値分析には用い難い
• グラフの左端からの累積面積で表現
⇒累積関数
• Excelの確率分布関数
型を区別するパラメータ
密度(0)と累積(1)
Excelでは、密度を確率質量と表現
離散的事象、連続的事象での
平均値の求め方
3.大数の法則
• チェビシェフの不等式の相対度数を期待値と
して捉える ⇒母集団についての法則
• 標本平均の期待値はμ
• 分散はσ/√n =s^2
• 絶対値の部分(ε;誤差)を一定値に固定し
標本数(n)を大きくすれば、kも大きくなる
• 平均(μ)が一定の誤差内に収まる確率が1に
限りなく近くなる
大数の法則
標本数(n)を大きくすれば標本平均(m)は母集
団平均(μ)に限りなく近づく
各種確率分布
【目標】
• 主な統計分布の意味について理解する。
• 正規分布の特性を知り、標準偏差と確率の
関係を活用できるようになる。
【構成】
1.いろいろな確率分布
(1)自然現象・社会現象で現れる分布
(2)統計分析のために用いられる分布
2.正規分布の利用
(1)正規分布とは
(2)正規分布の型
(3)Zテーブル(数表)の使い方
(4)正規分布の応用
(5)Excelの関数を使う
1.いろいろな確率分布
(1)自然現象・社会現象で現
れる分布
i. 離散分布
• グラフの横軸
• グラフの高さ
各区間
各階層の度数の構成比
①一様分布(離散)
②ベルヌーイ分布
• 2種の状態があり、それぞれが出る確率分布
③二項分布
• ベルヌーイ試行を一定回数(n)繰り返した場合の分布
④ポアソン分布
• 一定時間内の来客人数の分布
⑤幾何分布
• 特定の事象が出現するまでベルヌーイ試行を繰
り返す場合の繰返し回数に関する分布
ii.連続分布
①一様分布(連続)
②正規分布
• 平均と標準偏差で分布型が決定
③指数分布
• 一様分布で求まった多数のデータについて、
隣接するデータ間の距離についての分布
(2)統計分析のための分布
①χ2分布
• 分散等に関する分布
②t分布
•
小標本から平均を推定するための分布
③F分布
• 分散の比に関する分布
2.正規分布の利用
(1) 正規分布とは
•
自然界でしばしば生じる分布
情報がなければまず正規分布として扱う
身長・体重、気温、・・・
成績(?)
※大学の成績は2コブ分布
(2) 正規分布の型
• 平均と標準偏差で形が決定
(3) Zテーブル(数表)の使い方
• 確率変数xについて、平均からの偏差が標準
偏差の何倍かによって、xと平均の間の確率
(面積)が決まる。
• 基準化した正規分布;N(0,1~2)ついての確率
変数と確率の対応表(Zテーブル)を利用して、
この確率を求める。
• Z=(X-μ)/σ
• Zテーブルは、
0とZ値との間の面積(確率)を表示
P(0≦z≦Z)
Z=1 P=0.3413
Z=2 P=0.4772
P=0.45 Z=1.645 両側で90%の範囲
P=0.475 Z=1.96 両側で95%の範囲
(4) 正規分布の応用
• 偏差が一定の値になる確率を求める
• 確率を一定値になる偏差を求める
(5) Excelの関数を使う
• NORMDIST
確率密度関数(型=0)、累積関数(型=1)
NORMSDIST 標準正規分布
• NORMINV
逆関数 確率から変数を求める
シミュレーション等に利用
NORMSINV
【提出課題】6月24日
Kadai06.xlsx
• 問題; 長期的な売上平均11万円、売上標準
偏差1万円の場合に、9日間の売上平均が、
10.4万円以下となる可能性を10000回のシ
ミュレーションで検討してください。
• 問題の趣旨; これまでの売上の平均額が10
万円/日で標準偏差が1万円の店で、11万円/
日への売上拡大を狙って改装した。9日間の
結果は、10.4万円/日であったが、このことか
ら効果がどうであったと判断するか。
【時間末レポート】6月24日
A.
B.
C.
D.
E.
F.
平均60点、標準偏差10、得点45点 Z値?
Z値 2.5 右側確率?
Z値 -3 左側確率?
Z値 -2~2 中間確率?
右側確率 0.025 Z値?
中間確率 0.9 Z値の区間?
G. 1,000人が受験した試験で、平均70点、標
準偏差10点の場合、85点の人は、上から何番
目程度と考えられるか。