統計学 第6回 11/2

統計学
11/08(木)
鈴木智也
1
今日の講義
第1部 記述統計:データの特性を記述
第2部 確率論:推測統計への橋渡し
確率論入門
確率変数と確率分布 ←ここ!
第3部 推測統計:データから全体像を推測
2
復習:確率とは
• ある事象が起こるか否か分らない時、その
結果が起こる可能性を示す測度のこと。
事象 A の確率を P(A) と表すとすると、
①確率 P(A) は必ず非負である: P(A)≥0
②必ず起こる事象の確率は1である。
例:サイコロを振って3の目が出る確率は?
⇒目の出方は6通り。3の目が出るのは、そ
のうちの一つ。⇒1/6の確率。
3
キーワード①:確率変数とは
• 取り得る値(実現値)が複数あり、それぞ
れの値を取る確率が決まっている変数。
例:サイコロを振って出る目の数値(X)
実現値(xi):1,2,3,4,5,6
どの値を取る確率も1/6。
☆確率変数 X が xi という値を取る確率を
P(X=xi) または、単に P(xi) と表記する。
4
キーワード②:確率分布とは
• 確率変数 X が取り得る全ての実現値につ
いて、対応する確率の散らばりのこと。
• それを表すものが、確率分布表。
(例)サイコロで出る目の値の確率分布表
xi
1
P(xi) 1/6
2
3
4
5
6
1/6
1/6
1/6
1/6
1/6
5
確率変数を記述する①
☆平均値(「期待値」と呼ぶ)
確率変数 X が、平均して、どの位の値を
取るものと期待できるだろうか?
m
  E ( X )  x1  P( x1 )    xm  P( xm )  {xi  P( xi )}
i 1
↑確率で加重して平均を取っている。
注: E は期待(Expectation)を意味する。
6
確率変数を記述する②
☆分散
確率変数 X の実現値の散らばり具合を表す。
2
2
2
 X  V ( X )  {x1   X }  P( x1 )    {xm   X }  P( xm )
m
 {xi   X }  P( xi )
2
i 1
↑ここでも、確率で加重している。
注: V は分散(Variance)を表す。
7
確率変数を記述する③
☆標準偏差
X  
2
X
注)表記上の慣習(ギリシャ文字)
• μ(ミュー小):アルファベットのmに対応
⇒平均(mean)を表す。
• σ(シグマ小):アルファベットのsに対応
⇒標準偏差(standard deviation)を表す。
8
経済分析での確率変数の例
• 株式投資の収益率
株価は変動する⇒投資収益率は確率変数
Q:もし投資収益率の確率分布が次のよう
ならば、収益率の期待値はいくつ?
収益率
0.1
0.2
0.4
0.5
0.8
確率(%)
10
20
30
30
10
⇒確率分布が未知の時は、データから相対
頻度を算出し、それで代用する。
9
連続型確率変数
• ここまでの確率変数 X はとびとびの値だけ
を取り得ると仮定した。←離散型確率変数
• しかし、ある範囲内でどんな値でも取り得
る確率変数もある。←連続型確率変数
Q:連続型確率変数の例を考えてみよう。
10
連続型と離散型の違い
☆離散型の場合
・X の取る値自体に確率が対応。
・確率関数 P(X=xi) を定義できる。
☆連続型の場合
・X の取り得る値は無限にあり、一点の値
について確率が0ではないとすると、「確率
の総和が1である」という公理に矛盾。⇒
『範囲』について、確率を考える。
11
連続型確率変数の場合の確率
• 連続型確率変数の場合、確率密度関数を
導入する: f(x)
• X が a から b までの値を取る確率は、
• 注:積分(∫)は総和(∑)に対応している。
Q:図示して考えてみよ。
12
連続型確率変数の記述
X が -∞ から ∞ までの値を取るならば、
☆平均(「期待値」と呼ぶ)

 X  E ( X )   x  f ( x)dx

☆分散

  V ( X )   {x   X } f ( x)dx
2
X
2

☆標準偏差
 X   X2
13
代表的な確率分布(正規分布)
☆正規分布 (Normal Distribution)
・正規分布は、平均値μと分散σ2によって
完全に決定される:N(μ, σ2)と表記する。
・確率密度関数は(覚えなくてもよいが)
f ( x) 
1
2 2
e
( x )2

2 2
・図示すると、釣鐘型をしていて、平均値に
関して左右対称である。
14
標準正規分布
・N(μ, σ2) に従う変数 X は、N(0, 1)に従う
標準化変量 Z=(X-μ)/σに変換できる。
・N(0, 1)の分布を「標準正規分布」と呼ぶ。
重要:正規分布は統計学で最も基本的な
確率分布であり、この講義後半で集中的
に使う t -分布も正規分布の派生である。
15
正規分布の重要な性質
• 確率変数XがN(μ,σ2)に従うとき、
☆P(μ-1.96σ≦X≦μ+1.96σ)=0.95
⇒Xは95%の確率で、平均値から±1.96σの
範囲内に収まる値を取る。
(類) P (μ-2σ≦X≦μ+2σ)=0.954
(類) P( μ-σ≦X≦μ+σ)=0.68
16