統計学 11/08(木) 鈴木智也 1 今日の講義 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し 確率論入門 確率変数と確率分布 ←ここ! 第3部 推測統計:データから全体像を推測 2 復習:確率とは • ある事象が起こるか否か分らない時、その 結果が起こる可能性を示す測度のこと。 事象 A の確率を P(A) と表すとすると、 ①確率 P(A) は必ず非負である: P(A)≥0 ②必ず起こる事象の確率は1である。 例:サイコロを振って3の目が出る確率は? ⇒目の出方は6通り。3の目が出るのは、そ のうちの一つ。⇒1/6の確率。 3 キーワード①:確率変数とは • 取り得る値(実現値)が複数あり、それぞ れの値を取る確率が決まっている変数。 例:サイコロを振って出る目の数値(X) 実現値(xi):1,2,3,4,5,6 どの値を取る確率も1/6。 ☆確率変数 X が xi という値を取る確率を P(X=xi) または、単に P(xi) と表記する。 4 キーワード②:確率分布とは • 確率変数 X が取り得る全ての実現値につ いて、対応する確率の散らばりのこと。 • それを表すものが、確率分布表。 (例)サイコロで出る目の値の確率分布表 xi 1 P(xi) 1/6 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 5 確率変数を記述する① ☆平均値(「期待値」と呼ぶ) 確率変数 X が、平均して、どの位の値を 取るものと期待できるだろうか? m E ( X ) x1 P( x1 ) xm P( xm ) {xi P( xi )} i 1 ↑確率で加重して平均を取っている。 注: E は期待(Expectation)を意味する。 6 確率変数を記述する② ☆分散 確率変数 X の実現値の散らばり具合を表す。 2 2 2 X V ( X ) {x1 X } P( x1 ) {xm X } P( xm ) m {xi X } P( xi ) 2 i 1 ↑ここでも、確率で加重している。 注: V は分散(Variance)を表す。 7 確率変数を記述する③ ☆標準偏差 X 2 X 注)表記上の慣習(ギリシャ文字) • μ(ミュー小):アルファベットのmに対応 ⇒平均(mean)を表す。 • σ(シグマ小):アルファベットのsに対応 ⇒標準偏差(standard deviation)を表す。 8 経済分析での確率変数の例 • 株式投資の収益率 株価は変動する⇒投資収益率は確率変数 Q:もし投資収益率の確率分布が次のよう ならば、収益率の期待値はいくつ? 収益率 0.1 0.2 0.4 0.5 0.8 確率(%) 10 20 30 30 10 ⇒確率分布が未知の時は、データから相対 頻度を算出し、それで代用する。 9 連続型確率変数 • ここまでの確率変数 X はとびとびの値だけ を取り得ると仮定した。←離散型確率変数 • しかし、ある範囲内でどんな値でも取り得 る確率変数もある。←連続型確率変数 Q:連続型確率変数の例を考えてみよう。 10 連続型と離散型の違い ☆離散型の場合 ・X の取る値自体に確率が対応。 ・確率関数 P(X=xi) を定義できる。 ☆連続型の場合 ・X の取り得る値は無限にあり、一点の値 について確率が0ではないとすると、「確率 の総和が1である」という公理に矛盾。⇒ 『範囲』について、確率を考える。 11 連続型確率変数の場合の確率 • 連続型確率変数の場合、確率密度関数を 導入する: f(x) • X が a から b までの値を取る確率は、 • 注:積分(∫)は総和(∑)に対応している。 Q:図示して考えてみよ。 12 連続型確率変数の記述 X が -∞ から ∞ までの値を取るならば、 ☆平均(「期待値」と呼ぶ) X E ( X ) x f ( x)dx ☆分散 V ( X ) {x X } f ( x)dx 2 X 2 ☆標準偏差 X X2 13 代表的な確率分布(正規分布) ☆正規分布 (Normal Distribution) ・正規分布は、平均値μと分散σ2によって 完全に決定される:N(μ, σ2)と表記する。 ・確率密度関数は(覚えなくてもよいが) f ( x) 1 2 2 e ( x )2 2 2 ・図示すると、釣鐘型をしていて、平均値に 関して左右対称である。 14 標準正規分布 ・N(μ, σ2) に従う変数 X は、N(0, 1)に従う 標準化変量 Z=(X-μ)/σに変換できる。 ・N(0, 1)の分布を「標準正規分布」と呼ぶ。 重要:正規分布は統計学で最も基本的な 確率分布であり、この講義後半で集中的 に使う t -分布も正規分布の派生である。 15 正規分布の重要な性質 • 確率変数XがN(μ,σ2)に従うとき、 ☆P(μ-1.96σ≦X≦μ+1.96σ)=0.95 ⇒Xは95%の確率で、平均値から±1.96σの 範囲内に収まる値を取る。 (類) P (μ-2σ≦X≦μ+2σ)=0.954 (類) P( μ-σ≦X≦μ+σ)=0.68 16
© Copyright 2025 ExpyDoc