経済統計学 第2回 4/24 Business Statistics 鈴木智也 紫英館 304号室 Office Hour:月曜日 第2講時 1 前回のポイント • 「記述統計」と「推測統計」。 • この講義で扱うのは、推測統計。 • 標本(サンプル)データから標本統計量を 計算し、母集団の持つ規則性(母集団パラ メータ)を推測する。 ⇒推測統計を学ぶ前に、記述統計の復習。 2 記述統計の復習(1) ☆(母集団)平均 m X1 X 2 X m 1 X { X i } m m i 1 X が m 通りの値を取りうる時、大体どれ位 の値になるかの指標。 3 記述統計の復習(2) ☆(母集団)分散 2 2 m ( X ) ( X ) 1 2 2 1 X m X X ( Xi X ) m m i 1 X が概ね平均値からどのくらい離れている かを表す指標。(散らばり具合を記述) Q:なぜ二乗しているのかを考えてみよう。 4 記述統計の復習(3) ☆(母集団)標準偏差 X X2 これも散らばり具合を表す指標。 注:分散は二乗を取って計算しているので、 元々の単位(例:兆円)とは異なる。 ⇒分散の平方根を取って、標準化し、元の単 位に戻す。 5 記述統計と推測統計の対応 n個の標本データから母集団特性値を推測 ☆標本平均 n ☆標本分散 X 1 X 2 X n i 1 X i X n n ( X1 X ) ( X n X ) s n 1 2 2 2 X ☆標本標準偏差 sX s 2 ( X X ) i1 i n n 1 2 X 6 注:一般的な表記方法 • 母集団特性値はギリシア文字で表すのが 通例。 平均:μ(ミュー) 標準偏差:σ(シグマ) • 標本統計量は通常、アルファベットで表す。 小文字のσは小文字のs に相当。 母集団標準偏差 σ ⇔ 標本標準偏差 s 7 ここから前回の続き • 推測統計では、サンプルを取って、母集団 の規則性(特性値)を推測する。 • サンプルをどう取るかで、標本統計量の値 は変わってくる。 • 標本統計量には、取り得る値が複数あり、 事前にはどの値を取るのか分からない。 ⇒標本統計量は「確率変数」である。 8 そもそも確率とは? • ある事象が起こるか否か分らない時、その 結果が起こる可能性を示す測度のこと。 事象 A の確率を P(A) と表すとすると、 ①確率 P(A) は必ず非負である: P(A)≥0 ②必ず起こる事象の確率は1である。 ③事象 A と B が同時には起こり得ない場合、 A または B が起こる確率は、P(A)+P(B) 。 9 確率の具体例 • サイコロを振って、3の目が出る確率は? ⇒目の出方は、全部で6通り。3の目が出る のは、そのうちの一つ。⇒1/6の確率。 • じゃんけんでグーを出して勝つ確率は? ⇒相手がチョキなら勝ち、グーならあいこ、 パーなら負け、の三通り。⇒1/3の確率。 10 確率変数とは • 取り得る値(実現値)が複数あり、それぞ れの値を取る確率が決まっている変数。 例:サイコロを振って出る目の数値(X) 実現値(xi):1,2,3,4,5,6 どの値を取る確率も1/6。 ☆確率変数 X が xi という値を取る確率を P(X=xi) または、単に P(xi) と表記する。 11 確率分布とは • 確率変数 X が取り得る全ての実現値につ いて、対応する確率の散らばりのこと。 • それを表すものが、確率分布表。 (例)サイコロで出る目の値の確率分布表 xi P(xi) 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 12 確率変数を「記述」しよう ① ☆平均値(「期待値」と呼ぶ) 確率変数 X が、平均して、どの位の値を 取るものと期待できるだろうか? m E ( X ) x1 P( x1 ) xm P( xm ) {xi P( xi )} i 1 ↑確率で加重して平均を取っている。 注: E は期待(Expectation)を意味する。 13 確率変数を「記述」しよう ② ☆分散 確率変数 X の実現値の散らばり具合を表す。 2 2 2 X V ( X ) {x1 X } P( x1 ) {xm X } P( xm ) m {xi X } P( xi ) 2 i 1 ↑ここでも、確率で加重している。 注: V は分散(Variance)を表す。 14 確率変数を「記述」しよう ③ ☆標準偏差 X 2 X 理解の為の重要ポイント 母集団の平均、分散、標準偏差と、確率変 数の平均、分散、標準偏差のそれぞれの 相似性に注目せよ。 15 経済分析での確率変数の例 • 株式投資の収益率 株価は変動する⇒投資収益率は確率変数 Q:もし投資収益率の確率分布が次のよう ならば、収益率の期待値はいくつ? 収益率 確率(%) 0.1 0.2 0.4 0.5 0.8 10 20 30 30 10 16 確率分布が分らない場合は? • 過去のデータから「相対頻度」を調べて、代用。 例えば、過去12ヶ月間の収益率が 0.2, 0.4, 0.1, 0.3, 0.1, 0.3, 0.5, 0.2, 0.1, 0.2, 0.3, 0.2 だったとする。その場合、相対頻度は、 0.1 0.2 0.3 0.4 0.5 収益率 相対頻度 3/12 4/12 3/12 1/12 1/12 17 連続型確率変数 • ここまでの確率変数 X はとびとびの値だけ を取り得ると仮定した。←離散型確率変数 • しかし、ある範囲内でどんな値でも取り得 る確率変数もある。←連続型確率変数 例:ある時点で、時計の秒針が、中心から十 二時の部分を結ぶ線と、成す角度は0度か ら360度まであり得る。(分布を図示せよ) 18 連続型確率変数(続) ☆離散型の場合 ・X の取る値自体に確率が対応。 ・確率関数 P(X=xi) を定義できる。 ☆連続型の場合 ・X の取り得る値は無限にあり、一点の値 について確率が0ではないとすると、確率 の総和が1であるという公理(P.9)に矛盾。 ⇒「範囲」について、確率を考える。 19 連続型確率変数(続々) • 連続型確率変数の場合、確率密度関数を 導入する: f(x) • X が a から b までの値を取る確率は、 b a f ( x)dx • 注:積分(∫)は総和(∑)に対応している。 Q:図示して考えてみよ。 20 連続型確率変数を「記述」する X が -∞ から ∞ までの値を取るならば、 ☆平均(「期待値」と呼ぶ) X E ( X ) x f ( x)dx ☆分散 V ( X ) {x X } f ( x)dx 2 X 2 ☆標準偏差 X X2 21 代表的な確率分布 ☆正規分布 (Normal Distribution) ・正規分布は、平均値μと分散σ2によって 完全に決定される:N(μ, σ2)と表記する。 ・確率密度関数は(覚えなくてもよいが) f ( x) 1 2 2 e ( x )2 2 2 ・図示すると、釣鐘型をしていて、平均値に 関して左右対称である。 22 代表的な確率分布(続) ・N(μ, σ2) に従う変数 X は、N(0, 1)に従う 標準化変量 Z=(X-μ)/σに変換できる。 ・N(0, 1)の分布を「標準正規分布」と呼ぶ。 重要:標本平均は正規分布に従うことが知 られている(次々回に詳説)。 *今週で準備は終り、来週から本題入り。 23
© Copyright 2025 ExpyDoc