目的 確率統計基礎講義 A 分布論 (Part 1) 講師:栁原宏和 E-mail: [email protected] Web: http://www.math.sci.hiroshima-u.ac.jp/~yanagi/ProbStatBasisB.html 本講義では, 確率分布&標本分布の基礎について勉強する. • 連続型の確率分布のみを取り扱う. • 確率分布の特性として,確率密度関数,特性関数,平均,分散, 歪度,尖度,乱数発生法,確率変数を用いた定義 etc. を取り 扱う. • 標本分布としては,2次形式統計量の分布,一元配置分散分 析での標本分布 etc. を取り扱う. • 特性関数の性質は周知の事実として取り扱う.また特性関数 の計算では,虚数 は定数として取り扱う. • 行列&ベクトルの転置は′で表わす. 分布論, Part 1: P.1 分布論, Part 1: P.2 講義の予定&成績 第1週 4/10 0. 序論 第10週 6/12 3.2. 2次形式統計量の分布(1) 第2週 4/17 1.1. 正規分布 第11週 第3週 4/24 1.2. 混合正規分布 第12週 6/26 3.3. 非心カイ二乗分布 第4週 5/1 1.3. 歪正規分布 第5週 5/8 2.1. 多次元分布 第6週 5/15 2.2. 多次元正規分布 (1) 第13週 6/19 3.2. 2次形式統計量の分布(2) 7/3 3.4. ウィッシャート分布 第14週 7/10 4.1. t-分布 0. 序論 第15週 7/17 4.2. F-分布 第7週 5/22 2.2. 多次元正規分布 (2) 第16週 7/25 休講 (月曜日授業のため) 第8週 5/29 休講 (水曜日授業のため) 第17週 7/31 4.3. 一元配置分散分析 第9週 6/5 3.1. カイ二乗分布 第18週 8/7 休講 (予定) 注意) 講義の進行状況により内容が変更することがある. 成績: 出席状況とレポートにより判断する. 分布論, Part 1: P.3 分布論, Part 1: P.4 何故分布論が必要か? 推定 分布論は統計的推測のために必要! 今, データ , … , に対して統計モデルを想定する. つまり, デー タを確率変数 , … , の実現値と仮定する. ただし は標本数 ,…, に確率分布を想定 (正規分布などの とする. ここでは, 分布のタイプを仮定) して以下のようなパラメトリックモデルを考え る. P ,…, ⋯ ,…, ; ⋯ の推定量を ,…, とし (推定値は ,…, ) ,…, と書くこととする. 推定量の良さを測る指数, 平 均 (バイアス) E , 分散 Var , 平均二乗誤差 (mean squared error: MSE) MSE を計算するためには, が必 要である. また, により計算される の標本分布が分かれば の区間推定 (例えば a と言った形で推定) を行うことがで きる. 推定: ∈ Ω ( は既知, は未知) 次のような統計的推測を行うためには, を仮定し使用する必要 がある. 分布論, Part 1: P.5 仮説検定 (1/2) 分布論, Part 1: P.6 仮説検定 (2/2) 仮説検定: 以下の検定問題 帰無仮説 : ∈ Ω vs対立仮説 : ∈ Ω Ω Ω を考える. 一般的な仮説検定の手法では, ある閾値 に対して, 検 ,…, の実現値 ,…, が ,…, 定統計量 であれば を棄却する. ここでは ,…, と書くことに する. 仮説検定を行うためには, 具体的な を決定する必要がある. これは により が正しい下での の標本分布を計算し, 有意水 準に対応する分位点を計算する必要がある. また使用する検定 統計量の良し悪しを測るためには検出力を考える必要がある. 分布論, Part 1: P.7 • 有意水準 : P | (通常は 0.05 or 0.01). この 確率は第一種の過誤 ( が正しいにもかかわらず を棄却す る間違い) を起こす確率に等しい. また が正しい下での の 分布のことを帰無分布 (null distribution) と呼ぶ. P | ( ∈ Ω ). この確率は 1 から第 • 検出力 : 二種の過誤 ( が正しいにもかかわらず を採択する) を起こ す確率を引いたものに等しい. また が正しい下での の分 布のことを対立分布 (non-null distribution) と呼ぶ. 分布論, Part 1: P.8 特性量 (1/2) 統計量の分布 検定統計量, 推定量などを統計量と呼び, 一般的には と書く. このとき統計量 の分布とは の分布関数 (Distribution Function; df) や確率密度関数 (Probability Density Function; pdf) を指す. : 分布関数 P : 確率密度関数 注意0.1) 確率変数 の確率密度関数が確率分布 の確率密 度関数であるとき, は に従うといい, ∼ とかく. 確率 変数 , … , が互いに独立で同じ確率分布 に従うとき, ,…, ∼ . . . と書く (i.i.d. は independently and identically distributed の略). 定義 (期待値): 確率変数 に対して, E を 以下で定義する. の確率密度関数を とする. 関数 の期待値 (Expectation) といい, E 特に, のとき, E を平均 (mean) と呼び, 多くの場合, で表す. また, E を の 次モーメントと呼び, で表す. さらに, E を の平均周りの 次モーメントと呼び で表す. 分布論, Part 1: P.9 特性量 (2/2) 定義 (特性量): 以下は確率分布の形状を表す特性量である. 1. 平均: . 確率分布の重心, または中心. . 確率分布の散らばり. 2. 分散 (Variance): を標準偏差 (Standard Deviation) と呼ぶ. 3. 歪度 (Skewness): / . 確率分布の歪み. 左右対 称な分布であれば 0. 0 のとき, 右に歪んだ分布 (分布の裾が右側に広がっている), 0 のとき, 左に歪んだ 分布 (分布の裾が左側に広がっている) という. / 3. 分散1に固定したときの 4. 尖度 (Kurtosis): 分布の裾の重さ, または尖り具合. 尖度が大きくなるほど裾の 2 であり, 2 のときは一点分布 (退化 重い分布. した分布). 正規分布の場合は 0, 0 となることから, 歪度と尖度は 正規性からの逸脱度を表す指標としても用いられる. 分布論, Part 1: P.11 分布論, Part 1: P.10 特性関数 定義 (特性関数): 確率変数 の確率密度関数を とする. ∀ ∈ に対して, E exp を の特性関数 (Characteristic Function; cf) といい, で表す. ( の ということを明記するために と書くこともある) 性質 (特性関数): • 一意性定理: 確率変数 ると, , の特性関数を ⟺ と , とす の分布は同じ • モーメント公式: E ここでの条件 E ために必要である. ∞ ⟹ E ∞ は微分と積分の順序を入れ替える 分布論, Part 1: P.12 計算機を使った分布の近似法 (1/3) 計算機を使った分布の近似法 (2/3) ∼ U 0,1 (U , は区間 , このとき の確率密度関数は, 0 1 であり, 分布関数は Φ 上の一様分布を表す) とする. 0 1 その他 0 0 0 P 1 である. また ∼ N 0,1 (N , 布を表す) とすると, Φ P 1 1 は平均 , 分散 1 2 exp の正規分 2 分布論, Part 1: P.13 計算機を使った分布の近似法 (3/3) 以上の方法を用いて ,…, ,…, → ⋮ ⋮ ,…, → は狭義単調増加関数であるので, Φ が存在する. いま, ( ∼ U 0,1 ) とすると, Φ P P Φ P Φ Φ よって は標準正規分布に従う確率変数であることがわかる. 一 般に, ∼ U 0,1 で, の分布関数 を狭義単調増加関数と の分布は の分布に等しい. つまり, したとき, P P P の分布関数の近似関数を作る. 今, ,…, ⋮ ,…, ,…, と ,…, の順序は同じである ( は狭 とすると, 義単調増加関数なので). ここで, ,…, を小さい順に並べて ,…, とおくと, P / 1, … , である. であるとき, しかしながら, の具体的な形が分かっていなければ, 上記のような 方法で分布を近似することはできない. 分布論, Part 1: P.15 Example 0.1) , … , ∼ . . . U 0,1 とするとし, 増加なある分布 の分布関数とする. このとき, ,…, とすれば ,…, ∼ . . . を狭義単調 分布論, Part 1: P.14
© Copyright 2025 ExpyDoc