Section 0

目的
確率統計基礎講義 A
分布論 (Part 1)
講師:栁原宏和
E-mail: [email protected]
Web: http://www.math.sci.hiroshima-u.ac.jp/~yanagi/ProbStatBasisB.html
本講義では, 確率分布&標本分布の基礎について勉強する.
• 連続型の確率分布のみを取り扱う.
• 確率分布の特性として,確率密度関数,特性関数,平均,分散,
歪度,尖度,乱数発生法,確率変数を用いた定義 etc. を取り
扱う.
• 標本分布としては,2次形式統計量の分布,一元配置分散分
析での標本分布 etc. を取り扱う.
• 特性関数の性質は周知の事実として取り扱う.また特性関数
の計算では,虚数 は定数として取り扱う.
• 行列&ベクトルの転置は′で表わす.
分布論, Part 1: P.1
分布論, Part 1: P.2
講義の予定&成績
第1週 4/10 0. 序論
第10週 6/12 3.2. 2次形式統計量の分布(1)
第2週 4/17 1.1. 正規分布
第11週
第3週 4/24 1.2. 混合正規分布
第12週 6/26 3.3. 非心カイ二乗分布
第4週
5/1
1.3. 歪正規分布
第5週
5/8
2.1. 多次元分布
第6週 5/15 2.2. 多次元正規分布 (1)
第13週
6/19 3.2. 2次形式統計量の分布(2)
7/3
3.4. ウィッシャート分布
第14週 7/10 4.1. t-分布
0. 序論
第15週 7/17 4.2. F-分布
第7週 5/22 2.2. 多次元正規分布 (2)
第16週 7/25 休講 (月曜日授業のため)
第8週 5/29 休講 (水曜日授業のため)
第17週 7/31 4.3. 一元配置分散分析
第9週
6/5
3.1. カイ二乗分布
第18週
8/7
休講 (予定)
注意) 講義の進行状況により内容が変更することがある.
成績: 出席状況とレポートにより判断する.
分布論, Part 1: P.3
分布論, Part 1: P.4
何故分布論が必要か?
推定
分布論は統計的推測のために必要!
今, データ , … , に対して統計モデルを想定する. つまり, デー
タを確率変数 , … ,
の実現値と仮定する. ただし は標本数
,…,
に確率分布を想定 (正規分布などの
とする. ここでは,
分布のタイプを仮定) して以下のようなパラメトリックモデルを考え
る.
P
,…,
⋯
,…,
;
⋯
の推定量を
,…,
とし (推定値は
,…,
)
,…,
と書くこととする. 推定量の良さを測る指数, 平
均 (バイアス) E , 分散 Var , 平均二乗誤差 (mean squared
error: MSE) MSE を計算するためには, が必
要である. また, により計算される の標本分布が分かれば
の区間推定 (例えば a
と言った形で推定) を行うことがで
きる.
推定:
∈ Ω ( は既知, は未知)
次のような統計的推測を行うためには, を仮定し使用する必要
がある.
分布論, Part 1: P.5
仮説検定 (1/2)
分布論, Part 1: P.6
仮説検定 (2/2)
仮説検定: 以下の検定問題
帰無仮説 : ∈ Ω vs対立仮説 : ∈ Ω
Ω Ω
を考える. 一般的な仮説検定の手法では, ある閾値 に対して, 検
,…,
の実現値
,…,
が
,…,
定統計量
であれば を棄却する. ここでは
,…,
と書くことに
する. 仮説検定を行うためには, 具体的な を決定する必要がある.
これは により が正しい下での の標本分布を計算し, 有意水
準に対応する分位点を計算する必要がある. また使用する検定
統計量の良し悪しを測るためには検出力を考える必要がある.
分布論, Part 1: P.7
• 有意水準 : P
|
(通常は
0.05 or 0.01). この
確率は第一種の過誤 ( が正しいにもかかわらず を棄却す
る間違い) を起こす確率に等しい. また が正しい下での の
分布のことを帰無分布 (null distribution) と呼ぶ.
P
| ( ∈ Ω ). この確率は 1 から第
• 検出力 :
二種の過誤 ( が正しいにもかかわらず を採択する) を起こ
す確率を引いたものに等しい. また が正しい下での の分
布のことを対立分布 (non-null distribution) と呼ぶ.
分布論, Part 1: P.8
特性量 (1/2)
統計量の分布
検定統計量, 推定量などを統計量と呼び, 一般的には と書く.
このとき統計量 の分布とは の分布関数 (Distribution
Function; df) や確率密度関数 (Probability Density
Function; pdf) を指す.
: 分布関数
P
: 確率密度関数
注意0.1) 確率変数 の確率密度関数が確率分布 の確率密
度関数であるとき, は に従うといい, ∼ とかく. 確率
変数 , … ,
が互いに独立で同じ確率分布 に従うとき,
,…,
∼ . . . と書く (i.i.d. は independently and
identically distributed の略).
定義 (期待値): 確率変数
に対して, E
を
以下で定義する.
の確率密度関数を
とする. 関数
の期待値 (Expectation) といい,
E
特に,
のとき, E
を平均 (mean) と呼び, 多くの場合,
で表す. また, E
を の 次モーメントと呼び,
で表す.
さらに, E
を の平均周りの 次モーメントと呼び
で表す.
分布論, Part 1: P.9
特性量 (2/2)
定義 (特性量): 以下は確率分布の形状を表す特性量である.
1. 平均: . 確率分布の重心, または中心.
. 確率分布の散らばり.
2. 分散 (Variance):
を標準偏差 (Standard Deviation) と呼ぶ.
3. 歪度 (Skewness):
/ . 確率分布の歪み. 左右対
称な分布であれば
0.
0 のとき, 右に歪んだ分布
(分布の裾が右側に広がっている),
0 のとき, 左に歪んだ
分布 (分布の裾が左側に広がっている) という.
/
3. 分散1に固定したときの
4. 尖度 (Kurtosis):
分布の裾の重さ, または尖り具合. 尖度が大きくなるほど裾の
2 であり,
2 のときは一点分布 (退化
重い分布.
した分布).
正規分布の場合は
0,
0 となることから, 歪度と尖度は
正規性からの逸脱度を表す指標としても用いられる.
分布論, Part 1: P.11
分布論, Part 1: P.10
特性関数
定義 (特性関数): 確率変数 の確率密度関数を
とする.
∀ ∈
に対して, E exp
を の特性関数
(Characteristic Function; cf) といい,
で表す. ( の
ということを明記するために
と書くこともある)
性質 (特性関数):
• 一意性定理: 確率変数
ると,
,
の特性関数を
⟺ と
,
とす
の分布は同じ
• モーメント公式:
E
ここでの条件 E
ために必要である.
∞ ⟹
E
∞ は微分と積分の順序を入れ替える
分布論, Part 1: P.12
計算機を使った分布の近似法 (1/3)
計算機を使った分布の近似法 (2/3)
∼ U 0,1 (U , は区間 ,
このとき の確率密度関数は,
0
1
であり, 分布関数は
Φ
上の一様分布を表す) とする.
0
1
その他
0
0
0
P
1
である. また ∼ N 0,1 (N ,
布を表す) とすると,
Φ
P
1
1
は平均 , 分散
1
2
exp
の正規分
2
分布論, Part 1: P.13
計算機を使った分布の近似法 (3/3)
以上の方法を用いて
,…,
,…,
→
⋮
⋮
,…,
→
は狭義単調増加関数であるので, Φ が存在する. いま,
( ∼ U 0,1 ) とすると,
Φ
P
P Φ
P
Φ
Φ
よって は標準正規分布に従う確率変数であることがわかる. 一
般に, ∼ U 0,1 で, の分布関数
を狭義単調増加関数と
の分布は の分布に等しい. つまり,
したとき,
P
P
P
の分布関数の近似関数を作る. 今,
,…,
⋮
,…,
,…,
と
,…,
の順序は同じである ( は狭
とすると,
義単調増加関数なので). ここで,
,…,
を小さい順に並べて
,…,
とおくと,
P
/ 1, … ,
である.
であるとき,
しかしながら, の具体的な形が分かっていなければ, 上記のような
方法で分布を近似することはできない.
分布論, Part 1: P.15
Example 0.1) , … ,
∼ . . . U 0,1 とするとし,
増加なある分布 の分布関数とする. このとき,
,…,
とすれば
,…,
∼ . . .
を狭義単調
分布論, Part 1: P.14