完備十分統計量についての補足 - So-net

完備十分統計量についての補足
分散分析第1回講義:補足資料1
土居正明
1 はじめに
「最尤法と十分統計量」の資料において、
「完備十分統計量」というものを考えましたが、そのときは「完備十分統計量と
は何か?」という問題には深入りしませんでした。「定理1」を使えば完備十分統計量かどうかを判断でき、完備十分統計量
があれば「定理2」や「系3」を用いて、不偏推定量が UMVU かどうかを判断できる、という流れでご説明しました。
基本的にこの流れさえ理解しておいていただければ十分なのですが、「完備十分統計量とは何か?」が分からなければ気
持ち悪いかたもいらっしゃるかと思いますので、定義とそれにまつわるイメージをご説明します。
2 定義とイメージ
イメージで言いますと、完備十分統計量とは 十分統計量の中で、情報が最も凝縮されたもの です。
2.1 定義の復習
まず、完備十分統計量の定義を復習しておきましょう。
「定義:完備十分統計量」
十分統計量 T (X) の任意の関数 g(T ) において、
Eθ (g(T )) = 0 (∀θ) =⇒ g(T ) ≡ 0
が成り立つとき、T (X) は完備十分統計量であるという*1 。
2.2 具体例とイメージ
では、簡単な具体例で完備十分統計量のイメージをご紹介しましょう。数学ではよくあることですが、今回のように「完
備十分統計量とは何か?」を考える場合には、「十分統計量でないもの」を同時に考える方が分かりやすいことがよくあり
ます。
2.2.1 具体例
正規分布の場合を考えます。簡単のため分散 σ 2 は既知 (=10) としておきましょう。
x1 , · · · , xn ∼ N (µ, 10)
において、µ の完備十分統計量は例えば
T (X) = (T1 (X)) =
( n
∑
)
Xi
i=1
「g(T ) ≡ 0」とは「∀T に対して g(T ) = 0 が成り立つこと」です。したがって、「g(T ) ≡ 0」とは「g(T ) = 0 となる T が存在すること」です。
「∀T に対して g(T ) = 0 であること」ではありません。
*1
1
でした*2 。そして、
(
T (X) = (T1 (X), T2 (X)) =
X1 ,
n
∑
)
Xi
i=2
は十分統計量ではありますが、完備十分統計量ではありません。
2.2.2 定義との比較
では、2つの十分統計量 T (X), T (X) について、定義をもとにして比較してみましょう。簡単なのは完備十分統計量で
はない方ですので、T (X) にまず注目してみます。
最初に、「完備十分統計量の定義を満たさない」ということはどういうことかを述べておきましょう。完備十分統計量の
否定を考えればよいので、
「性質:完備十分統計量でない十分統計量」
十分統計量 T (X) に対してある関数 g(T ) ≡ 0 が存在して、
Eθ (g(T )) = 0 (∀θ)
が成り立つ。
となります。さて、今の状況に当てはめますと、θ に µ を入れればよくなります。今
(
T (X) = (T1 (X), T2 (X)) =
X1 ,
n
∑
)
Xi
i=2
でした。
まずは定義に沿っていきましょう。とりあえず天下りに g(T ) を
g(T ) = T1 −
とおきます。このとき、
1
T
n−1 2
[
]
1
Eµ [g(T )] = Eµ T1 (X) −
T2 (X)
n−1
[
]
n
1 ∑
= Eµ X1 −
Xi
n − 1 i=2
=µ−µ
=0
(∀µ)
となり、確かに T (X) は完備十分統計量ではなくなります。
しかし、これ では g(T ) とは何 なのか さっぱり分か らないと思 い ますので、詳細 を見てみること にしましょう 。
g (T ) = T1 −
1
n−1 T2
の前半と後半のそれぞれの期待値を考えてみますと、
[
Eµ
より、T1 (X),
1
n−1 T2 (X)
Eµ [T1 (X)] = µ (∀µ)
]
1
T2 (X) = µ (∀µ)
n−1
の両方が µ の不偏推定量 になっています。このように µ の完備十分統計量でない T (X) におい
ては、µ の不偏推定量が2種類作れるのです。ここで、「十分統計量」とは「データをまとめたもの」でしたので、「T1 (X)
と T2 (X) の両方で µ が作れるのなら、それをまとめた十分統計量の方が µ の推定値としてより情報量が多くなる*3 」とい
う風に考えて、その「最もまとめたもの」を完備十分統計量と呼んでやろう、という風になったのです。
∑
n
1
「定理1」を思い出していただくと、例えば n
i=1 Xi も完備十分統計量になることがお分かりいただけると思います。
*3 別の言い方では、情報が「より凝縮している」ということです。
*2
2
3 まとめ
つまり、µ の完備十分統計量とは µ の十分統計量の中で、最も情報が集約されたもの という風に解釈できます。
もう少しつけ加えましょう。上の例で、要素を2つ持つ 完備でない十分統計量 T (X) = (T1 (X), T2 (X)) からは µ の不
偏推定量が2つ作り出せました。そこで、この T1 (X) と T2 (X) を合わせて1つしか不偏推定量を作ることができないとこ
(
)
ろまで凝縮させた十分統計量 T (X) = T1 (X) + T2 (X) = (
∑n
3
i=1
Xi ) が完備十分統計量なのです。