n - 統計数理研究所 学術研究リポジトリ[RISM]

2014 年 6 月 13 日 統計数理研究所 オープンハウス
Bell 多項式と Gibbs 分割
間野 修平
数理・推論研究系 准教授
0 本ポスターの内容
(2) vn,k の n, k への依存が分離 (Pitman 2006),すなわち
確率分割の研究においては,様々な良い性質をもつがゆえに Pitman 分
割が主な対象で,一般化としての Gibbs 分割が提案されたのは最近です.
従来の Pitman 分割へのアプローチはその性質に依存していて,一般の
Gibbs 分割には適用できないものが多いです.本ポスターは,順序統計量
について,任意の Gibbs 分割に適用できるアプローチを紹介しています.
vk
vn,k =
.
Bn(v·, w·)
例 1 要請 (1) と (2) を課すと良く知られている Pitman 分割 (1995, Ewens
1972) になります.R の確率測度 µ と任意の有限分割 {B1, ..., Bk } に対して
(D(B1), ..., D(Bk )) ∼ Dirichlet(θµ(B1), ..., θµ(Bk ))
1 Bell 多項式
自然数の集合 [n] := {1, ..., n} を k の部分集合への分割を Pk[n] とし,P[n] :=
∪nk=1Pk[n] とします.2 つの非負の数列 v· := (v1, v2, ...) と w· := (w1, w2, ...)
により,分割の数に v·,部分集合の大きさに w· で定まる数を割り当てる
と,そのような構造物の数は
Bn(v·, w·) :=
n
∑
vk Bn,k (w·),
∑
Bn,k (w·) :=
k
∏
3
w|Ai|.
{A1,...,Ak }∈Pk[n] i=1
k=1
で与えられます.多重度 mi = #{ j : |A j| = i} を用いると,
Bn,k (w·) = n!
n ( )m
∏
wi i 1
.
i!
mi !
∑
(1)
∑
∑
m·: m=k, imi=n i=1
となるランダム測度 D を母数 θ の Dirichlet 過程 (Ferguson 1973) とよび,
ノンパラメトリック・ベイズにおける共役事前分布として使われます.
Dirichlet 過程からの標本は α = 0, vk = θk の Pitman 分割に従い,その構成
は中華料理店過程として知られています.また,順序統計量 n(·)n−1 の極
限分布は Poisson-Dirichlet 分布として知られています.
と表せます.これは w· の多項式ですが,Bell 多項式 (1927) とよばれます.
k
n 1 2
3
4
5
1 w1
2 w2 w21
3 w3 3w1w2
w31
4 w4 4w1w3 + 3w22
6w21w2
w41
5 w5 5w1w4 + 10w2w3 10w21w3 + 15w1w22 10w31w2 w51
表 1.Bell 多項式
関連づけられた Bell 多項式
組み合わせ論において良く知られている Fa`a di Bruno の公式を用いるこ
(r),(i)
とで,(1) の和を n(i) ≤ r のみについてとる Bell 多項式 Bn,k (v·, w·) の指数
母函数
i−1
∞
j (r)
n
∑
∑
(
w
˘
(u))
(w˘ (u))k− j
u
(r+1)
(r)(i)
Bn,k (w·) =
n!
j!
(k − j)!
j=0
n=k
を得ることができます.ここで,w˘ (r+1)(u), w˘ (r)(u) はそれぞれ w· の指数
母函数において w1 = · · · = wr = 0, wr+1 = wr+2 = · · · = 0 としたもので
す.このようにして得られる Bell 多項式は,組み合わせ論において associated Stirling number of the first kind のように “associated ...” とよばれる
拡張に対応するので,関連づけられた Bell 多項式とよんでおきます.
4
順序統計量
分割の数 Kn の分布は vn,k Bn,k (w·) で与えられますので,条件つき分布は
n! ∏ ( wi )mi 1
P(|Πn|· = m·|Kn = k) =
Bn,k (w·)
i!
mi!
n
i=1
2 Gibbs 分割
分割の形で与えられるデータを統計解析に供するためには分割の確率モ
デルが必要ですが,そのようなモデルを確率分割とよびます.交換可能
性は妥当な仮定ですから,
P(Πn = {A1, ..., Ak }) = pn(|A1|, ..., |Ak |)
で与えられ,Kn は v· の十分統計量です.これは統計力学における w· を微
視的状態の数とするミクロカノニカル Gibbs 分布で,順序統計量は条件
をつけた状態の数え上げから得られます.例えば,順序統計量の周辺分
布は次のように表せることが直ちに分かります.
P(|Πn|(1) ≤ r) =
を満たす対称な函数を導入し,exchangeable partition probability function
(EPPF) とよびます.Gibbs 分割は広いクラスの確率分割で,EPPF は
pn(n1, ..., nk ) = vn,k
k
∏
P(|Πn|(i) ≤ r) =
wni
もしくは,多重度で表すと
pn(m1, ..., mn) = n!vn,k
i=1
wi )mi 1
i!
mi!
P(|Πn|(1) ≤ r) =
です.次の自然な要請をすることがあります.
(1) 1 つの標本点を除いた標本が同じ EPPF に従う (Gnedin & Pitman 2005)
wi = (1 − α)(2 − α) · · · (i − 1 − α),
i ≥ 2,
(r)(1)
vn,k Bn,k (w·),
k=⌈n/r⌉
i−1
∑
n
∑
k=1
k=i
vn,k Bn,k (w·) +
(r)(i)
vn,k Bn,k (w·),
2 ≤ i ≤ n,
ここで,|Πn|(i>Kn) = 0 としました.このように,順序統計量の議論は関
連づけられた Bell 多項式とその混合の解析に帰着します.例えば,
i=1
n (
∏
n
∑
w1 = 1.
√
n!
2π −1Bn(v·, w·)
v˘ n(w˘ (r)(u))
du,
n+1
u
n → ∞, r = o(n)
のような漸近評価をすることができます.このような結果は形式的です
が,任意の Gibbs 分割にあてはまりますし,Pitman 分割について知られ
ている性質を容易に導くこともできます.ただし,解析の難しさはモデ
ルの性質に依存しますし,モデルに固有の性質を用いるアプローチの方
がモデルのより深い理解につながることもあるでしょう.