2014 年 6 月 13 日 統計数理研究所 オープンハウス Bell 多項式と Gibbs 分割 間野 修平 数理・推論研究系 准教授 0 本ポスターの内容 (2) vn,k の n, k への依存が分離 (Pitman 2006),すなわち 確率分割の研究においては,様々な良い性質をもつがゆえに Pitman 分 割が主な対象で,一般化としての Gibbs 分割が提案されたのは最近です. 従来の Pitman 分割へのアプローチはその性質に依存していて,一般の Gibbs 分割には適用できないものが多いです.本ポスターは,順序統計量 について,任意の Gibbs 分割に適用できるアプローチを紹介しています. vk vn,k = . Bn(v·, w·) 例 1 要請 (1) と (2) を課すと良く知られている Pitman 分割 (1995, Ewens 1972) になります.R の確率測度 µ と任意の有限分割 {B1, ..., Bk } に対して (D(B1), ..., D(Bk )) ∼ Dirichlet(θµ(B1), ..., θµ(Bk )) 1 Bell 多項式 自然数の集合 [n] := {1, ..., n} を k の部分集合への分割を Pk[n] とし,P[n] := ∪nk=1Pk[n] とします.2 つの非負の数列 v· := (v1, v2, ...) と w· := (w1, w2, ...) により,分割の数に v·,部分集合の大きさに w· で定まる数を割り当てる と,そのような構造物の数は Bn(v·, w·) := n ∑ vk Bn,k (w·), ∑ Bn,k (w·) := k ∏ 3 w|Ai|. {A1,...,Ak }∈Pk[n] i=1 k=1 で与えられます.多重度 mi = #{ j : |A j| = i} を用いると, Bn,k (w·) = n! n ( )m ∏ wi i 1 . i! mi ! ∑ (1) ∑ ∑ m·: m=k, imi=n i=1 となるランダム測度 D を母数 θ の Dirichlet 過程 (Ferguson 1973) とよび, ノンパラメトリック・ベイズにおける共役事前分布として使われます. Dirichlet 過程からの標本は α = 0, vk = θk の Pitman 分割に従い,その構成 は中華料理店過程として知られています.また,順序統計量 n(·)n−1 の極 限分布は Poisson-Dirichlet 分布として知られています. と表せます.これは w· の多項式ですが,Bell 多項式 (1927) とよばれます. k n 1 2 3 4 5 1 w1 2 w2 w21 3 w3 3w1w2 w31 4 w4 4w1w3 + 3w22 6w21w2 w41 5 w5 5w1w4 + 10w2w3 10w21w3 + 15w1w22 10w31w2 w51 表 1.Bell 多項式 関連づけられた Bell 多項式 組み合わせ論において良く知られている Fa`a di Bruno の公式を用いるこ (r),(i) とで,(1) の和を n(i) ≤ r のみについてとる Bell 多項式 Bn,k (v·, w·) の指数 母函数 i−1 ∞ j (r) n ∑ ∑ ( w ˘ (u)) (w˘ (u))k− j u (r+1) (r)(i) Bn,k (w·) = n! j! (k − j)! j=0 n=k を得ることができます.ここで,w˘ (r+1)(u), w˘ (r)(u) はそれぞれ w· の指数 母函数において w1 = · · · = wr = 0, wr+1 = wr+2 = · · · = 0 としたもので す.このようにして得られる Bell 多項式は,組み合わせ論において associated Stirling number of the first kind のように “associated ...” とよばれる 拡張に対応するので,関連づけられた Bell 多項式とよんでおきます. 4 順序統計量 分割の数 Kn の分布は vn,k Bn,k (w·) で与えられますので,条件つき分布は n! ∏ ( wi )mi 1 P(|Πn|· = m·|Kn = k) = Bn,k (w·) i! mi! n i=1 2 Gibbs 分割 分割の形で与えられるデータを統計解析に供するためには分割の確率モ デルが必要ですが,そのようなモデルを確率分割とよびます.交換可能 性は妥当な仮定ですから, P(Πn = {A1, ..., Ak }) = pn(|A1|, ..., |Ak |) で与えられ,Kn は v· の十分統計量です.これは統計力学における w· を微 視的状態の数とするミクロカノニカル Gibbs 分布で,順序統計量は条件 をつけた状態の数え上げから得られます.例えば,順序統計量の周辺分 布は次のように表せることが直ちに分かります. P(|Πn|(1) ≤ r) = を満たす対称な函数を導入し,exchangeable partition probability function (EPPF) とよびます.Gibbs 分割は広いクラスの確率分割で,EPPF は pn(n1, ..., nk ) = vn,k k ∏ P(|Πn|(i) ≤ r) = wni もしくは,多重度で表すと pn(m1, ..., mn) = n!vn,k i=1 wi )mi 1 i! mi! P(|Πn|(1) ≤ r) = です.次の自然な要請をすることがあります. (1) 1 つの標本点を除いた標本が同じ EPPF に従う (Gnedin & Pitman 2005) wi = (1 − α)(2 − α) · · · (i − 1 − α), i ≥ 2, (r)(1) vn,k Bn,k (w·), k=⌈n/r⌉ i−1 ∑ n ∑ k=1 k=i vn,k Bn,k (w·) + (r)(i) vn,k Bn,k (w·), 2 ≤ i ≤ n, ここで,|Πn|(i>Kn) = 0 としました.このように,順序統計量の議論は関 連づけられた Bell 多項式とその混合の解析に帰着します.例えば, i=1 n ( ∏ n ∑ w1 = 1. √ n! 2π −1Bn(v·, w·) v˘ n(w˘ (r)(u)) du, n+1 u n → ∞, r = o(n) のような漸近評価をすることができます.このような結果は形式的です が,任意の Gibbs 分割にあてはまりますし,Pitman 分割について知られ ている性質を容易に導くこともできます.ただし,解析の難しさはモデ ルの性質に依存しますし,モデルに固有の性質を用いるアプローチの方 がモデルのより深い理解につながることもあるでしょう.
© Copyright 2025 ExpyDoc