ランダムグラフにおけるグラフ構造のブートストラップ

ランダムグラフにおけるグラフ構造のブートストラップの性質
大阪大学大学院基礎工学研究科
永田晴久
大阪大学大学院基礎工学研究科
下平英寿
本研究では，グラフ構造で表されるデータに対するブートストラップ法を提案する．グラフ構造にブート
ストラップ法が適用できれば，グラフ上の統計量の分布を観測データから求めることができるようになる．
しかし，グラフ構造はノード集合とエッジ集合の組として表されるため，通常の標本データと違ってリサン
プリング方法は自明ではなく，従来法をそのまま適用できないという問題がある．また，グラフ構造に対す
るブートストラップ法の研究は少なく，数理的な考察はほとんど行われていないのが現状である．
1
グラフ構造に対するブートストラップ法
いま，ノード数 n の無向グラフ G が観測されているとし，G の隣接行列を X = (xij ) とする．また，
エッジの総数を m =
∑
i<j
xij とおく．
提案法では，ブートストラップ複製 G∗ の隣接行列 X ∗ = (x∗ij ) を，次のように生成する．
∗
Xij
∗
Xij
∼ Po(1) (i < j, xij = 1)
= 0
(i < j, xij = 0)
このとき，G∗ は，多重エッジを持つ無向グラフとなる．
この複製方法は，エッジリサンプリング [1] の考えに基づいている．エッジリサンプリングとは，G のエッ
ジ集合 E = {e1 , . . . , em } を標本集合として，新しい標本集合 E ∗ = {ei(1) , . . . , ei(m) } を生成することであ
る．この方法で G∗ を作った場合には，エッジ数が元のグラフ G と常に等しく，ブートストラップ法として
適切でない場合がある．そこで，先に E ∗ の要素数 m∗ をポアソン分布 Po(m) によって決め，サンプリング
回数を変化させることで対応したのが上記の方法である．
2
ランダムグラフにおけるブートストラップ統計量
グラフ構造に対するブートストラップ法の例として，ランダムグラフにおけるエッジ数の分散の推定を考え
る．ランダムグラフ（Erd˝
os-R´enyi モデル）は，エッジ生成確率 p をパラメータとして Xij ∼ Bi(1, p) i.i.d.
によって生成される確率グラフである．このとき，エッジ数に関する統計量 T を
1 ∑
T (X) = √
Xij
n p i<j
とおくと，n → ∞ の極限で
E [V{T (X ∗ )|X}] = V{T (X)}
となる．ただし，p は n に依存して決まるとする．
同様にして，ノード次数など，Xij の部分和で表される統計量についても分散の一致性が成り立つ．この
結果は，Stochastic Block Model のようなランダムグラフベースのモデルにも容易に拡張できる．
参考文献
[1] 永田晴久，下平英寿 (2011)．グラフ構造のリサンプリングを行うブートストラップ法．2011 年度統計関
連学会連合大会．

Download Report