未知のグラフに対する影響最大化アルゴリズムの提案と評価

はじめに
問題の定式化
提案方式
実験
まとめ
未知のグラフに対する
影響最大化アルゴリズムの提案と評価
三原 正大 1
津川 翔 2
大崎 博之 1
関西学院大学 理工学研究科 1
筑波大学 システム情報系 2
2015 年 05 月 28 日
第 37 回インターネット技術第 163 委員会研究会
1 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
研究の背景
近年、Twitter や Facebook に代表されるソーシャルメディ
アを数多くのユーザが利用している
ソーシャルメディアは、単なるユーザ間の交流のための場
としてだけでなく、情報拡散やマーケティングの場として
も注目を集めている
ソーシャルメディアにおける情報拡散やマーケティングを
効率的・効果的に行うためには、影響力の強いユーザを特
定することが重要である
第 37 回インターネット技術第 163 委員会研究会
2 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
影響最大化
人と人との関係をグラフとし
て表現したソーシャルネット
ワークにおいて、影響力の強
い少数のノード (シードノー
ド) の集合を特定する影響最
大化アルゴリズムの研究が活
発に行われている
第 37 回インターネット技術第 163 委員会研究会
3 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
従来研究と本研究
従来の影響最大化アルゴリズムは、ソーシャルネットワー
クの構造が既知であることを前提としている
⇒ 現実には、ソーシャルネットワークの現在の構造を完全
に把握することは非常に困難である
そこで本研究では、ソーシャルネットワークの構造が未知
であることを前提とする影響最大化問題と、その発見的解
法を提案する
第 37 回インターネット技術第 163 委員会研究会
4 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
重みなし無向グラフ G = (V, E) 上の影響伝搬を考える
▶
各ノードはソーシャルメディアのユーザに相当する
▶
各リンクはユーザ間の関係に相当する
初期状態においては、
V = {v1 , . . . , vN } (N : グラ
フ G のノード数) のみが既
知であり、グラフ G の構
造、すなわち E は未知で
あるとする
1
2
1
4
2
3
real graph
4
3
unknown graph
R 回のラウンドが存在し、各ラウンドにおいて、自由に選
択した m 個のノードの探査と、自由に選択した κ 個のノー
ドからの影響伝搬が可能であるとする
第 37 回インターネット技術第 163 委員会研究会
5 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
ノードの探査
▶
ノード v の隣接ノードのリストを取得できる
ノードからの影響伝搬
▶
影響伝搬のモデルに従う
▶
影響伝搬の結果として、影響を受けたノードのリスト
が得られる
R 回のラウンド中に影響を受けた (重複を除く) ノード数の
合計を最大化することを目的とし、各ラウンドごとに、探
査するノードとシードノードを選択する
第 37 回インターネット技術第 163 委員会研究会
6 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
IMUG のアイディア
( Influence Maximization for Unknown Graphs )
(1) 過去のラウンドにおける m 個のノードの探査と κ 個の
ノードからの影響伝搬の結果から、各ノードの次数を推
定し、
(2) 次のラウンドでは、過去に影響を受けていないノードの
中から次数の期待値が大きい順に κ 個のノードをシード
ノードとして選択する
現実のネットワークでは極端に次数の大きなハブノードが
存在することが分かっている
⇒ ノードの探査は、ハブノードを効率的に発見するのに有
効であるとされる SEC 法を用いる
第 37 回インターネット技術第 163 委員会研究会
7 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
IMUG の各ラウンドにおける動作 (1/2)
step 1. 以下の a, b, c を m 回繰り返す
a) 次数が未知であり、なおかつ次数の期待値が一番大きい
ノードを探査ノード vp として選択する
b) ノード vp を探査し、ノード vp の隣接ノードのリストを
得る
c) ノード vp の次数を既知とするとともに、vp の隣接ノード
の次数の期待値を 1 ずつ増加させる
example
step1-a
1
2
1R
4
3
step1-b,
step1-c
vp
1
2
4
3
1
2
3
4
->
->
->
->
0
0
0
0
1
2
4
3
1
2
3
4
->
->
->
->
3
1
1
1
real graph
▶
ノード番号 -> そのノードの次数の期待値 を表す
第 37 回インターネット技術第 163 委員会研究会
8 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
IMUG の各ラウンドにおける動作 (2/2)
step 2. 過去のラウンドで影響を受けていないノードの中か
ら、次数の期待値が大きい順に κ 個のノードをシードノー
ドとして選択する
step 3. 各シードノードから影響伝搬を行い、影響を受けた
ノードのリストを得る
step3
step2
1
2
seed
4
3
1
1
2
3
4
->
->
->
->
3
1
1
1
2
4
3
1
2
3
4
->
->
->
->
3
1
1
1
第 37 回インターネット技術第 163 委員会研究会
2R...
9 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
実験の目的
シミュレーション実験により、提案する IMUG が、未知の
グラフに対する影響最大化アルゴリズムとしてどの程度有
効であるかを評価する
ネットワーク生成モデルを用いて生成したグラフおよび現実
のソーシャルネットワークを表現するグラフ上で、IMUG
を用いた影響伝搬のシミュレーション実験を行い、各ラウン
ドにおいて影響を受けた (重複を除く) ノード数を調査する
さらに、影響伝搬確率やグラフのトポロジの違いが、影響
伝搬の結果にどのように影響するかを議論する
第 37 回インターネット技術第 163 委員会研究会
10 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
実験方法 (1/2)
グラフ : ネットワーク生成モデルを用いて生成したグラフ
▶ ER モデル : 次数分布が二項分布に従うランダムグラフ
を生成
▶
BA モデル : 次数分布がべき分布に従うスケールフリー
グラフを生成
▶ 多くの現実のソーシャルネットワークにおいて、そ
の次数分布はべき分布に従うことが知られている
および現実のソーシャルネットワークを表現するグラフ
影響伝搬のモデル : IC モデル
▶ シードノードは、確率 p (影響伝搬確率) で各隣接ノー
ドに影響を伝搬させる
全ノードペアについて共通の値 p を用いる
第 37 回インターネット技術第 163 委員会研究会
11 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
実験方法 (2/2)
比較対象 :
▶
▶
▶
random - ランダムにシードノードを選択する方式
random-degree - 各ラウンドにおいて過去のラウンド
で探査されていないノードの中からランダムに選択し
た m 個のノードを探査し、過去のラウンドで影響を受
けていないノードの中で次数の期待値が一番大きい
ノードをシードノードに選択する方式
DegreeDiscountIC - グラフの構造が既知の場合に良好
な性能を示すことが知られている既存のアルゴリズム
今回は、IMUG および random-degree のパラメータとし
て m = ノード総数の 0.1 % を用いた
第 37 回インターネット技術第 163 委員会研究会
12 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
実験結果 [ER, BA モデル]
model=ER, N=10000, k=50, p=0.01
250
200
150
100
IMUG
random
random-degree
DegreeDiscountIC
50
0
0
10 20 30 40 50 60 70 80 90 100
round r
average number of active nodes
average number of active nodes
IMUG では、ラウンドが経過するにつれて、探査によって
ハブノードを発見できる可能性が高くなるため、多くの
ノードに影響を伝搬させることができている
⇒ ハブノードが存在することが知られている現実のソー
シャルネットワークにおいて効率的に動作すると期待される
model=BA, N=10000, k=50, p=0.01
10000
9000
8000
7000
6000
5000
4000
3000
2000
1000
0
IMUG
random
random-degree
DegreeDiscountIC
0 10 20 30 40 50 60 70 80 90 100
round r
第 37 回インターネット技術第 163 委員会研究会
13 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
実験結果 [現実のネットワーク]
network=NetHEPT, N=15,233, k=7.7, p=0.01
140
120
100
80
60
IMUG
random
random-degree
DegreeDiscountIC
40
20
0
0
10 20 30 40 50 60 70 80 90 100
round r
average number of active nodes
average number of active nodes
IMUG によって各ラウンドにおいて影響を受けたノード数
は DegreeDiscountIC の 60 - 90%以上
⇒ IMUG は現実のネットワークにおいて効率的に動作する
と言える
network=Amazon, N=262,114, k=9.4, p=0.01
300
IMUG
random
random-degree
DegreeDiscountIC
250
200
150
100
50
0
0
10 20 30 40 50 60 70 80 90 100
round r
第 37 回インターネット技術第 163 委員会研究会
14 / 15
はじめに
問題の定式化
提案方式
実験
まとめ
▶
まとめ
▶ ソーシャルネットワークの構造が既知ではなく、
未知であることを前提とする影響最大化問題と、
その発見的解法 IMUG を提案した
▶ 実験の結果、提案する IMUG が未知のグラフに対
する効率的な影響最大化アルゴリズムとして動作
していることがわかった
▶
今後の課題
▶ IMUG の性能の理論的解析
▶ 探査ノード選択方法の改善
▶ それらに基づく IMUG の改良
第 37 回インターネット技術第 163 委員会研究会
15 / 15