磯 颯, 若宮 翔子, 荒牧 英治 (NAIST)

ソーシャルメディアにおける発言位置特定とその匿名化
磯 颯, 若宮 翔子, 荒牧 英治 (NAIST)
I. Introduction
IV. Kullback Leibler divergence
✴ SNS上で共有した発言が発言者の意図しない
聴衆の目まで届き,個人のプライバシーが
損なわれる恐れがある.
位置特定が容易
分布のエントロピー
大
✴ Kullback Leibler divergence に基づき,
最も分布を変化させる形態素 v の削除を行う
パンケーキが好きな人
@pancake_lover
久々のなんばパークス!
パンケーキ食べた∼
✴ 発言位置の秘匿化に焦点を当て,位置特定
能力を評価関数とした匿名化手法を導入する.
II. Gaussian Mixture Model
✴ 形態素ごとの発言位置情報分布をGMMで表現.
✴ 混合数 M の推定には,AICを用いる.
s.t.
なんばパークス
M=7
大学
M = 12
ヒカリエ
M = 11
オタロード
M=6
V. Result
久々のなんばパークス!
パンケーキ食べた∼
白良浜
M=2
ウイスキー
M = 10
久々の■■■■■■■!
パンケーキ食べた∼
III. Weighted Sum of GMM
✴ 各形態素 v の確率分布に対し,位置特定能力
に応じた固有の重みを以下の様に定義する.
: 実際の発言位置
✴ 任意の発言位置の推定分布を
形態素ごと推定分布に対する重みづけ和で表現.
VI. Future Work
✴ 複数形態素の組合せによる
位置特定能力と,削除後の分布の変化の検証