ビッグデータ時代における新たなパーソナルデータ匿名化システム

ビッグデータ時代における新たなパーソナルデータ匿名化システムを開発
——高度にプライバシを保護したままに,データの利用価値を高いままとする
NTTは,ビッグデータ分析に用いられる個人に関す
ることが可能になりました.
る情報(パーソナルデータ)を,高度にプライバシを保
本システムをビッグデータ分析のプロセスに取り入れ
護したまま,分析データ(ビッグデータ)の利用価値を
ることにより,高度なプライバシ保護対策と安全管理措
高いままに加工することが可能な匿名化システムを開発
置を施した分析業務が可能になります.
しました.
開発したシステムはパーソナルデータから個人が直接
特定できる情報を取り除いたうえで,さらにそのデータ
■開発したシステム
今回NTTセキュアプラットフォーム研究所が開発し
から誰か一人に絞り込めないようにデータを加工するこ
た匿名化システムは,パーソナルデータを保有する事業
とで高度なプライバシ保護対策をします.
者向けのソフトウェアで,匿名性と有用性のトレードオ
加工方法は,匿名性の代表的な指標である「k-匿名性*」
フをバランスさせk-匿名性を満たしたうえでデータの有
を満たす匿名化を実装し,従来から知られている希少な
用性が損なわれにくい匿名化データを得ることができる
人のデータを取り除く「削除」,項目の値をより粗くす
特徴を持ちます.このため,自社内外で分析を行う際に
る「一般化」に加え,NTTが独自に開発した手法であ
この匿名化データを用いることで,プライバシ保護の高
る「Pk-匿名化」をパーソナルデータの種類や分析目的
度な対策を行ったパーソナルデータ分析を行うことがで
に合わせて柔軟に選択できるため,従来困難とされてい
きます.事業者は,保有するパーソナルデータを匿名化
た高度なプライバシ保護対策を行った場合の利用価値の
システムに入力し,①匿名化処理方法の選択,②分析に
低下を実用的なレベルで押さえた分析用データを作成す
用いるパーソナルデータの項目の選択,③匿名性のパラ
*k-匿名性:匿名化したデータから個人の識別が困難であることを示す安全性
の代表的な指標で,“複数の項目で同じ値の組合せが少なくともk個存在する
こと”を表します.
個人が特定できる情報 個人の属性,行動情報など
(氏名…)
(購買・移動履歴…)
メータ(kの値)の決定をすると,k-匿名性を満たしか
つデータの有用性の高い「匿名化データ」が出力されま
す(図).
パーソナルデータ
匿名化システム
個人の属性,行動情報など
(購買・移動履歴…)
高度にプライバシを
保護し利用価値が高い
・ 削除
・ 一般化
・ Pk-匿名化
パーソナルデータ
匿名化データ
図 匿名化システムの処理イメージ
NTT技術ジャーナル 2014.5
51
本システムはk-匿名性を確保する匿名化処理として,
NTTは世界で初めてk-匿名性と等価な安全性を持つラ
「削除」「一般化」,NTTが独自に開発した「Pk-匿名化」
ンダム化法を開発し,そのことを理論的に示しました.
を備え,データの種類や分析目的に応じて使い分けるこ
Pk-匿名化によって作成されるデータは,従来の削除
とができます.削除は頻出データの分析に,一般化は全
と一般化によるものと比べ,理論的に同等のk-匿名性を
体傾向の把握に,Pk-匿名化は「長いデータ」の分析に
持ったうえで,十分に実用的な分析が行えることが実験
有用です.特に,多項目を持つ「横に長い」ビッグデー
的に明らかになっています.また,Pk-匿名化は多数の
タの匿名化を行うときは,ビッグデータ匿名化のジレン
項目を持つパーソナルデータを匿名化する場合に有効で
マを回避するために,分析項目を選択して「横に短い」
す.従来の手法で知られていた,繰り返しオーダーメイ
データにして加工する「オーダーメイド匿名化」を推奨
ド匿名化をした際のk-匿名性の喪失の問題に対する耐性
しています.Pk-匿名化を用いれば,分析の目的に合わ
を持つため,多項目のパーソナルデータに対してもプラ
せて異なる項目の組み合わせでオーダーメイド匿名化
イバシを保護し,利用価値が高い分析用データに加工す
を繰り返す場合でも,全体を通じてk-匿名性が損なわれ
ることができます.
ません.
■開発した技術の特徴
NTTが独自に開発したPk-匿名化は「ランダム化」の
一種で,個々のデータを確率的に変化させる処理と「ベ
イズ推定」と呼ばれる機械学習の手法により元の状態を
推定する処理を行い,k-匿名性を満たした利用価値の高
いデータを作成します.これまでランダム化したデータ
◆問い合わせ先
NTTサービスイノベーション総合研究所
広報担当
TEL 046-859-2032
E-mail randd lab.ntt.co.jp
URL http://www.ntt.co.jp/news2014/1402/140207b.html
の 匿 名 性 指 標 は 明 ら か に な っ て い ま せ ん で し た が,
情報を守りつつ,上手に使って,より良い社会を
廣田 啓一
/五十嵐 大
/菊池 亮
/正木 彰伍
NTTセキュアプラットフォーム研究所
研究者
研究者
紹介
紹介
情報セキュリティプロジェクト
私たちのチームでは,暗号理論をコアとした安全なデータ流通,パーソナルデー
タの保護と活用を実現する,情報セキュリティ基盤の技術開発を進めています.元々
は暗号技術によって情報を守る研究が主眼でしたが,情報を活用するためのセキュ
リティとしての匿名化技術の研究を始めるようになりました.
昨今,さまざまな分野でパーソナルデータへの関心が高まっています.買い物の
情報,移動の情報,健康に関する情報といった,一人ひとりの個人に関する情報が
日々刻々とたまっていく中で,こうした情報を集約して,利活用することで,より
豊かなサービスを提供したいと考えるのは自然な流れです.パーソナルデータの利
(後列左から)菊池亮/五十嵐大
活用は,安全性と有用性をバランス良く両立することが重要です.サービスを提供す (前列左から)正木彰伍/廣田啓一
る事業者と,そのサービスを利用するユーザの両方に,安心して使っていただける,
安全な匿名化技術の実現を目指しています.
プライバシの基準や考え方は国や人によっても違っているので,厳密に正解といえる答えがないのが悩ましいところです.そんな中,
技術的な根拠に裏付けられた匿名化のあり方をしっかりと示していくことで,皆が納得できるパーソナルデータの利活用の方法を一緒
になって考えていきたいと思います.
52
NTT技術ジャーナル 2014.5