F07a

Testing Software In Age Of Data
Privacy: A Balancing Act
Kunal Taneja
Mark Grechanik
Rayid Ghani
Tao Xie
早稲田大学 岸研究室 権藤晃徳
1
背景・目的
• アプリケーションのテストをアウトソーシング
する際、機密データは共有不可(法律で禁止)
– 人工データで代用
… 例外パスの実行、特定パスの見逃し
– データ匿名化
テストカバレッジの悪化、
それに伴うアプリケーションの品質低下
機密データが特定のレベルで保護されている
ことを保証しつつテストの有効性を維持を目標
2
提案アプローチ
PRIvacy Eqqualizer for Software Testing
(PRIEST)を提案
以下の3つのアイデアに基づく
1. プライバシーフレームワーク
データスワッピングによる元の値を保持した匿名化
2. 推測匿名性プライバシーメトリクス
匿名化後のデータベースで達成される機密レベルを定量化
3. データベースの値がアプリケーション動作に
どのように影響を与えるかを判断
テストカバレッジへの影響を把握
メリット
機密レベルに応じた柔軟な匿名化
(最適なテストカバレッジを得ることが可能)
3
PRIESTアーキテクチャ
④
Application
Static
Analysis
Engine
⑤
Attribute
Ranking
Quasi
Identifies
(QIs)
⑥
⑦
⑨
Annonymization
Algorithm
④
①
⑥
②
DBO
Schema
Extractor
③
Schema and
relations
⑧
Privacy
Goal
⑫
⑩
⑪
元データベース
④
⑤
⑥
⑦⑧
⑨⑩
⑪⑫
DBA
匿名データベース
データベースの属性の使用方法を解析
属性がどれだけのステートメントに影響するかをランク付け
ユーザに表示
Privacy Goalに基づいてQIs(準識別子(データ保護のため匿名化すべき属性))を選択
QIsを匿名化アルゴリズムによってプライバシーレベルに応じて匿名化
4
入力としてDBOをとり、DBAを出力
特色(推測匿名性メトリクス)
Name
Age
Procedure or
Prescription
Alice
19
Antidepressants
Bob
15
Antibiotics
Chris
52
Chemotherapy
Diana
25
Abortion
Age
Procedure or
Prescription
Guessing
Anonymity
***
23.1
Antidepressants
2
***
19.4
Antibiotics
2
***
49.3
Chemotherapy
1
***
21.1
Abortion
2
匿名化
Nameを”***”で置き換え
Ageにランダムノイズ
元データベース
※Guessing Anonymity…
Name
匿名データベース
攻撃者が匿名レコードの元レコードを推測する
ために必要な推測回数
従来のk-匿名性などと違い、
各レコードごとの匿名性を定量化する
Chirsの年齢が他に比べ
突出しており推測しやすいため
Guessing Anonymityをもとに異なるメトリクスを提案
PM1:平均推測匿名性(例では1.75)
PM2:特定の値m以上の推測匿名性の割合(例ではm=1で0.75)
Unique records:一意に識別できるレコード数の割合
5
評価
• 3つのオープンソースJavaプログラムとスペイン最大の
スーパーマーケットの物流管理アプリケーションで評価実験
Name
App
Test
DB
[KLOC] [KLOC] [MB]
Tbl
Att
IC ETC
% %
N2A
77.8
19.43
20
506 2514 53 50
DurboDax
2.8
2.0
49
27
114
77 59
UnixUsage
2.8
0.9
21
8
31
61 53
RiskIt
4.3
2.6
628
13
57
62 48
IC…最初のテストカバレッジ
ETC…提案アプローチによる
匿名データでの最悪の
テストカバレッジの推定値
評価項目
RQ1:与えられた機密レベルでどれだけのテストカバレッジを得ることができるか
RQ2:元データを異なる機密レベルのアプリケーションで使用する際、
PRIESTはどれだけ有効か
6
評価
※横軸はp=データを入れ替えた割合、縦軸は図名と同じ
• 従来手法では最大80%のテストカバレッジの減少
が確認されたが、本手法では最大でも26%減
• 機密レベルに応じたテストカバレッジや、
各種メトリクス値を得ることができ、それに基づき
ユーザは柔軟な匿名化を行うことが可能
7