音声知覚とプライバシー保護 - ICTSFC|情報サービス連携コンソーシアム

音声知覚とプライバシー保護
2015年6月10日
ID・認証連携とデータ連携による
地域ICTイノベーション・ワークショップ@金沢
赤木正人
北陸先端科学技術大学院大学(JAIST)
研究の基本コンセプト
 基本路線(ヒトの振り見て吾が振り直す)
 話す・聞くは人間の営み → 人間を知り,そして,営みを記述するこ
とで,高度の音処理システムの実現を目指す
 研究範囲:音声知覚,音声生成
関連分野
生理/心理学的知見
+ ディジタル信号処理
主な研究分野
赤木研究室:音声発話,音環境,音声知覚
2
観測

モデル化

応用
なぜ,赤木はここにいるのか?
 ワークショップのキーワードは
 「地(知)の拠点大学群と自治体、企業の協働による地方創生」
 地域社会と大学群、自治体、企業等との協働の事例紹介
 北陸先端科学技術大学院大学・音情報処理研究室(赤木)とグロ
ーリー株式会社(http://www.glory.co.jp/)との協働による,会話
音声セキュリティ機器開発
 発端
 2003年秋,私の知人の紹介でグローリー工業(当時)の担当者
と面会。「会話音声のプライバシー保護はできないか?」
 2004年から共同研究開始
3
問題の所在(まずはビデオで)
4
©グローリー
問題の所在 (2)
 音声プライバシー保護
出てしまった音声をどのようにわからなくするか?
 どこで?
 銀行店舗や病院外来,薬局の店頭などのオープンスペース
 なぜ?
 周りに会話が漏れてしまい,会話の機密やプライバシーが十分に
保護されていない
 何が問題?
 預貯金の金額,自らの病気のことなど,他人には知られたくない
情報が漏れないか心配
 聞こえてくることも,ある意味,迷惑
5
問題の所在 (3)
 音声プライバシー保護:どうやって護る?
 音を外に出さない
 会話音声が漏れ出ないようにする → 防音壁あるいは密閉さ
れた部屋等を用いて発話者を隔離する
 しかし,オープンスペース店舗の都合上,困難
 音を物理的に消す
 アクティブノイズコントロール(ANC)などを使用して対話し
ている人たち以外のところすべての場所で音を消す
 しかし,対象範囲の広さを考えれば,非現実的
6
問題の所在 (4)
 別の音を呈示することにより目的の音を聞こえなくする
 パワーマスキング:大きな音で知覚的に消す
 プライバシー保護を確実にするためにはマスク音のレベルを上
昇させなければならない
 結果として「うるさく」感じられてしまう
 これを避けるためにマスク音のレベルを下降させる
 会話音声が聴取可能となる
 すなわち,プライバシー保護のためには,
 「うるさい」と感じられたとしてもマスク音のレベルをある程度
高く保つ必要あり
7
 このような状況では,顧客相手の銀行,薬局などでの利用は難
しい
目的
 プライバシー保護の新しい手法
 音の「知覚的融合」に関する知見にもとづいた手法
8
手法の概要
9
©グローリー
音の選択的聴取:分凝とは?
分凝(Segregation)
分離
群化
音脈形成
10
知覚的融合による音声プライバシー保護
 音の選択的聴取の知見を逆に適用する
 原理
 分凝と融合:
 分凝できず,一つの音に聞こえてしまう音とは?
 知覚的融合
 物理的に二つの音が存在するにもかかわらず,すべてが融合して
一つの音脈となり単独の音しか聞こえない場合
→ 音声が正しく分凝できなくなり,聞こえてくる音は本来持っている
言語情報とは異なる情報を持つ
→ 聴取者は聞こえてくる音から意味ある言語情報を取得できず,
結果として音声プライバシー保護が可能
11
詳しくは:赤木,入江 ,“音情景解析の概念にもとづいた音声プライバシー保護”,
電子情報通信学会論文誌,解説論文 A, J97-A, 4, 247-255.
開発
 開発の分担
 北陸先端大
 防聴音作成のための基本アルゴリズム
 パラメータ設定のための基礎的聴取実験
→
修士論文3編
 グローリー
 アルゴリズムのDSPへのインプリメント
 音集音系・音提示系作成
 その他,製品化
 特許
 赤木正人他4名,音声処理方法と装置及びプログラム並びに音声システ
ム
12
 特許第4761506号(2011/6/17)
 European Patent 1855296(2010/05/05)
 US Patent US8,065,138 B2(2011/11/22)
研究の経緯
13
導入事例
14
導入例
15
金融機関(三井住友銀行)
導入例
調剤薬局
お客様への掲示(店舗内)
お客様への掲示(店舗外)
導入例
調剤薬局
17
©グローリー
まとめ
 音情景理解についての知見を逆に利用した新たな音声プ
ライバシー保護法を紹介した
 この方法は,
 会話音声と同時に音声の音韻性を曖昧にする防聴音を再生
 音情景理解がなるべく有効に働かない音環境を生成
 発話内容を不明瞭にする
 本手法を利用した製品がすでに発売され調剤薬局などに
導入が始まっている
 防音個室以外の半個室等でもプライベートな会話を保護
できるようになる
 心理学的興味として,音源分離知覚による心理的要因の
18
発見