スライド 1 - 情報科学研究科 | NAIST 国立大学

統計的手法に基づく音声変換を
用いた音声生成機能の拡張
1.発声障害者(喉頭摘出者)補助
2.サイレント音声コミュニケーション
戸田 智基
奈良先端科学技術大学院大学 情報科学研究科
[email protected]
http://isw3.naist.jp/~tomoki/index_j.html
音声変換を用いた音声生成機能の拡張
機能拡張された音声生成
言語情報
意図
パラ言語情報
物理的制約
意図
音韻成分
音声信号
声質成分
非言語情報
所望の非言語情報
物理的制約を超えた非言語
情報制御が可能となる!
+声質変換
声質変換
変換音声信号
不可能を可能とするバリアフリー
音声コミュニケーションの実現!
1.発声障害者補助のための音声変換
• 喉頭摘出者(全国で約2万人程度と予想)による無喉頭音声を
より自然な音声へとリアルタイムで変換
話し手側
聞き手側
機械的な声質を持つ
音声の発声
より自然な声質を持つ
音声の提示
声質変換
ビー
ビー
失った声を
取り戻せる
かもしれない!
60 ms 程度の処理遅延に
よる変換処理を実現
失われた声で再び話すことができるようにしたい!
発声障害者補助のデモ音声
※スピーカマークをクリックして下さい。
1.食道発声+声質変換
◎外部機器が不要
×修得が困難
〇より自然で明瞭な音声
〇任意の1文による声質設定
電話等で効果大
2.電気式人工喉頭を用いた発声+声質変換
×低い静寂性(人工喉頭の音漏れ)
◎容易に修得可能
〇より自然な音声
〇任意の1文による声質設定
電話等で効果大
3.微弱振動音源を用いた発声+声質変換
◎高い静寂性
○比較的容易に修得可能
△比較的自然で明瞭な音声
〇任意の1文による声質設定
対面会話で効果大
2.サイレント音声通話のための音声変換
• 周囲に聞こえないぐらい小さな体内伝導音声(非可聴つぶやき:
NAM)をより自然な音声へとリアルタイムで変換
聞き手側
話し手側
より自然で明瞭な音声を
聞き手にのみ提示
周囲に聞かれたくない内容を
非可聴つぶやきにより発声
・・・
変換
あの銀行の
口座番号は…
非可聴
つぶやき
マイク
テレパシーのような音声コミュニケーションを実現したい!
各種体内伝導音声に対する変換音声
※スピーカマークをクリックして下さい。
体内伝導音声
自然音声
通常音声
通常音声
小声
小声
ささやき声
ささやき声
NAM
変換音声