統計的手法に基づく音声変換を 用いた音声生成機能の拡張 1.発声障害者(喉頭摘出者)補助 2.サイレント音声コミュニケーション 戸田 智基 奈良先端科学技術大学院大学 情報科学研究科 [email protected] http://isw3.naist.jp/~tomoki/index_j.html 音声変換を用いた音声生成機能の拡張 機能拡張された音声生成 言語情報 意図 パラ言語情報 物理的制約 意図 音韻成分 音声信号 声質成分 非言語情報 所望の非言語情報 物理的制約を超えた非言語 情報制御が可能となる! +声質変換 声質変換 変換音声信号 不可能を可能とするバリアフリー 音声コミュニケーションの実現! 1.発声障害者補助のための音声変換 • 喉頭摘出者(全国で約2万人程度と予想)による無喉頭音声を より自然な音声へとリアルタイムで変換 話し手側 聞き手側 機械的な声質を持つ 音声の発声 より自然な声質を持つ 音声の提示 声質変換 ビー ビー 失った声を 取り戻せる かもしれない! 60 ms 程度の処理遅延に よる変換処理を実現 失われた声で再び話すことができるようにしたい! 発声障害者補助のデモ音声 ※スピーカマークをクリックして下さい。 1.食道発声+声質変換 ◎外部機器が不要 ×修得が困難 〇より自然で明瞭な音声 〇任意の1文による声質設定 電話等で効果大 2.電気式人工喉頭を用いた発声+声質変換 ×低い静寂性(人工喉頭の音漏れ) ◎容易に修得可能 〇より自然な音声 〇任意の1文による声質設定 電話等で効果大 3.微弱振動音源を用いた発声+声質変換 ◎高い静寂性 ○比較的容易に修得可能 △比較的自然で明瞭な音声 〇任意の1文による声質設定 対面会話で効果大 2.サイレント音声通話のための音声変換 • 周囲に聞こえないぐらい小さな体内伝導音声(非可聴つぶやき: NAM)をより自然な音声へとリアルタイムで変換 聞き手側 話し手側 より自然で明瞭な音声を 聞き手にのみ提示 周囲に聞かれたくない内容を 非可聴つぶやきにより発声 ・・・ 変換 あの銀行の 口座番号は… 非可聴 つぶやき マイク テレパシーのような音声コミュニケーションを実現したい! 各種体内伝導音声に対する変換音声 ※スピーカマークをクリックして下さい。 体内伝導音声 自然音声 通常音声 通常音声 小声 小声 ささやき声 ささやき声 NAM 変換音声
© Copyright 2024 ExpyDoc