狭帯域包絡線間相関を用いた 話者識別に有用な帯域の一検討 末廣一美,小橋川美共(日本文理大学),西村一行(千葉工業大学), 福島学,岡本壽夫, 黒岩和治(日本文理大学) , 柳川博文(千葉工業大学) 高機能・高速通信が可能な情報端末の普及 →個人を特定して機器が適応的にサポート →本人認証技術が必要 →発話語を特定しない音声認証 発話語を特定しない音声認証 ⇒ 音声時間波形の狭帯域包絡線間相関 狭帯域包絡線間相関を用いた話者識別 amplitude 1/4 Oct.分割した音声時間波形 0.04 0.02 0 -0.02 -0.04 vb1 (n) 0 0.2 0.4 0.6 time (s ) 0.8 0.04 0.02 0 -0.02 -0.04 1 vb2 (n) 0 0.2 0.4 0.6 time (s ) 0.8 b : 39バンド 28.9Hz~ 20749Hz 1 amplitude ヒルベルト変換して求めた包絡線 0.04 0.02 0 -0.02 -0.04 eb1 (n) 0 0.2 0.4 0.6 time (s ) 0.8 0.04 0.02 0 -0.02 -0.04 1 eb2 (n) 0 0.2 0.4 0.6 time (s ) 0.8 1 amplitude(dB) dB変換(-30dBで打ち切り) 0 0 -10 -10 -20 -30 db1 (n) 0 0.2 0.4 0.6 time (s ) 0.8 1 db2 (n) -20 -30 0 0.2 0.4 0.6 0.8 1 狭帯域包絡線間相関係数 db1 db2 time (s ) 狭帯域包絡線間相関係数行列 1,1 1, 2 1,39 2,1 2, 2 2,39 39,1 39,39 帯域を制限(全帯域:28.9Hz~20749Hz) ⇒ 正解率の変化を調べる 全39帯域の正解率の比較 Accuracy and Ratio (%) 100 90 80 70 60 50 40 30 20 10 0 C fs 範囲 band数 1-39 88% 100% 100% 6-31 6-14, 22-31 Used Band Number 86% 25% 67% 81% 21% 49% 90% 85% 80% 75% 70% C 90% 85% 80% 75% 70% V-31 4 5 6 7 V(Band Number) 8 6-V,22-31 C C C 重要帯域近傍での平均正解率の変化 10 11 12 13 14 15 16 V(Band Number) 90% 85% 80% 75% 70% 90% 85% 80% 75% 70% 6-V 29 30 31 32 V(Band Number) 33 6-14, V-31 18 19 20 21 22 23 24 V(Band Number) 重要帯域を7-11,22-31に絞り込める
© Copyright 2024 ExpyDoc