スライド 1

狭帯域包絡線間相関を用いた
話者識別に有用な帯域の一検討
末廣一美,小橋川美共(日本文理大学),西村一行(千葉工業大学),
福島学,岡本壽夫, 黒岩和治(日本文理大学) ,
柳川博文(千葉工業大学)
高機能・高速通信が可能な情報端末の普及
→個人を特定して機器が適応的にサポート
→本人認証技術が必要
→発話語を特定しない音声認証
発話語を特定しない音声認証
⇒ 音声時間波形の狭帯域包絡線間相関
狭帯域包絡線間相関を用いた話者識別
amplitude
1/4 Oct.分割した音声時間波形
0.04
0.02
0
-0.02
-0.04
vb1 (n)
0
0.2
0.4
0.6
time (s )
0.8
0.04
0.02
0
-0.02
-0.04
1
vb2 (n)
0
0.2
0.4
0.6
time (s )
0.8
b : 39バンド
28.9Hz~
20749Hz
1
amplitude
ヒルベルト変換して求めた包絡線
0.04
0.02
0
-0.02
-0.04
eb1 (n)
0
0.2
0.4
0.6
time (s )
0.8
0.04
0.02
0
-0.02
-0.04
1
eb2 (n)
0
0.2
0.4
0.6
time (s )
0.8
1
amplitude(dB)
dB変換(-30dBで打ち切り)
0
0
-10
-10
-20
-30
db1 (n)
0
0.2
0.4
0.6
time (s )
0.8
1
db2 (n)
-20
-30
0
0.2
0.4
0.6
0.8
1
狭帯域包絡線間相関係数  db1 db2
time (s )
狭帯域包絡線間相関係数行列
  1,1


1, 2


 

 1,39
 2,1
 2, 2

 2,39
  39,1 


 

 

  39,39 
帯域を制限(全帯域:28.9Hz~20749Hz)
⇒ 正解率の変化を調べる
全39帯域の正解率の比較
Accuracy and Ratio (%)
100
90
80
70
60
50
40
30
20
10
0
C
fs 範囲
band数
1-39
88%
100%
100%
6-31
6-14, 22-31
Used Band Number
86%
25%
67%
81%
21%
49%
90%
85%
80%
75%
70%
C
90%
85%
80%
75%
70%
V-31
4
5
6
7
V(Band Number)
8
6-V,22-31
C
C
C
重要帯域近傍での平均正解率の変化
10 11 12 13 14 15 16
V(Band Number)
90%
85%
80%
75%
70%
90%
85%
80%
75%
70%
6-V
29
30 31
32
V(Band Number)
33
6-14, V-31
18 19 20 21 22 23 24
V(Band Number)
重要帯域を7-11,22-31に絞り込める