スライド 1

インパルス応答の狭帯域包絡線間相関を
用いた室印象類別手法の一検討
末廣一美,小橋川美共(日本文理大学),楳田美奈子(千葉工業大学),
福島学,岡本壽夫, 黒岩和治(日本文理大学) ,
柳川博文(千葉工業大学)
狭帯域包絡線間相関を用いた室種別類別
聴覚メカニズムに基づいた
狭帯域包絡線間相関
・対象によって変化しない
・室種別を聞き分けている
(室種別:和室・洋室といった室の種類)
同様の手法を用いて
「室種別の類別」も可能ではないかと考えた
話者識別
→ 音源特性 + 伝達路特性
処理の流れ
0.015
0.1
0.01
0.05
0
hb12 (n)
-0.01
-0.015
0
0.5
1
1.5
2
x 10
amplitude
amplitude
1/4 Oct.分割した実測インパルス応答
4
b : 39バンド
28.9Hz~
hb24 (n) 20749Hz
0
-0.05
-0.1
0
time(s)
cb12 (q)
0
quefrency
amplitude
1000
200
quefrency
4
2000 4000 6000
quefrency
quefrency(dB)
amplitude(dB)
x 10
cb24 (q)
2000
0
db12 (q)
2000 4000 6000
2
4000
2000 4000 6000
ヒルベルト包絡線(dB)
0
1.5
6000
quefrency
0
-10
-20
-30
-40
-50
1
time(s)
ケプストラム
600
0.5
0
-10
-20
-30
-40
-50
db24 (q)
0
2000 4000 6000
狭帯域包絡線間相関係数  db1 db2
quefrency
狭帯域包絡線間相関係数行列(狭帯域包絡線情報)
  1,1  2,1

 1, 2  2, 2

r  



 1,39  2,39

 39,1 


 

 

  39,39 
室印象は音源位置・受音点によらない
→変化する点と変化しない点がある
DB
A

X
識別対象
X A
識別候補: X A の最大値
インパルス応答のどの部分を使えばよいか?
条件
・室種別
和室(Japanese Style Room) →1室
洋室(Western Style Room) →2室
・観測位置
各室で異なる3箇所
J _ X
⇒和室: J_1
J_2
J_3
洋室: W1_1 W1_2 W1_3
W1_ X
W2_1 W2_2 W2_3

W 2_ X
J
W1
W2
3)短区間長での  
100msec
1
0.8
0.6
0.4
0.2
0
3
A
W1
W2
J
W1
1
0.8
0.6
0.4
0.2
0
X A
の差
W1
W2
160msec
W2
J
J
3
 X A  (  X _ pA _ q ) / 9
p 1 q 1
D
X
X
1
A 0.8
W1 0.6
W2 0.4
J 0.2
0
A
W1
W2
J
W1
W2
J
X
3)短区間長でのDの差
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
W1
W2
J
100 120 140 160 180 200 250 300
time(msec)
室によらず変化の仕方が類似
各区間町でのDと  X A の変化(平均)
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
:Dの平均
:  X A の平均
0.74
0.24
100 120 140 160 180 200 250 300
time(msec)
1
0.95
0.9
0.85
0.8
0.75
0.7
0.65
0.6
0.55
0.5
差が大きく,平均値が約0.75以上 ⇒ 160msec
回数
逆判別回数:異なる室種別の類似度が高かった回数
14
12
10
8
6
4
2
0
4(逆判別回数)
=0.95
81(総組合せ数)
100
120
0.74
0.76
0.24
0.22
140
160
180 200
time(msec)
250
300
類別に160msecを使用
調査項目
調査項目1
同一室で異なる計測位置での r の類似度調査
調査項目2
異なる室種別(洋室と和室)で r の類似度調査
調査項目3
容積は異なるが同一種別(洋室)となる2室で
r の類似度調査

X A
1)同一室で異なる計測位置での r の類似度
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.85
0.84
0.73
0.56
: X X (平均値)
: X A の最小値
W1_1 W1_2 W1_3 W2_1 W2_2 W2_3 J_1 J_2
A
W1_1
W1_2
W1_3
W2_1
W2_2
W2_3
J_1
J_2
J_3
J_3
X(Room type_Point Number)
同一室では r の類似度が高い

X

A
2)洋室(W1)と和室(J)の r の類似度
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
A
0.56
0.45
W1_1
W1_2 W1_3
J_1
J_2
W1_1
W1_2
W1_3
J_1
J_2
J_3
J_3
X(Room Type_Point Number)
種別の異なる室では類似度は低い
4)容積の異なる洋室1と洋室2の r の類似度


X

A
160msec
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
A
0.69
0.54
0.53
W1_1 W1_2 W1_3 W2_1 W2_2 W2_3 J_1 J_2 J_3
X(Room type_Point Number)
W1_1
W1_2
W1_3
W2_1
W2_2
W2_3
J_1
J_2
J_3
容積が異なる同一室種別では類似度が概ね高い
⇒ 室種別が異なれば概ね分離
まとめ
【目的】
狭帯域包絡線間相関を用いた室種別の類別
【結論】
0)区間長によって類似度が変化
→長い区間:類似度の差が小さくなる傾向
→短い区間:同一室でも類似度が低くなる傾向
1)同一室では類似度は高くなる
2)異なる室種別では類似度が概ね低くなる
3)同一室種別では類似度が概ね高くなる
狭帯域包絡線間相関を用いた
室種別類別の可能性を確認

X

A
洋室2と和室の r の類似度
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
A
W2_1
W2_2
W2_3
J_1
J_2
J_3
W2_1
W2_2
W2_3
J_1
J_2
J_3
X(Room Type_Point Number)
種別の異なる室では類似度は低い


X

A
容積の異なる洋室1と洋室2の r の類似度
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
:  W W
A
W1_1
W1_2
W1_3
W2_1
W2_2
W2_3
W1_1
W1_2
W1_3
W2_1
W2_2
W2_3
X(Room Type_Point Number)
容積の異なる同一種別の室でも類似度は高い

X A
3)容積の異なる洋室1と洋室2の r の類似度
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
: W 1W 2
A
W1_1
W1_2
W1_3
W2_1
W2_2
W2_3
0.42
W1_1
W1_2
W1_3
W2_1
W2_2
W2_3
X(Room Type_Point Number)
容積の異なる同一種別の室でも類似度は高い
逆判別回数:異なる室種別の類似度が高かった回数
14
12
10
8
6
0.74
0.24
4
0.76
0.22
2
0
100
120
140
160 180 200
time(msec)
250
300
160msecの短区間を用いる