協和性理論に基づいた音響信号のリアルタイム評価∗

1-6-6
協和性理論に基づいた音響信号のリアルタイム評価 ∗
☆榎本祐太, 矢田部浩平, 及川靖広 (早大理工)
まえがき
1
Input : short acoustic signal
fs= 8 kHz
Kameoka らが構築した協和性理論 [1, 2] は自動車
の排気音 [3] や伝送機器の品質 [4] 等の評価に使われ,
Ho--Kalman’s method
有用性が確かめられている。しかし線スペクトルを用
Parameterize stage
Translate form pole to eigen-frequencies
いて計算する手法であるので合成音源を用いた評価
Compute “absolute dissonance” about
the eigen-frequencies (Kameoka’s method)
が多い。協和性は比較的受け入れやすい指標であり,
適用範囲を広げることができれば音の評価の新たな
Output : absolute dissonace
枠組みとして発展が期待される。そこで本研究では
Kameoka らの協和性理論を一般に連続スペクトルを
図–1 提案手法の流れ
持つ実環境音について適用する手法を提案する。
表–1 実験条件
提案手法
2
CPU
Sampling frequency
Sound pressure level
Window length
提案手法の流れを図–1 に示す。処理は大きく分け
て分離抽出部と協和性評価部に二分される。分離抽出
部は入力信号から不協和を生ずる成分を抽出し,協
和性評価部は抽出した成分に対して絶対不協和度を
計算する。一連の処理は断続的に入力される音響信
号を適当な長さに区切って行われる。
入力された多音響信号に対して,協和度に寄与す
る主要な成分の抽出と雑音の分離を行う。
2.1.1
と実現することが可能である。各行列 , Ω の第 1 ブ
ロック要素から B, C をそれぞれ求められる。
行列 H0 よりも1サンプル進めたハンケル行列を
H1 = AΩ
1
ここでは状態空間モデルの最小実現に基づく Ho–
観測行列
B (t > 0) と表せる。ここで拡大可
及び拡大可到達行列 Ω を
)T
(
= C CA · · · CAJ 1
(
)
Ω = B AB · · · AI 1 B
2.1.2
状態空間にモデル化された信号の主要な成分は行
列 A の固有値から得ることができる。その固有値は
(1)
値の偏角から算出可能である。音圧を求める場合
) 1
H(z 1 ) = C z 1 I A
B+D
(8)
(2)
のように伝達関数形に変換し,所望の周波数における
振幅値を求めることで音圧を取得することができる。
ル行列 H0 はその積で表せ,その特異値分解は
H0 = Ω = U ΣV
以上で入力信号の協和性に寄与する成分の抽出と
(3)
となる。分解後の各行列 U, Σ, V は
)
(
(
)
)
(
Σs 0
, V = Vs Vn
U = Us Un , Σ =
0 Σn
雑音との分離を行うことができる。
2.2
従って,短時間信号の絶対不協和度を計算する [2]。
評価実験
3
現できる。行列 Σ の値をもとに信号が主要な部分を
3.1
打ち切り,Us , Σs , Vs を決定する。すると ,Ω は
= U s Σs ,
∗
Ω=
1
2
Σs VsT
協和性評価部
前項で求めた主要成分を元に Kameoka らの理論に
(4)
と信号が主要な部分と雑音が主要な部分によって表
1
2
周波数と音圧の取得
伝達関数における極と等価なので共振周波数は固有
と定義すると,短時間信号 s を使った一般化ハンケ
T
(7)
以上の式で状態空間 {A, B, C, D} が決定される。
から生成されると仮定すると s(t) は 0 (t < 0),D
1
1
2
のように求めることができる。
Kalman の方法 [5] を採用した。
入力音響信号 s(t) がある状態空間 {A,B, C, D}
(6)
と表現できる。式 (5)(6) より行列 A は
A = Σs 2 UsT H1 Vs Σs
Ho–Kalman の方法
(t = 0),CAt
Core i7-3770K 3.5 GHz
8 kHz
63 dB
100 ms (half-overlap)
H1 とすると, , Ω を用いて,
分離抽出部
2.1
Evaluation stage
(5)
提案手法の検証
実験条件を表–1 に示す。入力信号は図–2 に示すス
ぺクトログラムで表される 2 秒毎に周波数の変化する
Realtime evaluation of acoustic signal based on consonance theory. By Yuta ENOMOTO, Kohei YATABE
and Yasuhiro OIKAWA (Waseda university)
日本音響学会講演論文集
- 1357 -
2015年3月
1000
extracted component
3000
Frequency (Hz)
Frequency (Hz)
800
600
400
200
0
1
2
3
4
2000
1000
0
5
2
Time (s)
150
200
Absolute dissonance
250
Absolute dissonance
200
50
estimated dissonance
smoothed dissonance
ground truth
0
0
1
2
図–3
3
Time (s)
4
8
10
12
10
12
150
100
50
5
0
2
4
6
Time (s)
8
図–6 実環境音の絶対不協和度
正弦波の和の絶対不協和度
正弦波の和である。その結果を図–2, 3 に示す。図–2
3.3
中の赤い丸は分析抽出部が検出した主要成分の周波
数を示している。
実環境音での検証
表–1 に示した条件で,図–5 に示す成人男性4名
の発声練習の信号に対して提案手法を適用した。
図–3 より適切に平滑化を行えば,Kameoka らの理
論による解析値に近い値を求められた。
CM7(C,E,G,B) の各音を 4 名の男性が低音から順に
発声するという信号であり,6.5 秒付近には第三者の
笑い声の混ざりこんでいる。
リアルタイム性の検証
3.2
6
Time (s)
図–5 実環境音のスぺクトログラム
図–2 入力信号 正弦波の和 (赤丸は抽出された周波数)
100
4
入力信号は前項と同一であり,解析区間と移動幅を
平滑化後の絶対不協和度を図–6 に示す。笑い声が
変化させ計算時間を計測した。提案手法を各条件で
混ざりこんだ付近で絶対不協和度が特徴的に高くなっ
10 回試行し,それらの計算時間の平均を信号長 6 秒
で割って実時間係数を算出した。
実時間性を測った結果を図–4 に示す。実時間係数
ていることがわかる。よって実環境音においても,協
和・不協和を定量的に判定できる可能性が示唆される。
むすび
4
は処理時間を信号長で割ったものであり,1 を下回る
本研究では Kameoka らの提案した協和性理論を適
場合に実時間動作可能となる。移動幅が解析区間の
用範囲拡大を目指した。時間変化した。連続スペクト
半分の場合,解析区間が 130 ms 以下,移動幅が解析
ルを持つ実環境音へ適用する手法を提案した。今後
区間と同じ場合,解析区間が 220 ms 以下であれば実
は多くの実環境音に適用することで一般性を検証し,
時間動作が可能であることが示唆された。
汎用的な携帯機器等への実装を目指す。
参考文献
2.5
non-overlap
half-overlap
Real time factor
2
1.5
1
0.5
0
0
50
100
150
Window length(ms)
200
図–4 解析区間と実時間係数 (各 10 回平均)
日本音響学会講演論文集
250
[ 1 ] A. Kameoka and M. Kuriyagawa, “Consonance theory
part I: Consonance of dyads,” J. Acoust. Soc. Am., vol.45,
no.6, pp.1451–1459, 1969.
[ 2 ] A. Kameoka and M. Kuriyagawa, “Consonance theory
part II: Consonance of complex tones and its calculation
method,” J. Acoust. Soc. Am., vol.45, no.6, pp.1460–1469,
1969.
[ 3 ] 小沢義彦,脇田敏裕,星野博之,梅村祥之,杉本軍司, “自動車
排気音の音色評価法,” 日本音響学会誌,vol.48,no.11,pp.807–
812,1992.
[ 4 ] 江原史郎, “伝送機器の心理品質に関する客観測定法: 番組
音モデル信号を用いた不協和度心理品質測定法,” 日本音響学会
誌,vol.51,no.2,pp.83–95,1995.
[ 5 ] 片山徹, システム同定:部分空間法からのアプローチ,朝倉書
店,東京,2004.
- 1358 -
2015年3月