1-6-6 協和性理論に基づいた音響信号のリアルタイム評価 ∗ ☆榎本祐太, 矢田部浩平, 及川靖広 (早大理工) まえがき 1 Input : short acoustic signal fs= 8 kHz Kameoka らが構築した協和性理論 [1, 2] は自動車 の排気音 [3] や伝送機器の品質 [4] 等の評価に使われ, Ho--Kalman’s method 有用性が確かめられている。しかし線スペクトルを用 Parameterize stage Translate form pole to eigen-frequencies いて計算する手法であるので合成音源を用いた評価 Compute “absolute dissonance” about the eigen-frequencies (Kameoka’s method) が多い。協和性は比較的受け入れやすい指標であり, 適用範囲を広げることができれば音の評価の新たな Output : absolute dissonace 枠組みとして発展が期待される。そこで本研究では Kameoka らの協和性理論を一般に連続スペクトルを 図–1 提案手法の流れ 持つ実環境音について適用する手法を提案する。 表–1 実験条件 提案手法 2 CPU Sampling frequency Sound pressure level Window length 提案手法の流れを図–1 に示す。処理は大きく分け て分離抽出部と協和性評価部に二分される。分離抽出 部は入力信号から不協和を生ずる成分を抽出し,協 和性評価部は抽出した成分に対して絶対不協和度を 計算する。一連の処理は断続的に入力される音響信 号を適当な長さに区切って行われる。 入力された多音響信号に対して,協和度に寄与す る主要な成分の抽出と雑音の分離を行う。 2.1.1 と実現することが可能である。各行列 , Ω の第 1 ブ ロック要素から B, C をそれぞれ求められる。 行列 H0 よりも1サンプル進めたハンケル行列を H1 = AΩ 1 ここでは状態空間モデルの最小実現に基づく Ho– 観測行列 B (t > 0) と表せる。ここで拡大可 及び拡大可到達行列 Ω を )T ( = C CA · · · CAJ 1 ( ) Ω = B AB · · · AI 1 B 2.1.2 状態空間にモデル化された信号の主要な成分は行 列 A の固有値から得ることができる。その固有値は (1) 値の偏角から算出可能である。音圧を求める場合 ) 1 H(z 1 ) = C z 1 I A B+D (8) (2) のように伝達関数形に変換し,所望の周波数における 振幅値を求めることで音圧を取得することができる。 ル行列 H0 はその積で表せ,その特異値分解は H0 = Ω = U ΣV 以上で入力信号の協和性に寄与する成分の抽出と (3) となる。分解後の各行列 U, Σ, V は ) ( ( ) ) ( Σs 0 , V = Vs Vn U = Us Un , Σ = 0 Σn 雑音との分離を行うことができる。 2.2 従って,短時間信号の絶対不協和度を計算する [2]。 評価実験 3 現できる。行列 Σ の値をもとに信号が主要な部分を 3.1 打ち切り,Us , Σs , Vs を決定する。すると ,Ω は = U s Σs , ∗ Ω= 1 2 Σs VsT 協和性評価部 前項で求めた主要成分を元に Kameoka らの理論に (4) と信号が主要な部分と雑音が主要な部分によって表 1 2 周波数と音圧の取得 伝達関数における極と等価なので共振周波数は固有 と定義すると,短時間信号 s を使った一般化ハンケ T (7) 以上の式で状態空間 {A, B, C, D} が決定される。 から生成されると仮定すると s(t) は 0 (t < 0),D 1 1 2 のように求めることができる。 Kalman の方法 [5] を採用した。 入力音響信号 s(t) がある状態空間 {A,B, C, D} (6) と表現できる。式 (5)(6) より行列 A は A = Σs 2 UsT H1 Vs Σs Ho–Kalman の方法 (t = 0),CAt Core i7-3770K 3.5 GHz 8 kHz 63 dB 100 ms (half-overlap) H1 とすると, , Ω を用いて, 分離抽出部 2.1 Evaluation stage (5) 提案手法の検証 実験条件を表–1 に示す。入力信号は図–2 に示すス ぺクトログラムで表される 2 秒毎に周波数の変化する Realtime evaluation of acoustic signal based on consonance theory. By Yuta ENOMOTO, Kohei YATABE and Yasuhiro OIKAWA (Waseda university) 日本音響学会講演論文集 - 1357 - 2015年3月 1000 extracted component 3000 Frequency (Hz) Frequency (Hz) 800 600 400 200 0 1 2 3 4 2000 1000 0 5 2 Time (s) 150 200 Absolute dissonance 250 Absolute dissonance 200 50 estimated dissonance smoothed dissonance ground truth 0 0 1 2 図–3 3 Time (s) 4 8 10 12 10 12 150 100 50 5 0 2 4 6 Time (s) 8 図–6 実環境音の絶対不協和度 正弦波の和の絶対不協和度 正弦波の和である。その結果を図–2, 3 に示す。図–2 3.3 中の赤い丸は分析抽出部が検出した主要成分の周波 数を示している。 実環境音での検証 表–1 に示した条件で,図–5 に示す成人男性4名 の発声練習の信号に対して提案手法を適用した。 図–3 より適切に平滑化を行えば,Kameoka らの理 論による解析値に近い値を求められた。 CM7(C,E,G,B) の各音を 4 名の男性が低音から順に 発声するという信号であり,6.5 秒付近には第三者の 笑い声の混ざりこんでいる。 リアルタイム性の検証 3.2 6 Time (s) 図–5 実環境音のスぺクトログラム 図–2 入力信号 正弦波の和 (赤丸は抽出された周波数) 100 4 入力信号は前項と同一であり,解析区間と移動幅を 平滑化後の絶対不協和度を図–6 に示す。笑い声が 変化させ計算時間を計測した。提案手法を各条件で 混ざりこんだ付近で絶対不協和度が特徴的に高くなっ 10 回試行し,それらの計算時間の平均を信号長 6 秒 で割って実時間係数を算出した。 実時間性を測った結果を図–4 に示す。実時間係数 ていることがわかる。よって実環境音においても,協 和・不協和を定量的に判定できる可能性が示唆される。 むすび 4 は処理時間を信号長で割ったものであり,1 を下回る 本研究では Kameoka らの提案した協和性理論を適 場合に実時間動作可能となる。移動幅が解析区間の 用範囲拡大を目指した。時間変化した。連続スペクト 半分の場合,解析区間が 130 ms 以下,移動幅が解析 ルを持つ実環境音へ適用する手法を提案した。今後 区間と同じ場合,解析区間が 220 ms 以下であれば実 は多くの実環境音に適用することで一般性を検証し, 時間動作が可能であることが示唆された。 汎用的な携帯機器等への実装を目指す。 参考文献 2.5 non-overlap half-overlap Real time factor 2 1.5 1 0.5 0 0 50 100 150 Window length(ms) 200 図–4 解析区間と実時間係数 (各 10 回平均) 日本音響学会講演論文集 250 [ 1 ] A. Kameoka and M. Kuriyagawa, “Consonance theory part I: Consonance of dyads,” J. Acoust. Soc. Am., vol.45, no.6, pp.1451–1459, 1969. [ 2 ] A. Kameoka and M. Kuriyagawa, “Consonance theory part II: Consonance of complex tones and its calculation method,” J. Acoust. Soc. Am., vol.45, no.6, pp.1460–1469, 1969. [ 3 ] 小沢義彦,脇田敏裕,星野博之,梅村祥之,杉本軍司, “自動車 排気音の音色評価法,” 日本音響学会誌,vol.48,no.11,pp.807– 812,1992. [ 4 ] 江原史郎, “伝送機器の心理品質に関する客観測定法: 番組 音モデル信号を用いた不協和度心理品質測定法,” 日本音響学会 誌,vol.51,no.2,pp.83–95,1995. [ 5 ] 片山徹, システム同定:部分空間法からのアプローチ,朝倉書 店,東京,2004. - 1358 - 2015年3月
© Copyright 2024 ExpyDoc