音高推定 音高推定 • • • • • 目的(対象物) FFT 理想 パワースペクトル クロマベクトル はじめに • 採譜か音高推定か 採譜 • 調波音 音高、タイミング • それ以外 タイミング 音高推定 • 対象は何でも • 基本周波数の推定 • 音響特徴量 音声データ FFT パワースペクトル 音楽研究におけるFFTの問題点 • フレーム長が一定 • 周波数の整数表現 • フレームシフトが一定 フレーム長 • 高周波成分ほどフレーム長が短くてよい • 急激な音高の変化を読み取るには、 できるだけ短いフレーム長 音楽研究におけるFFTの問題点 • フレーム長が一定 • 周波数の整数表現 • フレームシフトが一定 整数の周波数 • 低い音ほど各音の間隔が狭い (精度が悪い) • 指数的に求めるパワースペクトル 1,2,3,4,…,44100(Hz) 442 * 2nm(Hz) | m=1..44100 } 音楽研究におけるFFTの問題点 • フレーム長が一定 • 周波数の整数表現 • フレームシフトが一定 フレームシフト • テンポに合わせたフレームシフト 計算機は正直!! • • • • • 人が聞こえないような音(倍音とか) 余計な音(雑音とか) 間違って演奏した音 微妙にズレた音 表現力豊かで、一定しないテンポ 正確な採譜システムほど・・・ 人間らしさ • 計算機のバカ正直を修正する パワースペクトル • 離散フーリエ変換 • 出力は整数値 ウェーブレット • 窓を可変長にしたフーリエ変換 • 不確定性の改善 クロマベクトル • パワースペクトルを12次元のベクトルに分類 • 用途:コードの推定 クロマベクトル • 単音でも、倍音の影響は拭い去れない • 和音でも、一応上位3音だけ見れば、 コードになっている。(一応・・・) • 打楽器はアウト • 低い音(A1以下)もアウト 倍音の処理 • 意図的に倍音を削除 – 倍音のパワー比を調べる等 • TANDEMスペクトル • ガボールウェーブレット変換 打楽器の処理 • 打楽器音が観測される低周波はクロマベクト ルに換算しない。 • 調波音、打楽器音の分離手法 低音をどうする • やはり指数的フーリエ変換が必要か? • 高周波成分のデータを学習し、近似するとか
© Copyright 2024 ExpyDoc