音高推定

音高推定
音高推定
•
•
•
•
•
目的(対象物)
FFT
理想
パワースペクトル
クロマベクトル
はじめに
• 採譜か音高推定か
採譜
• 調波音
音高、タイミング
• それ以外
タイミング
音高推定
• 対象は何でも
• 基本周波数の推定
• 音響特徴量
音声データ
FFT
パワースペクトル
音楽研究におけるFFTの問題点
• フレーム長が一定
• 周波数の整数表現
• フレームシフトが一定
フレーム長
• 高周波成分ほどフレーム長が短くてよい
• 急激な音高の変化を読み取るには、
できるだけ短いフレーム長
音楽研究におけるFFTの問題点
• フレーム長が一定
• 周波数の整数表現
• フレームシフトが一定
整数の周波数
• 低い音ほど各音の間隔が狭い
(精度が悪い)
• 指数的に求めるパワースペクトル
1,2,3,4,…,44100(Hz)
442 * 2nm(Hz) | m=1..44100 }
音楽研究におけるFFTの問題点
• フレーム長が一定
• 周波数の整数表現
• フレームシフトが一定
フレームシフト
• テンポに合わせたフレームシフト
計算機は正直!!
•
•
•
•
•
人が聞こえないような音(倍音とか)
余計な音(雑音とか)
間違って演奏した音
微妙にズレた音
表現力豊かで、一定しないテンポ
正確な採譜システムほど・・・
人間らしさ
• 計算機のバカ正直を修正する
パワースペクトル
• 離散フーリエ変換
• 出力は整数値
ウェーブレット
• 窓を可変長にしたフーリエ変換
• 不確定性の改善
クロマベクトル
• パワースペクトルを12次元のベクトルに分類
• 用途:コードの推定
クロマベクトル
• 単音でも、倍音の影響は拭い去れない
• 和音でも、一応上位3音だけ見れば、
コードになっている。(一応・・・)
• 打楽器はアウト
• 低い音(A1以下)もアウト
倍音の処理
• 意図的に倍音を削除
– 倍音のパワー比を調べる等
• TANDEMスペクトル
• ガボールウェーブレット変換
打楽器の処理
• 打楽器音が観測される低周波はクロマベクト
ルに換算しない。
• 調波音、打楽器音の分離手法
低音をどうする
• やはり指数的フーリエ変換が必要か?
• 高周波成分のデータを学習し、近似するとか