標本化 - 夜久竹夫研究室

音メディア
夜久・杉田・土田他、情報科教育法、実教
植竹(専修大学) マルチメディア資料
http://www.isc.senshuu.ac.jp/%7Ethm0636/mmj2007/mmj2007-7.ppt
量子化
標本化定理
目標
音メディアのデータと演算の種類、その表現方法
音のデータ形式と各データ形式の原理を理解。
将来、各音メディアを操作するプログラムの開発能
力を身につける。
データ形式
WAVE (.wav)
Windowsで使用される標準的なサウンドデータ
MIDI
波形データではなく、音の高さ、強さ、音色などの演奏
情報と操作情報を表すコードデータ
MP3
圧縮された音声データのフォーマット
音システムの例
音響システム
データ 周波数と強さ
演算
合成、分離
音声システム
データ 多重周波数別強さ
演算
発声(記号→音響)、認識(音響→記号)
音楽システム
データ 楽器の音
演算 発音、認識、作曲
音のデータ
量子化と標本化
各時点ごとの音の強さ
周波数:各時点ごとの音の強さから計算
1秒間に200回上下したら200Hz
標本化
標本化
時間方向に連続するアナログデータから一定感覚で
標本を抽出
標本化周波数(sampling rate):
一定時間当たりの標本数
音楽CD→1秒間 44.100個。標本化周波数
→44.1kHz
標本化定理(シャノンの定理)
標本化は最大周波数の倍。
応用
音声の場合、最大20kHz→標本化は44.1kHz
標本化できる音声周波数の制限:
音声信号を標本化できるのは、標本化周波数の1/2
までで20kHz←標本化定理。
量子化
量子化
連続する大きさを持つデータを離散化する事
量子化ビット数
CDの場合 16ビット
分解能 →65536分の1
1~65536 強さを
CDのダイナミックレンジ→約96dB
符号化
量子化された数値を2進数で表現
音声
声紋
人間の発声:異なる周波数を同時に発生させる
それぞれ異なる固定周波数を出す楽器が多数あるイ
メージ
~各楽器が同時に音を出しているイメージ。
声紋:各時点ごとの”各楽器”の音の強さ
声紋の作り方:各時点ごとの音の強さデータからフー
リエ変換などをして各周波数毎の強さを取り出す。
それをまとめて表示
例 声紋
日本音響研究所 HP
http://www3.alphanet.ne.jp/users/japaco/VoicePrint.htm
声紋の作り方
3次元データ
横軸 時間
縦軸 周波数(Hz)
色
音圧 白→強い
声紋の作り方
音圧データ→[FFT](周波数分離)→声紋
FFT Fast Fourier Transform 高速フーリエ変換
強弱高低、時間経過 解析