講義概要

音信号表現
 音声波形のデジタル化(PCM)
サンプリング、標本化定理、量子化
 ソースフィルタモデル
デジタルフィルタ、 線形予測分析(LPC)
 スペクトルモデル
複合正弦波モデル、FM音源
音声波形のデジタル化(PC
M)
音声信号のデジタル化
(サンプリング)
アナログ信号
デジタル信号
アナログ信号
T=1/Fs
サンプリング サンプリング
周期
周波数
ローパス
フィルタ
AD変換
標本化・量子化
処理
振幅
Fs≧2W
W 周波数
音声 8kHz
CD 44.1kHz
DAT 48kHz
DA変換
ローパス
フィルタ
Fs≧2W
振幅
入力
W 周波数
出力
サンプリング定理
ローパスフィルタの周波数特性
ローパスフィルタのインパルス応答(標化関数)
標本化信号からアナログ信号の再現
アナログ信号
標本化信号
標本化関数
による補間
信号とスペクトル
フーリエ変換
離散信号のフーリエ変換
X ( ) 

xe
n 


x
n 
 jTn
n
n
cos(Tn)  jxn sin(Tn)
 a(Tn)  jb(Tn)
離散信号スペクトルの周期性
サンプリング周波数毎に
連続信号のスペクトルが
繰り返す
サンプリング周波数
標本化における折り返し歪
信号
スペクトル
X(f)
f
W
-W
X(f)
-2Fs
-Fs
W
-W
2Fs f
Fs
X(f)
-3Fs -2Fs
-Fs
Fs
2Fs
3Fs
f
標本化における折り返し歪
信号の量子化
量子化雑音(誤差)
デモ 16,12,8,6,4,2,1 bit/sample
非線形(不均一)量子化
最適量子化の設計
(確率密度関数が与えられる場合)
量子化誤差の二乗和を 最小化
N
D  
i 0
xi 1
xi
 x  ci  p( x)dx
2
p ( x)は確率密度関数、
xiは量子化の閾値( x0 =- 、 xN 1 =)
ciは量子化値
xi 1
① 与えら れた xi に対し て 、 ci



xi
xi 1
xi
② xiは非線形探索手法によ っ て決定
xp ( x)dx
p ( x)dx
最適量子化の設計
(データサンプルが与えられる場合)
与えら れた L個のデータ xkの 量子化誤差の二乗和を 最小化
L
D   min( xk  ci ) 2
k 0
1i  N
① xkを 量子化し て各量子化ス ロ ッ ト に分類する .
② 量子化値( セン ト ロ イ ド ) の更新
1
ci 
Ni
x
ki
k
最適量子化のSNR
音声信号の振幅分布はガンマ分布に従う
対数圧伸量子化
入力振幅を対数圧伸して線形量子化した後に指数伸張することは、
不均一量子化することと等価
入力振幅とSNRの関係
対数圧伸量子化では、最大SNRを犠牲にすることにより、40dB以上の入
力振幅のダイナミックレンジに対して一定のSNRが得られる
40dB
線形量子化
対数圧伸量子化
入力信号レベル(信号の分散に対する量子化器の最大振幅値)