音声言語処理特論課題(山本担当分) 1. 音声の特徴量として、講義では

音声言語処理特論課題(山本担当分)
1. 音声の特徴量として、講義では MFCC を主に取り上げたが、線形予測符号化(Linear Predictive
Coding; LPC)に基づく特徴量を用いる場合もある。LPC 分析により音声を符号化・圧縮し伝送する方
法は、低ビットレートの携帯電話音声伝送方式として広く用いられているが、この中で CELP(Code
Excited Liner Prediction)方式について調べ、エンコーダ・デコーダの概略について、A4 用紙 1 ペー
ジ程度の分量にまとめよ。
2. 下図に示される 7×7 の格子において、(1,1)から始まり(7,7)で終わる最適パスとそのパスの累積距離
を求め、図示せよ(計算過程も示すこと。印刷したものに手書きで良い)。ただし、図中の各格子点の数
字は局所的距離を表し、DP パスは下図右上の局所的なパス制約と傾斜重み付けに従うとする。
音声言語処理特論課題(山本担当分)
3. 隠れマルコフモデルのパラメータ再推定式について、最も基本的な遷移確率の推定式
∑ γ (i, j, t ) ∑α (i, t − 1)a b (x )β ( j, t )
=
=
∑∑ γ (i, j, t ) ∑ α (i, t − 1)β (i, t − 1)
ij ij
aˆij
t
j
t
t
t
t
を導出せよ。ただし、
T −1
T −1
t =0
t =0
P(x, s | Θ ) = π s0 ∏ a st st +1 ∏ bst st +1 (xt +1 )
Q(Θ, Θʹ′) =
1
⎧
⎫
P(x, s | Θ )⎨log π sʹ′0 + ∑ log a ʹ′st st +1 + ∑ log bsʹ′t st +1 (xt +1 )⎬
∑
P (x | Θ ) s
t
t
⎩
⎭
∑a
ij
= 1,
j
であり、これにラグランジュの未定係数法を適用して解く。微分する際には、aij が状態系列 s の中でど
のように表れるのか、よく考えること。また、式中の何がγに相当するのかについてもよく考えること。