音声言語処理特論課題(山本担当分) 1. 音声の特徴量として、講義では MFCC を主に取り上げたが、線形予測符号化(Linear Predictive Coding; LPC)に基づく特徴量を用いる場合もある。LPC 分析により音声を符号化・圧縮し伝送する方 法は、低ビットレートの携帯電話音声伝送方式として広く用いられているが、この中で CELP(Code Excited Liner Prediction)方式について調べ、エンコーダ・デコーダの概略について、A4 用紙 1 ペー ジ程度の分量にまとめよ。 2. 下図に示される 7×7 の格子において、(1,1)から始まり(7,7)で終わる最適パスとそのパスの累積距離 を求め、図示せよ(計算過程も示すこと。印刷したものに手書きで良い)。ただし、図中の各格子点の数 字は局所的距離を表し、DP パスは下図右上の局所的なパス制約と傾斜重み付けに従うとする。 音声言語処理特論課題(山本担当分) 3. 隠れマルコフモデルのパラメータ再推定式について、最も基本的な遷移確率の推定式 ∑ γ (i, j, t ) ∑α (i, t − 1)a b (x )β ( j, t ) = = ∑∑ γ (i, j, t ) ∑ α (i, t − 1)β (i, t − 1) ij ij aˆij t j t t t t を導出せよ。ただし、 T −1 T −1 t =0 t =0 P(x, s | Θ ) = π s0 ∏ a st st +1 ∏ bst st +1 (xt +1 ) Q(Θ, Θʹ′) = 1 ⎧ ⎫ P(x, s | Θ )⎨log π sʹ′0 + ∑ log a ʹ′st st +1 + ∑ log bsʹ′t st +1 (xt +1 )⎬ ∑ P (x | Θ ) s t t ⎩ ⎭ ∑a ij = 1, j であり、これにラグランジュの未定係数法を適用して解く。微分する際には、aij が状態系列 s の中でど のように表れるのか、よく考えること。また、式中の何がγに相当するのかについてもよく考えること。
© Copyright 2024 ExpyDoc