演習 【LB(Level Building)法】 2014. 11. 13
締切:11月20日
講義開始まで
連続単語音声認識で,単語標準パターン系列𝐴 = 𝑎 𝑏 𝑐 , 𝐵 = {𝑏 𝑐 𝑏}が
あり,入力音声系列は 𝑐 𝑎 𝑏 𝑐 𝑐 𝑏 𝑎 𝑎 であった.言語モデルは𝐴, 𝐵の2
単語の連続(𝐴𝐴, 𝐴𝐵, 𝐵𝐴, 𝐵𝐵)である.このときの連続音声認識の問題を
LB法を用いて実行し,下記の設問に答えよ.ただし,記号𝑎, 𝑏, 𝑐 間の距
離マトリクス,およびDPパスは以下のとおりとする.
1. 認識された単語列を示せ.
2. 入力音声系列と標準パターンの対応関係を図示せよ.
𝑎
𝑏
𝑐
0
1
2
𝑏
1
0
3
𝑐
2
3
0
𝑎
図1 距離マトリクス
音情報処理
1
1
図2 DP パス
例題 (ヒント)
単語標準パターン系列 A = 𝑐 𝑏 𝐵 = {𝑐 𝑎}
入力音声系列 {a c b c b }
言語モデル {AA AB BA BB}
距離マトリクスとDPパスは図1, 2
2段目
𝑏
1
𝑐
2
(𝐴)
7
0
3 7 3 5
𝐵 4 𝐴2 𝐴 2
3
a
1段目
𝑏
𝑐
0
音情報処理
5
3 5
𝐴 2
0
c
02
35
0 2
3 8
b
b
02
3 11
b
(𝐵)
最終パスの決定
𝑎
0
𝑐
2
c
b
b
b
累積距離の小さい方を選択
1
3 5
2 2 0 2
a
0
このときの
DPマッチングを示す
8
0
3 7 3 5
𝐵 4 𝐴2 𝐴 2
2
a
𝑎
𝑐
0
2
1
1
c
b
b
4
2 02
3
35
14
2
a
c
1
b
6
35
𝐴 2
1
b
5
3 8 3 11
b
1
b
解答用紙1
(𝐴)
2段目
(𝐵)
𝑐
𝑏
𝑏
𝑐
𝑎
𝑏
𝑐
𝑎
𝑏
1段目
𝑐
𝑐
𝑏
𝑎
𝑎
𝑐
𝑏
𝑐
𝑎
𝑏
𝑎
𝑏
𝑐
𝑐
𝑐
𝑐
𝑏
𝑎
𝑎
𝑏
𝑎
𝑎
(𝐵)
𝑏
音情報処理
𝑏
(𝐴)
𝑐
𝑐
𝑎
𝑏
𝑎
𝑎
𝑐
𝑎
𝑏
𝑐
𝑐
解答用紙2
認識された単語列は
上段のマスに選ばれた単語 A, 𝐵
を記入,下のマスにそのスペクトル
𝑎, 𝑏, 𝑐 を記入した上で対応するフ
レームを線で結ぶ.
標準パターン
入力音声パターン
音情報処理
𝑐
𝑎
𝑏
𝑐
𝑐
𝑏
𝑎
𝑎
解答1
(𝐴)
2段目
𝑐 0
𝑏 3
2
3
0
1
0
3
𝑎 2
0
1
𝑐
(𝐵)
313 2 6 26
310 0 4 14 1
𝑏 3
𝑐 0
1
0
3
2
3
0
0
𝑏 3
1
0
0
27 2 4 1 3 0
𝐵 5 A2 A2
𝑎 𝑏
𝑐 𝑐 𝑏
𝑎
𝑎
𝑐
1段目
𝑐
𝑏
𝑎
(𝐴)
0 2 3 6 02 02 35 2 7 2 9
3 1 3 0 2 3 5 38 07 1 8 19
2 2 0 2 1 3 2 5 27 1 8 0 8 0 8
𝑐
音情報処理
𝑎
𝑏
𝑐
𝑐
𝑏
𝑎
𝑎
𝑏
𝑐
𝑏
3
08 1 9 1 5
08 38 2 4 2
3 8 35 0 2 1
𝐵 5 A2 A2
𝑎 𝑏
𝑐 𝑐
𝑏
1
𝑎
𝑎
(𝐵)
3 1 0 5 3 8 37 04 1 5 16
0 2 5 3 7 0 4 0 4 3 7 2 9 211
3 3 14 04 3 7 310 010 111 112
𝑐
𝑎
𝑏
𝑐
𝑐
𝑏
𝑎
𝑎
解答2
AB
認識された単語列は
上段のマスに選ばれた単語 A, 𝐵
を記入,下のマスにそのスペクトル
𝑎, 𝑏, 𝑐 を記入した上で対応するフ
レームを線で結ぶ.
A
B
a b c
b c b
標準パターン
入力音声パターン
音情報処理
𝑐
𝑎
𝑏
𝑐
𝑐
𝑏
𝑎
𝑎