フレーズアライナを用いた翻訳候補のreranking

統計的機械翻訳における
フレーズ対応最適化を用いた
翻訳候補のリランキング
越川 満* 内山 将夫† 梅谷 俊治‡
松井 知己§ 山本 幹雄*
* 筑波大学 大学院 システム情報工学研究科
† 情報通信研究機構 MASTAR プロジェクト
‡ 大阪大学 大学院 情報科学研究科
§中央大学 理工学部 情報工学科
予稿の図の訂正

予稿 2ページ目;図2
逆
 正しくはフレーズ3が左、フレーズ2が右
2015/9/30
言語処理学会 第15回 年次大会
2
研究の目的
関連研究
提案手法
評価実験
まとめ
フレーズベース統計翻訳

以下の式に基づいて翻訳
eˆ  arg max Pe, c f 
e
c
 arg max max Pe, c f 
e
e
e
e ,c
it is
rainy
today
.
です
。
フレーズ対応 c
目的言語文 e
今日 は
雨
c
 arg max'Pe, c f 
デコーダ・・・ヒューリスティック探索
max’: maxの近似解

原言語文 f
与えられた f に対する翻訳として
あらゆる e,c を考慮し、最も確率の
高い候補 e
^ を出力
デコーダの問題点

フレーズ対応cについて厳密な確率最大化でない
2015/9/30
言語処理学会 第15回 年次大会
3
研究の目的
関連研究
提案手法
評価実験
まとめ
研究の目的

デコーダの探索を厳密化

整数計画法を用いて
翻訳候補に最適なフレーズ対応を付与
従来法:
eˆ  arg max' Pe, c f 
e ,c
e
分解
本研究:
max' max
e
maxcを厳密化
c
→ デコーダの探索エラーの低減
→ 翻訳精度の改善
2015/9/30
言語処理学会 第15回 年次大会
4
研究の目的
関連研究
提案手法
評価実験
まとめ
フレーズ対応の最適化

フレーズ対応
 対訳文の各単語を一度ずつ被覆するフレーズ対の組合せ
フレーズ対
f1 f2 f3 f4
f1 f2 f3 f 4
f1 f2 f3 f4
e1 e2 e3
e1 e2 e3
e1 e2 e3
フレーズ対応が成立

フレーズ対応が不成立
フレーズ対応問題
 入力:対訳文および「フレーズ対とその確率」のテーブル
 出力:確率最大の(=最適な)フレーズ対応
2015/9/30
言語処理学会 第15回 年次大会
5
研究の目的
関連研究
提案手法
評価実験
まとめ
フレーズ対応問題の単純な定式化
原言語側の集合分割問題
集合
解候補 ①
f 1 f2 f3 f4
[DeNero and Klein 2008]
F1
分割
原言語側:
f1 f2
フレーズ F1
F4
f1 f2
フレーズ対
テーブル
f1
f2
F2
集合
解候補 ②
E2
e1
e1 e2
e1 e2
e3
原言語側:
E4
e1 e2 e3
分割
目的言語側:
言語処理学会 第15回 年次大会
e3
E4
より確率の高い候補が
解として選ばれる
e2
目的言語側の集合分割問題
2015/9/30
f3 f4
E1
F3
E3
E1
目的言語側:
f3 f4
F4
F2
F3
F4
f1
f2
f3 f4
e1
e2
e3
E3
E2
E4
6
研究の目的
関連研究
提案手法
評価実験
まとめ
単純な定式化とリオーダリングモデル

リオーダリング確率
[Tillmann and Zhang 2005]
 目的言語側で隣接のフレーズ対ペアに対し付与
原言語側で分離
f1
f3 f4
e2
フレーズ対 P2

原言語側でも同順
f1 f2
f3 f4
原言語側で逆順
f1
f2
e3
e1 e2
e3
e1
e2
P4
P1
P4
P3
P2
単純な定式化でのリオーダリング確率の表現
 整数計画問題の変数: 各フレーズ対kに0-1変数xk
 フレーズ対が対応に含まれるか否かを表す
P3とP2との
 リオーダリング確率は二次式で表現
リオーダリング確率
x3・d32・x2
2015/9/30
言語処理学会 第15回 年次大会
7
研究の目的
関連研究
提案手法
評価実験
まとめ
単純な定式化の問題点
[DeNero and Klein 2008]

目的関数:フレーズ翻訳確率のみを最大化

リオーダリング確率を考慮しない

二次式での表現は計算コストが高いため
フレーズ対iとjとのリオーダリング確率
xi・dij・xj
⇔ リオーダリング確率の使用は一般に性能向上
目的関数に一次式としてリオーダリング確率を
組込み可能な新たな定式化を提案
2015/9/30
言語処理学会 第15回 年次大会
8
研究の目的
関連研究
提案手法
評価実験
まとめ
フレーズ対応問題の新たな定式化

目的言語側についてグラフ化
 変数: 枝(i, j)の使用有無を表す0-1変数 yij
 yijが1 ・・・ 枝(i,j)の両端のフレーズ対iとjが使用される
 リオーダリング確率は枝に対する重み
P3とP2との
フレーズ対番号
e1
e2
リオーダリング確率
e3
y32・d32
1
4
s
3
2
g
リオーダリング確率
フレーズ対 P2
フレーズ対 P3
f1
e1
2015/9/30
f2 f3 f4
e2 e3
f1
f2
e1
e2
P3
P2
言語処理学会 第15回 年次大会
f1
e1
f2 f3 f4
e2
e3
9
研究の目的
関連研究
提案手法
評価実験
まとめ
フレーズ対応が満たす制約条件
原言語側
フレーズ対応
F2
F3
F4
f1
f2
f3 f4
集合
F1
F4
f1 f2
f3 f4
f1 f2 f3 f4
フレーズ対応が満たすべき条件
分割
F2
F3
F4
f1
f2
f3 f4
・・・線形整数計画問題として定式化可能
f1
f2
e3
e1
e2
E3
E2 (1)原言語側
E4
F2 F3
:集合分割問題の解
(2)目的言語側 :開始ノードsから終端ノードgへのパス
目的言語側
e1
e2
e3
フレーズ対番号
1
4
s
2015/9/30
3
2
言語処理学会 第15回 年次大会
g
10
研究の目的
関連研究
提案手法
評価実験
まとめ
フレーズ対応最適化を用いた翻訳候補の
リランキング
デコーダによりn best翻訳を獲得
2. フレーズ対応を最適化、確率を再計算
1.
フレーズ対応最適化後
n best翻訳
翻訳候補
順位
1
確率
it is fine today .
0.21
それは 今日 晴れ
2
it is fine
today
順位
1
翻訳候補
it is fine today .
0.21
だ。
それは 今日 晴れ
.
確率
2
だ。
it is fine today .
0.35
0.13
今日 は
よい 天気
だ。
今日 は
・
・
・
2015/9/30
よい 天気 だ 。
・
・
・
言語処理学会 第15回 年次大会
11
研究の目的
関連研究
提案手法
評価実験
まとめ
実験条件

コーパス:NTCIR-7 特許翻訳タスク コーパス(PSD1)




学習データ: 180万文ペア
テストデータ: 1,371文(フォーマルラン)
翻訳精度の評価基準:BLEU
翻訳方向:日→英

ベースライン:Mosesデコーダ
リオーダリングモデル:msd-bidirectional-fe
ビーム幅(n best数):10, 20, 50, 100, 200, 500, 1,000

整数計画問題のSolver: CPLEX 11.0


2015/9/30
言語処理学会 第15回 年次大会
12
研究の目的
関連研究
提案手法
評価実験
まとめ
実験結果

ビーム幅とBLEUの関係
有意水準5%で有意差あり
Mosesに比べて
rerank(提案手法)は
翻訳精度が若干高い
ビーム幅が大きいとき
Mosesとrerankの差は
ほとんどなくなる
2015/9/30
言語処理学会 第15回 年次大会
13
研究の目的
関連研究
提案手法
評価実験
まとめ
実験結果

ビーム幅と平均スコア改善幅の関係
 平均スコア(対数尤度)改善幅:
 提案手法とベースラインとの探索精度の差を表す指標
 各翻訳候補のフレーズ対応最適化前後におけるスコアの差の平均
ビーム幅を大きくとるほど、
スコア改善幅が小さくなる
ビーム幅を大きくとると
Mosesの探索精度がよくなり、
提案手法の効果が小さくなる
参考:翻訳候補のスコアの大きさ=-10~-100
2015/9/30
言語処理学会 第15回 年次大会
14
研究の目的
関連研究
提案手法
評価実験
まとめ
まとめ

提案手法
 フレーズ対応問題の新たな定式化
フレーズ対応についての厳密な確率最大化
 リオーダリングモデルの考慮

 フレーズ対応最適化による翻訳候補のリランキング

評価実験
 提案手法により翻訳精度が若干改善
 従来法でもフレーズ対応についての精度は十分
→ 目的言語文についての探索精度向上が必要
2015/9/30
言語処理学会 第15回 年次大会
15
補足:フレーズ対応問題の単純な定式化
の詳細

目的関数

max Πpkxk
k∈K
フレーズ翻訳確率

制約条件
Fx = 1
・・・原言語側単語の被覆条件
 Ex = 1
・・・目的言語側単語の被覆条件
 xk ∈ {0,1} (∀k∈K)・・・各フレーズの使用変数

2015/9/30
言語処理学会 第15回 年次大会
16
補足:単純な定式化の制約条件 Fx = 1
フレーズ対集合
原言語側
フレーズ対kを使うか?
使う
:xk=1
使わない:xk=0
フレーズ対番号
 x1 
 
 x2 
1
0
1
1
0
0


f1 
 x 
3
f2  1 1 0 0 1 0 
・x 


0 1 0 0 0 1
4
f3

  

f 4  0 1 0 0 0 1   x5 
x 
各フレーズが被覆する単語位置を
 6
1として表す0-1行列
1 2 3 4 5 6
2015/9/30
=
言語処理学会 第15回 年次大会
1
 
1
1
 
1
 
f1
f2
f3
f4
各単語が一度だけ被覆
されることを表す
17
補足:フレーズ対応問題の新しい定式化
の詳細
 目的関数

maxk∈K
Πpkxk・ Πd
y
y∈Y e e
フレーズ翻訳確率

リオーダリング確率
制約条件
= b ・・・原言語側が
 My = b ・・・目的言語側でパスとなっている制約
 x = Ny
・・・目的言語側の仮変数yからxを導出
 Fx


2015/9/30
xk ∈ {0,1}
ye ∈ {0,1}
(∀k∈K)
(∀e∈E)
・・・各フレーズの使用変数
・・・目的言語側の枝変数
言語処理学会 第15回 年次大会
18
補足:制約条件My=b
e1
フレーズ対番号
1
e2
e3
4
1
4
s
2
枝番号
2015/9/30
3
2
6
g
5
3
言語処理学会 第15回 年次大会
19
補足:recombine条件による性能差
• default:Mosesのデフォルトrecombine条件
• recombine+ :default + リオーダリングスコアの一致条件
2015/9/30
言語処理学会 第15回 年次大会
20
補足:n bestのスコア近似(Moses)
仮説3から5へ展開した場合の
リオーダリングスコアが適用されている
仮説番号
2015/9/30
言語処理学会 第15回 年次大会
21
補足:ビーム幅と平均スコア改善幅

平均スコア(対数尤度)改善幅:
 提案手法とベースラインとの探索精度の差を表す
 各翻訳候補の対応最適化前後におけるスコアの差の平均
ビーム幅を大きくとるほど、
スコア改善幅が小さくなる
ビーム幅を大きくとると
Mosesの探索精度がよくなり、
提案手法の効果が小さくなる
参考:翻訳候補のスコアの大きさ=-10~-100
2015/9/30
言語処理学会 第15回 年次大会
22
補足:処理時間とBLEUの関係

処理時間
 従来法(Moses)・・・翻訳時間そのもの
 提案手法・・・・・・・・翻訳時間
2015/9/30
+ フレーズ対応最適化時間
言語処理学会 第15回 年次大会
23
補足:翻訳例
正解例の下線部が
Mosesでは分離していたのに対して、
提案手法(rerank)ではリオーダリング
スコアも考慮して最適化したことで
結合している
2015/9/30
言語処理学会 第15回 年次大会
24
補足:翻訳例(詳細)


翻訳結果にリオーダリングスコア最適化効果が見られる
(上図:黒下線部)
フレーズ対応がよりよくなった?(下図:赤太枠)
2015/9/30
言語処理学会 第15回 年次大会
25