スライド - 徳島大学・任研究室

Super-Functionに基づく日英機械翻訳
徳島大学 知能情報工学科
博士前期過程1年 篠山 学
背景

外国語の文章に触れる機会の増加
違和感のない翻訳の必要性

Super-Function(SF) を用いた翻訳シス

テムの提案
SFとは(1/2)



ある事象を別の事象に変換する関数
原言語と目標言語の対応を示す関数
文から名詞を取り除いたその他の文構造
彼は駅までタクシーに乗った。
SF
φ
彼
は
駅
タクシー
まで
: Node
: Edge
に乗った。
SFとは(2/2)



形態素解析
単語辞書
SFデータベース
Node table
日本文
英文
Φ
Φ
took
は
to
まで
に乗った。 .
Edge table
日本文 英文 条件
1
1
1p
2
3
the
3
2
a
システムのアウトライン
原言語文の入力
形態素解析
SFの照合
単語辞書
名詞の翻訳
SF
SFの抽出
生成
目標言語文の出力
対訳コーパス
SFの仕組み-翻訳の流れ(1/3)彼は駅までタクシーに乗った。
形態素解析
/彼/は/駅/まで/タクシー/に乗った。/
φ
彼
は
駅
タクシー
まで
に乗った。
SFの仕組み-翻訳の流れ(2/3)φ
は
まで
φ
took
to
日本文
1
2
3
英文
1
3
2
条件
1p
the
a
に乗った。
.
彼(1,m)
日本文
Φ
は
まで
に乗った。
英文
Φ
took
to
.
駅(2,the) タクシー(3,a)
単語辞書
He(1)
a taxi(3)
the
station(2)
SFの仕組み-翻訳の流れ(3/3)--順番に並べていく-φ
took
φ
to
He
took
He
.
a taxi
to
a taxi
the station
the station
He took a taxi to the station .
.
システムのアウトライン
原言語文の入力
形態素解析
SFの照合
単語辞書
名詞の翻訳
SF
SFの抽出
生成
目標言語文の出力
対訳コーパス
SFの生成

EDR日英対訳コーパス(約20万対訳文)

プログラムを作成し自動で生成(約14万)
60000
37.0%
50000
27.1%
40000
19.9%
30000
20000
10000
9.40%
3.61%
2.21%
0
1node
2node
3node
4node
-日本語ノード別SF-
5node
6node
翻訳実験

実験目的


使用SF



EDRコーパスから生成したSF(約14万)
評価用日本語文


生成したSFでどれくらい翻訳できるか
高校英語参考書例文の日本語文(256文)
翻訳結果と評価文の英語が一致していれ
ば成功
名詞の翻訳結果は含まない
翻訳実験結果
256文
翻訳成功
216文(84%)
SFが一致
226文(88%)
但し86文に他候
補あり
日本語ノードと条
件のみ
-- 成功例 -去年は雪が多かった。
We had a lot of snow last year.
彼は大変早く走ったので私はついて行くことができなかった。
He ran too fast for me to keep up with him.
翻訳実験結果



違和感のない翻訳結果を出力した
86文に他候補が存在した
失敗した例で多かったのは、ひらがなと漢
字の違いによる不一致や語尾の違いによ
る不一致であった
-- 失敗例 -(海)に行くよりは(山)にいきたい。
Z:に行くよりは:に行きたい。
考察



生成したSFは固有のものが多い
生成したSFを使った翻訳でも競合する候
補がある
語尾の統一で固有のものは減らすことが
できるが、競合する候補は増える
次に一度SFになった文が元の文にどのくらい
戻るかを調べるためにクローズドテストを行った
クローズドテスト

実験目的


使用SF


EDRコーパスから生成したSF(約14万)
テストセット


SFになった文がどれくらい元に戻るか
SFを生成できた日本語文をランダムに選んだ
256文
成功条件


翻訳結果が元の文と同じ場合
他候補が存在しても一つに特定できる場合
クローズドテスト結果
他候補なし 条件で特定を含む
256文 188文(73%)
202文(79%)
(私)は(アイスクリーム)が好きではない。
Z:don’t care for:.
Z:don’t like:.


同じ意味の英文
関係代名詞の省略、非省略
翻訳候補を限定するには

概念辞書を使う
列車(4447c9)→軌道に沿って走る乗り物
(444863)
→・・・→哺乳類(30f6c5)→・・・
ラクダ
(3be294)

概念辞書が有効な例
Z:は:に乗った。
Z:got on:. He got on the train.
Z:rode:. He rode a camel.
テストセットの数が少なすぎたので、数を
増やして再実験し概念辞書が有効か判断
まとめ



生成したSFと翻訳実験の考察
考察に基づいてクローズドテストを実施
クローズドテスト結果を考察
進捗状況




翻訳システムの作成
SF抽出プログラムの作成
クローズドテストの実施
デモ用インターフェイスの作成
今後の予定




インターフェイスの改良
SF抽出プログラムの改良
単語辞書の改良
クローズドテスト


テストセットを増やして再実験
再実験の結果を元に絞込み方法を検討
SFの生成(1/3)


対訳コーパス
単語辞書
彼は駅までタクシーに乗った。
He took a taxi to the station .
形態素解析
φ
φ
彼
He
は
took
駅
タクシー
まで
a taxi
to
に乗った。
the station
.
SFの生成(2/3)
Node
φ
は
まで
に乗った。
φ
took
to
.
Edge
He
a taxi the station
彼
名詞の翻訳
彼 タクシー 駅
1p
a
the
駅
タク
シー
順序の決定
彼 タクシー 駅
1p
a
the
1,1p
3,the
2,a