Super-Functionに基づく日英機械翻訳 徳島大学 知能情報工学科 博士前期過程1年 篠山 学 背景 外国語の文章に触れる機会の増加 違和感のない翻訳の必要性 Super-Function(SF) を用いた翻訳シス テムの提案 SFとは(1/2) ある事象を別の事象に変換する関数 原言語と目標言語の対応を示す関数 文から名詞を取り除いたその他の文構造 彼は駅までタクシーに乗った。 SF φ 彼 は 駅 タクシー まで : Node : Edge に乗った。 SFとは(2/2) 形態素解析 単語辞書 SFデータベース Node table 日本文 英文 Φ Φ took は to まで に乗った。 . Edge table 日本文 英文 条件 1 1 1p 2 3 the 3 2 a システムのアウトライン 原言語文の入力 形態素解析 SFの照合 単語辞書 名詞の翻訳 SF SFの抽出 生成 目標言語文の出力 対訳コーパス SFの仕組み-翻訳の流れ(1/3)彼は駅までタクシーに乗った。 形態素解析 /彼/は/駅/まで/タクシー/に乗った。/ φ 彼 は 駅 タクシー まで に乗った。 SFの仕組み-翻訳の流れ(2/3)φ は まで φ took to 日本文 1 2 3 英文 1 3 2 条件 1p the a に乗った。 . 彼(1,m) 日本文 Φ は まで に乗った。 英文 Φ took to . 駅(2,the) タクシー(3,a) 単語辞書 He(1) a taxi(3) the station(2) SFの仕組み-翻訳の流れ(3/3)--順番に並べていく-φ took φ to He took He . a taxi to a taxi the station the station He took a taxi to the station . . システムのアウトライン 原言語文の入力 形態素解析 SFの照合 単語辞書 名詞の翻訳 SF SFの抽出 生成 目標言語文の出力 対訳コーパス SFの生成 EDR日英対訳コーパス(約20万対訳文) プログラムを作成し自動で生成(約14万) 60000 37.0% 50000 27.1% 40000 19.9% 30000 20000 10000 9.40% 3.61% 2.21% 0 1node 2node 3node 4node -日本語ノード別SF- 5node 6node 翻訳実験 実験目的 使用SF EDRコーパスから生成したSF(約14万) 評価用日本語文 生成したSFでどれくらい翻訳できるか 高校英語参考書例文の日本語文(256文) 翻訳結果と評価文の英語が一致していれ ば成功 名詞の翻訳結果は含まない 翻訳実験結果 256文 翻訳成功 216文(84%) SFが一致 226文(88%) 但し86文に他候 補あり 日本語ノードと条 件のみ -- 成功例 -去年は雪が多かった。 We had a lot of snow last year. 彼は大変早く走ったので私はついて行くことができなかった。 He ran too fast for me to keep up with him. 翻訳実験結果 違和感のない翻訳結果を出力した 86文に他候補が存在した 失敗した例で多かったのは、ひらがなと漢 字の違いによる不一致や語尾の違いによ る不一致であった -- 失敗例 -(海)に行くよりは(山)にいきたい。 Z:に行くよりは:に行きたい。 考察 生成したSFは固有のものが多い 生成したSFを使った翻訳でも競合する候 補がある 語尾の統一で固有のものは減らすことが できるが、競合する候補は増える 次に一度SFになった文が元の文にどのくらい 戻るかを調べるためにクローズドテストを行った クローズドテスト 実験目的 使用SF EDRコーパスから生成したSF(約14万) テストセット SFになった文がどれくらい元に戻るか SFを生成できた日本語文をランダムに選んだ 256文 成功条件 翻訳結果が元の文と同じ場合 他候補が存在しても一つに特定できる場合 クローズドテスト結果 他候補なし 条件で特定を含む 256文 188文(73%) 202文(79%) (私)は(アイスクリーム)が好きではない。 Z:don’t care for:. Z:don’t like:. 同じ意味の英文 関係代名詞の省略、非省略 翻訳候補を限定するには 概念辞書を使う 列車(4447c9)→軌道に沿って走る乗り物 (444863) →・・・→哺乳類(30f6c5)→・・・ ラクダ (3be294) 概念辞書が有効な例 Z:は:に乗った。 Z:got on:. He got on the train. Z:rode:. He rode a camel. テストセットの数が少なすぎたので、数を 増やして再実験し概念辞書が有効か判断 まとめ 生成したSFと翻訳実験の考察 考察に基づいてクローズドテストを実施 クローズドテスト結果を考察 進捗状況 翻訳システムの作成 SF抽出プログラムの作成 クローズドテストの実施 デモ用インターフェイスの作成 今後の予定 インターフェイスの改良 SF抽出プログラムの改良 単語辞書の改良 クローズドテスト テストセットを増やして再実験 再実験の結果を元に絞込み方法を検討 SFの生成(1/3) 対訳コーパス 単語辞書 彼は駅までタクシーに乗った。 He took a taxi to the station . 形態素解析 φ φ 彼 He は took 駅 タクシー まで a taxi to に乗った。 the station . SFの生成(2/3) Node φ は まで に乗った。 φ took to . Edge He a taxi the station 彼 名詞の翻訳 彼 タクシー 駅 1p a the 駅 タク シー 順序の決定 彼 タクシー 駅 1p a the 1,1p 3,the 2,a
© Copyright 2024 ExpyDoc