スライド - 徳島大学・任研究室

実例に基づく帰納的学習による
機械翻訳手法に関する研究
徳島大学院
工学研究課
知能情報工学専攻 任研究室
M1 尹 大鵬
背
景
実用的な機械翻訳システムの実現に向
け,これまで多くの研究がなきれてき
た.その主流となっているのが文法解
析に基づく解析型の機械翻訳手法であ
る.しかし,この手法は限定きれた文
法規則で多様な言語現象に処理するこ
との困難さから.良質な翻訳を十分に
得られるものとはなっていない.
はじめに
社会の国際化の進展につれ,品質の高い翻訳
を高速かつ経済的に行う実用的な機械翻訳シ
ステムの開発が強く望まれている.そうした
ニーズに応えるべく,これまで多くの機械翻
訳手法の研究が行われてきた.しかし,文法
解析に基づく解析型の機械翻訳手法において
は,多様な言語現象を有限個の文法規則で記
述することの困難さや文法規則や辞書の巨大
化にともなう,それら問題点があげられる.
学習型機械翻訳手法の特徴
システム自身が与えられたデータから
自動的かつ帰納的に翻訳ルールを学習
する。
学習型機械翻訳手法の処理遇程
遺伝子の説明
フィードバックの説明2-1
翻訳部で求められた翻訳結果に対する正
誤の判定を行う.生成された翻訳結果が
与えられた正しい中国語訳文と一致する
場合,使用された翻訳ルールの正确訳度
数を1増加させる.一致しない場合には,
誤翻訳度数を1増加させる.次いで、そ
の値より,翻訳部で使用されたすべての
翻訳ルールに対し適応度を決める.適応
度は以下の式により得られる.
フィードバックの説明2-2
適応度は以下の式により得られる.
正翻訳度数
*100
適応度(%)=
全翻訳度数
学習部における翻訳ルール
抽出の処理過程
翻訳ルール抽出の処理過程の説明3-1
1. 既存的翻訳例からの選択
He likes tennis. 他喜欢网球。
She likes tea. 她喜欢茶。
2.英語の交差
He likes
tennis.
He likes tea.
She likes
tea.
She likes tennis.
3.中国語の交差
他喜欢
网球。
他喜欢茶。
她喜欢
茶。
她喜欢网球。
4.新たに生成された翻訳例
He likes tea. 他喜欢茶。
翻訳ルール抽出の処理過程の説明3-2
突然変異は,遺伝子つまり翻訳例の単語をそれまで
に抽出された単語の翻訳ルールや変数に置き変える
ことにより,新たな翻訳例や翻訳ルールを生成する.
do you like tea?
你喜欢茶吗?
do you like fish?
你喜欢鱼吗?
翻訳ルール抽出の処理過程の説明3-3
1.既存的翻訳例
He likes tennis. 他喜欢网球。
2.交差により生成された翻訳例
He likes tea. 他喜欢茶。
3.共通部分
He likes @0. 他喜欢@0.
4.差異部分
(茶)
翻訳部における処理過程
今後の課題
1.中国語の形態素解析器を探します.
2.二つの形態素解析器を実験します. テキス
ト(大学英語勉強の本)からを訓練する.
3.英中の電子辞書を探します. 捜した後で,
学習型の機械翻訳システムを開発開発する.
4.新しい方法は引用します,例えば,ファ
ジー論理を引用します.