2003年1月22日 未踏14シンポジウム@国際フォーラム 発表

未踏14シンポジウム
自分と同レベルの訳文を出力する
翻訳システムの探求
むしゃ
武舎 広幸
http://www.musha.com/
2003年1月22日
東京国際フォーラム
自分と同レベルの訳文を出力する
翻訳システムの探求
= 翻訳をする自分
+ 翻訳を教える自分
+ 翻訳ソフトを作る自分
自分と同レベルの訳文を出力する
翻訳システムの探求
自分が目指してきた訳
• 読みやすくわかりやすい訳文
• 自然な訳文
→ 翻訳臭くない訳文
このシステムが目指すもの
→ 少なくとも機械翻訳臭くない訳文
機械翻訳臭くない訳文を出すには
→ 機械翻訳臭い訳文をなくせばよい
機械翻訳臭い訳文とは?
機械翻訳臭い訳文とは 例1
今後数週間で発表されるMusicMatch Jukebox 7.5
は、将来のリリースによっても維持されるiPodサポ
ートを得る。
MusicMatch Jukebox 7.5 -- due out sometime in the next
several weeks -- will have iPod support that should be
maintained by future releases as well.
機械翻訳臭い訳文とは 例1
今後数週間で発表されるMusicMatch Jukebox 7.5
は,将来のリリースによっても維持されるiPodサポ
ートを得る。
数週間のうちにリリースされる予定のMusicMatch
Jukebox 7.5では,iPodがサポートされる予定であり,
以後のリリースでも同様だ。
機械翻訳臭い訳文とは 例1
今後数週間で発表されるMusicMatch Jukebox 7.5
は、将来のリリースによっても維持されるiPodサポ
ートを得る。
MusicMatch Jukebox 7.5 -- due out sometime in the next
several weeks -- will have iPod support that should be
maintained by future releases as well.
機械翻訳臭い訳文とは 例1
今後数週間で発表されるMusicMatch Jukebox 7.5
は、将来のリリースによっても維持されるiPodサポ
ートを得る。
その単語だけをみて訳している
MusicMatch Jukebox 7.5 -- due out sometime in the next
several weeks -- will have iPod support that should be
maintained by future releases as well.
機械翻訳臭い訳文とは 例2
コンピュータ上でブートする時、MusicMatchは最新
バージョンの7.2にアップグレードしたいかどうか確
認してくる。
When you boot up the computer, MusicMatch asks if you
want to upgrade to the newest version, 7.2.
機械翻訳臭い訳文とは 例2
コンピュータ上でブートする時、MusicMatchは最新
バージョンの7.2にアップグレードしたいかどうか確
認してくる。
コンピュータのブート時に,MusicMatchは新しい
バージョン,すなわち7.2にアップグレードするかどう
か尋ねてくる。
機械翻訳臭い訳文とは 例2
コンピュータ上でブートする時、MusicMatchは最新
バージョンの7.2にアップグレードしたいかどうか確
認してくる。
品詞に縛られている
When you boot up the computer, MusicMatch asks if you
want to upgrade to the newest version, 7.2.
コンピュータのブート時に
これに対して人間の翻訳は
数週間のうちにリリースされる予定のMusicMatch
Jukebox 7.5では,iPodがサポートされる予定であり,
以後のリリースでも同様だ。
コンピュータのブート時に,MusicMatchは新しい
バージョン,すなわち7.2にアップグレードするかどう
か尋ねてくる。
まわりを見て柔軟な対応ができる
このシステムが目指すもの
機械翻訳臭くない訳文の生成
まわりを見て柔軟な対応ができる
別の見方をすると
従来の翻訳ソフト
そ
れ
• 一般人にとっての翻訳ソフト
な
り
– 内容を大まかに素早く知るための道具
に
役
• 翻訳者にとっての翻訳ソフト
に
– 辞書を引く時間が減る
は
立
特に専門用語の訳語の統一
っ
– 心理的な負担の軽減
て
い
英語から日本語に置き換える作業が部分的にで
る
あれ不要になる
つまり「高速辞書引きソフト」
このシステムが目指すもの
機械翻訳臭くない訳文の生成
まわりを見て柔軟な対応ができる
高速辞書引きソフトを超えるもの
どのような翻訳が
できるようになったか
どのような翻訳ができるようになったか — 例
One strange thing about MusicMatch and the iPod is the software versions the
device will work with. The iPod comes with version 7.1 of the MusicMatch
software. When you boot up the computer, MusicMatch asks if you want to
upgrade to the newest version, 7.2 -- while most people would do the upgrade to
stay current with the latest software, you won’t be able to use your iPod if you do.
This problem should be remedied with a new point release. MusicMatch
spokesperson Jennifer Roberts said that
MusicMatch Jukebox 7.5 -- due out sometime in the next several weeks -- would
have iPod support that should be maintained by future releases as well. h
(http://maccentral.macworld.com/news/2002/10/21/ipod/ より一部を引用)
どのような翻訳ができるようになったか — 例
MusicMatchとiPodに関してひとつ奇妙なのはデバイ
スが動作するソフトウェアのバージョンである。iPodには
MusicMatchソフトウェアのバージョン7.1が付属している。
コンピュータのブート時に,MusicMatchは新しいバー
ジョン,すなわち7.2にアップグレードするかどうか尋ね
てくる。ほとんどの人はいつも最新のソフトウェアを使う
ためにアップグレードをしたいと思うだろうが,そうする
とiPodを利用できなくなってしまう。
どのような翻訳ができるようになったか — 例
この問題は次のマイナーバージョンアップで修正され
るはずである。MusicMatch担当者のJennifer Robertsは
(今後数週間のうちに出る予定の)MusicMatch Jukebox
7.5がiPodをサポートするだろう,そしてそれは今後のリ
リースによっても変わらないはずであると語った。
システムB
他の「システム」との比較
この問題は新しいポイント・リリースで改善されるべきであ
る。MusicMatchスポークスマン、ジェニファー・ロバーツは、
MusicMatchジュークボックス7.5(次の数週間でいつか予定さ
れている)が将来のリリースによって同様に維持されるべき
iPod支援を得るだろうと言った。
この問題は次のマイナーバージョンアップで修正されるは
ずである。MusicMatch担当者のJennifer Robertsは(今後数
週間のうちに出る予定の)MusicMatch Jukebox 7.5がiPodを
サポートするだろう,そしてそれは今後のリリースによっても
変わらないはずであると語った。
システムC
他の「システム」との比較
この問題は、新しいポイントリリースで修正されるべきだ。
MusicMatchスポークスマンのJennifer Roberts氏によれば、
今後数週間で発表されるMusicMatch Jukebox 7.5は、将来
のリリースによっても維持されるiPodサポートを得るという。
この問題は次のマイナーバージョンアップで修正されるは
ずである。MusicMatch担当者のJennifer Robertsは(今後数
週間のうちに出る予定の)MusicMatch Jukebox 7.5がiPodを
サポートするだろう,そしてそれは今後のリリースによっても
変わらないはずであると語った。
システムD
他の「システム」との比較
この問題は次のマイナー・バージョンアップで修正されるは
ずだ。MusicMatchのJennifer Roberts氏によれば,数週間以
内にリリース予定のバージョン7.5からはiPodがきちんとサ
ポートされるとのことだ。
この問題は次のマイナーバージョンアップで修正されるは
ずである。MusicMatch担当者のJennifer Robertsは(今後数
週間のうちに出る予定の)MusicMatch Jukebox 7.5がiPodを
サポートするだろう,そしてそれは今後のリリースによっても
変わらないはずであると語った。
他の「システム」との比較
システムA 「未踏」
(今後数週間のうちに出る予定の)MusicMatch Jukebox 7.5がiPodをサ
ポートするだろう,そしてそれは今後のリリースによっても変わらないは
ずであると語った。
システムB 機械翻訳ソフトX
MusicMatchジュークボックス7.5(次の数週間でいつか予定されている)
が将来のリリースによって同様に維持されるべきiPod支援を得るだろう
と言った。
システムC ニュースサイトXの訳文 (翻訳ソフト使用?)
今後数週間で発表されるMusicMatch Jukebox 7.5は、将来のリリース
によっても維持されるiPodサポートを得るという。
システムD 人間翻訳(武舎)
数週間以内にリリース予定のバージョン7.5からはiPodがきちんとサ
ポートされるとのことだ。
他の「システム」との比較
システムA 「未踏」
(今後数週間のうちに出る予定の)MusicMatch Jukebox 7.5がiPodをサ
ポートするだろう,そしてそれは今後のリリースによっても変わらないは
ずであると語った。
チューニングしている
システムB 機械翻訳ソフトX
MusicMatchジュークボックス7.5(次の数週間でいつか予定されている)
が将来のリリースによって同様に維持されるべきiPod支援を得るだろう
と言った。
チューニングしたくてもできない!
MusicMatch Jukebox 7.5 -- due out sometime in the next several
weeks -- would have iPod support that should be maintained by future
releases as well.
システムの概要
構成(当初予定)
現在約700語
構成(現在)
現在約700語
ほとんどをデータで
制御
プログラムはデータ
を解釈するだけ
システムの基本原理
・翻訳の過程を木構造の変形として捉える
This problem should be remedied with a new point release.
この問題は次のマイナーバージョンアップで修正されるは
ずである。
システムの基本原理
・翻訳の過程を木構造の変形として捉える
文
This problem should be remedied with a new point release.
文
この問題 は 次の マイナーバージョンアップ で 修正されるはずである。
システムの基本原理 — 辞書引き
文
This problem should be remedied with a new point release.
辞書引き
文
形容 名 助動 助動 動 前置 冠 形容 名詞
This problem should be remedied with a new point release.
システムの基本原理 — 構文解析
文
形容 名 助動 助動 動 前置 冠 形容 名詞
This problem should be remedied with a new point release.
構文解析(文法規則)
文
名詞句 動詞句
動詞句 前置詞句
名詞句
形容 名 助動 助動 動 前置
冠 形容 名詞
This problem should be remedied with a new point release.
システムの基本原理 — 変形
文
名詞句 動詞句
動詞句 前置詞句
名詞句
形容 名 助動 助動 動 前置
冠 形容 名詞
This problem should be remedied with a new point release.
変形(文法規則)
文
主動詞(受身+期待)
remedied
主格 手段格
( with)
problem point release
形容 形容 形容
This
a
new
システムの基本原理 — 生成
文
主動詞(受身+期待)
remedied
主格 手段格
( with)
problem point release
形容 形容 形容
This
a
new
生成(辞書)
文
主動詞(受身+期待)
remedied 修正されるはずである
主格 手段格
( with)によって
problem 問題 point release マイナーバージョンアップ
形容 形容 形容
This この
a
new
次の
システムの基本原理 — 出力
文
主動詞(受身+期待)
remedied 修正されるはずである
主格 手段格
( with)によって
problem
問題 point release マイナーバージョンアップ
形容 形容 形容
This この
a
new
次の
出力
文
この問題 は 次の マイナーバージョンアップ で 修正されるはずである。
特徴
まわりの状況をみて
柔軟な変形操作が行える
特徴
MusicMatch Jukebox 7.5 -- due out sometime in the next several
weeks -- would have iPod support that should be maintained by future
releases as well.
(今後数週間のうちに出る予定の)MusicMatch Jukebox 7.5がiPodをサ
ポートするだろう,そしてそれは今後のリリースによっても変わらないは
ずである。
特徴
MusicMatch Jukebox 7.5 -- due out sometime in the next several
weeks -- would have iPod support that should be maintained by future
releases as well.
文
主動詞
主格 目的格
形容
iPod
have
support 関係節
that should be maintained by
fut ure releases as well
特徴
(今後数週間のうちに出る予定の)MusicMatch Jukebox 7.5がiPodをサ
ポートするだろう,そしてそれは今後のリリースによっても変わらないは
ずである。
文
主動詞 主動詞
サポートする
主格 目的格
iPod それは今後のリリースによっても
変わらないはずである
特徴
haveを起点に条件を記述
文
主動詞
主格
目的格
形容
iPod
have
support
関係節
that should be maintained by
f ut ure releases as well
変形操作を行う
文
主動詞 主動詞
サポートする
主格 目的格
iPod
それは今後のリリースによっても変
わらないはずである
別の見方をすれば
翻訳メモリ(対訳データベース)を
より柔軟なものにした
MusicMatch Jukebox 7.5 -- due out sometime in the next
several weeks -- would have iPod support that should be
maintained by future releases as well.
ペアで記憶
数週間以内にリリー
ス予定のバージョン7.5からはiPodがきちんとサポートされると
のことだ。
翻訳メモリ
結構役に立つ
•繰り返しがある
•改訂版
しかし柔軟さはない
本システム
柔軟性が高い
•ポイントになる箇所を複数指定できる
•周囲を見回すことができる
•時々やりすぎることはあるが,あくまでも選
択肢を提示するだけである
→ 別の候補を選べば別の解も出せる
本システム
柔軟性が高い
•ポイントになる箇所を複数指定できる
QuickTimeý Dz TIFFÅiLZWÅj êLí£ÉvÉçÉOÉâÉÄ Ç™Ç±ÇÃÉsÉNÉ`ÉÉǾå©ÇÈǞǽDžÇÕïKóvÇ­Ç•
ÅB
•周囲を見回すことができる
•時々やりすぎることはあるが,あくまでも選
択肢を提示するだけである
→ 別の候補を選べば別の解も出せる
今後
• 全体,とくに辞書の記述法の整理
• 辞書データの構築