2002年8月5日〜6日 キックオフセミナー@京都 発表資料

自分と同レベルの訳文を出力
する翻訳システムの探求
未踏14キックオフセミナー@京都
2002年8月5日
むしゃ
武舎 広幸
http://www.musha.com/
自分と同レベルの訳文を出力する
翻訳システムの探求
1. なぜ「未踏ソフトウェア」ができると主張す
るのか
2. なぜ「翻訳システム」を作りたいのか
3. 何を実現するのか
4. どのように実現するのか
1. なぜ「未踏ソフトウェア」ができると主
張するのか
2. なぜ「翻訳システム」を作りたいのか
3. 何を実現するのか
4. どのように実現するのか
なぜ「未踏ソフトウェア」ができる
と主張するのか
• ほかの人にはない経験があるから
私の履歴書
1975年
1978年
1979年
1980年
A大学入学 言語学
転科
数学
FORTRANの授業 computerとの出会い
卒業
– 非常勤助手をやりつつ大学院浪人(数学)
– B大学研究生 ソフトウェア
1881年 C大学大学院入学 ソフトウェア工学
1883年 C大学大学院終了(修士)
– 某大学大学院博士課程 入試に落ちる
– 某コンピュータ会社研究所 入社試験に落ちる
– 小ソフトハウスD社に入社 機械翻訳との出会い
私の履歴書
1983年 ソフトハウスD社
– 某組織からの発注で機械翻訳システムを
開発中
– 大型機+FORTRAN → Workstation + C
• メンバーは5人程度(辞書作業者を除く)
• プログラムの一部(1/4程度)+文法+辞書を担
当
• 朝から晩まで機械翻訳ソフトの開発に没頭
私の履歴書
1984年 D社退職,E大学研究生
– 米国某大学のY先生との出会いをきっかけに退職
1985年 E大学大学院博士後期課程入学
1986年 米国留学
– F大学大学院入学(9月)
– G大学機械翻訳センター客員研究員(11月)
• 翻訳ソフトの構文解析部分のプログラム開発
• 数百語の辞書,数百の文法規則
私の履歴書
1987年 帰国。人間翻訳を始める
1989年 E大学院 満期退学,会社設立
なぜ?
– 大もうけしたかったのではなく
– 人に使ってもらえる製品を作りたかった
私の履歴書
1989年 会社設立
有限会社ワードハウス → マーリンアームズ株式会社
–
ソフトウェア開発 — 機械翻訳。
主にH社 ←D社
•
•
•
英語←→日本語(PC-Transer,コリャ英和!)
英語→中国語
英語←→韓国語(半年間韓国滞在)
・いくらがんばっても「自分のもの」ではない
・現在も,基本的なアーキテクチャは
1980年代と変わっていない
私の履歴書
1989年 会社設立
有限会社ワードハウス → マーリンアームズ株式会社
–
ソフトウェア開発
– 人間翻訳
• コンピュータマニュアル
• 書籍
– 『マッキントッシュ物語』『暴走する帝国』
– 『HTML入門』『Java言語入門』『Unix入門』...
私の履歴書
1989年 会社設立
有限会社ワードハウス → マーリンアームズ株式会社
–
–
ソフトウェア開発
人間翻訳
– 著作
•
•
•
1994年『パソコン翻訳ソフト活用法』
2001年『プロ翻訳家養成 英日コンピュータコース
ADVANCED』(通信教育テキスト)
2002年『プログラミングは難しくない』
私の履歴書
•
翻訳通信教育 テキスト執筆
–
自分で翻訳 — 自分の感覚の世界
–
翻訳を教える — 自分の感覚を人にわかるように
教える必要がある
無意識の意識化
→ 具体例は後ほど
なぜ「未踏ソフトウェア」ができる
と主張するのか
•
ほかの人にはない経験があるから
1. なぜ「未踏ソフトウェア」ができると主
張するのか
2. なぜ「翻訳システム」を作りたいのか
3. 何を実現するのか
4. どのように実現するのか
なぜ「翻訳システム」を作りた
いのか
本開発の目的
• 第一線の翻訳者と同レベルの訳文を出
す機械翻訳システムに必要な要素を洗
い出し,そのうち実現可能な要素を枠
組みとして組み込んだプロトタイプシ
ステムを完成する。
目的
ソフトウェア開発では,
無名だが,翻訳では,
そこそこ著名らしい
• 第一線の翻訳者 →自分のこと
と同レベルの訳文を出す機械翻訳シス
テムに必要な要素を洗い出し,そのう
ち実現可能な要素を枠組みとして組み
込んだプロトタイプシステムを完成す
る。
翻訳ではそこそこ著名らしい
「武舎さんて,***訳しまし
たよね?」
翻訳ではそこそこ著名らしい
「武舎さんて,***訳しまし ええ,でも本業はど
ちらかというと,ソフ
たよね?」
ト開発なんです。
翻訳ではそこそこ著名らしい
私がソフトを作ったこ
ええ,でも本業はど
とはほとんど誰も知
「武舎さんて,***訳しまし
ちらかというと,ソフ
たよね?」 らない!
ト開発なんです。
翻訳ではそこそこ著名らしい
「本業」は (人間)翻訳ではなく
ソフトウェア開発なのだ
ソフトウェア開発でも,そこそこ著名ぐ
らいにはなってやろう
なぜ「翻訳システム」を
作りたいのか
• ソフトウェア開発者としての自分を主張した
い
• 自分の頭の中にあるものをソフトウェアとし
て表現したい
• 儲けたい
• 翻訳者の役に立ちたい
翻訳者の役に立ちたい
• 一般の人にとっての翻訳ソフト
– 内容を大まかに素早く知るための道具
• 翻訳者にとっての翻訳ソフト
– 辞書を引く時間が減る
特に専門用語の訳語の統一
– 心理的な負担の軽減
心理的な負担の軽減
• 英語から日本語に置き換える作業が部分的に
ではあれ不要になる
I have already shown you a small sample of this,
in the discussion of the window object.
windowオブジェクトの議論において、すでにこれ
の小さい例を示した。
だいたい意味が分かる
→ 原文の解釈が楽になる
心理的な負担の軽減
• 英語から日本語に置き換える作業が部分的にではあ
れ不要になる
I have already shown you a small sample of this, in the
discussion of the window object.
windowオブジェクトの議論において、すでにこれの小さ
い例を示した。
windowオブジェクトに関する説明で,すでに短い例
を見ました。
翻訳者の役に立ちたい
• 一般の人にとっての翻訳ソフト
– 内容を大まかに素早く知るための道具
• 翻訳者にとっての翻訳ソフト
– 辞書を引く時間が減る
特に専門用語の訳語の統一
– 心理的な負担の軽減
英語から日本語に置き換える作業が部分的にで
あれ不要になる
つまり「高速辞書引きソフト」
翻訳者の役に立ちたい
「高速辞書引きソフト」を超えるものを
作りたい
→ 具体例は後ほど
なぜ「翻訳システム」を作り
たいのか
• ソフトウェア開発者としての自分を主張した
い
• 自分の頭の中にあるものをソフトウェアとし
て表現したい
• 儲けたい
• 翻訳者の役に立ちたい
「高速辞書引きソフト」を超えるもの
1. なぜ「未踏ソフトウェア」ができると主
張するのか
2. なぜ「翻訳システム」を作りたいのか
3. 何を実現するのか
4. どのように実現するのか
何を実現するのか
•
自分の頭の中にあるものをソフトウェアとして実現する
そのために
1.
2.
自分の翻訳を分析する
←通信教育テキスト,自分の翻訳
実現方法を考える
• 可能なもの
• 不可能なもの
• やってみないとわからないもの
具体例
自分の翻訳を分析する
•
翻訳のテクニックとして一般化されているもの
は(できれば)すべて入れる
技術翻訳のテクニック (1)
The Forte for Java IDE enables you to easily and quickly
create Internet applications
Fort for Java IDEは,あなたに,簡単にしかも素早くインターネットア
プリケーションを作成することを提供してくれます。
<無生物X> provide(s) you to <動詞句>
→ Xにより<動詞句>できます
Fort for Java IDEにより,簡単にしかも素早くイン
ターネット関連のアプリケーションを作成できます。
技術翻訳のテクニック (2)
Over the last twelve months TM and MT
venders have been forming alliances to ...
この12ヵ月にわたって,TMおよびMTベンダーは,
同盟を作り上げていました...
twelve months → 12ヶ月間 → 1年間
half a dozen → 半ダース → 6個(数個)
過去1年ほどの間,TMベンダーとMTベンダーは
協力して...
自分の翻訳を分析する
•
翻訳のテクニックとして一般化されているもの
は(できれば)すべて入れる
ここまで見たものはすでに実現されている
難しいものがある
技術翻訳のテクニック (3)
The document object gives you direct
control over the cookies
documentオブジェクトは,クッキーに対する直接の制御を
与える。
<無生物X> give(s) you <動作を表す名詞Y>
→ Xにより<Yの動詞形>(することが)できる。
documentオブジェクトにより(を使うと)クッキーを直接制
御できる。
技術翻訳のテクニック (3)
The document object gives you direct
control over the cookies
<無生物X> give(s) you <動作を表す名詞Y>
→ Xにより<Yの動詞形>(することが)できる。
the user can select a lower percentage value
for better leverage of the master TM contents.
the master TM contentsをより効果的に使うために
技術翻訳のテクニック (3)
supporting development environment for
building, deploying, and managing distributed
Java applications
分散Javaアプリケーションを構築し、運用し、管理することを
サポートするための開発環境
名詞形にした方が自然
分散Javaプリけーションの構築、運用、管理をサポートする
ための開発環境
技術翻訳のテクニック (3)
品詞の変換が必要
動詞 → 名詞
名詞 → 動詞
名詞 → 形容詞 He is a good swimmer.
形容詞 → 副詞
技術翻訳のテクニック その他
An efficient localization project involves
several steps.
効果的なローカライゼーションプロジェクトは,い
くつかのステップを含む。
???
ローカライゼーションプロジェクトを効率的に実施するに
は,いくつかのステップが必要となります。
技術翻訳のテクニック その他
This step ensures that the master TM contains
all new translations ...
このステップは,マスターTMがすべての新しい翻訳を含
むことを保証する
<無生物X> ensures that ...
→ <無生物X> により,確実に...になる。
このステップにより,すべての新しい翻訳が間違いなくマ
スターTMに入る
技術翻訳のテクニック その他
Before you go anywhere near a graphic
package, take time to think about the message you’d like to convey
with your banner.
グラフィックパッケージの近くに行く前に,...
???
グラフィックパッケージを起動する前に...
技術翻訳のテクニック その他
How Jbuilder and VisiBroker work
together
JbuilderとVisiBrokerはどう一緒に働いているか
???
JbuilderとVisiBroker の協調
1. なぜ「未踏ソフトウェア」ができると主
張するのか
2. なぜ「翻訳システム」を作りたいのか
3. 何を実現するのか
4. どのように実現するのか
どのように実現するのか
• 機械翻訳ソフトの開発に没頭する
私の履歴書
1983年 ソフトハウスD社
– 某組織からの発注で機械翻訳システムを開発中
– 大型機+FORTRAN → Workstation + C
• メンバーは5人程度(辞書作業者を除く)
• プログラムの一部(1/4程度)+文法+辞書を担当
• 朝から晩まで
機械翻訳ソフトの開発に没頭
20年間使われたソフトができた
どのように実現するのか
• 機械翻訳ソフトの開発に没頭する
• 自分の力を信じて
どのように実現するのか
• 既にプロトタイプのプロトタイプはできてい
る
その全体像は…