ことばとコンピュータ

ことばとコンピュータ
2006年度1学期 第13回
本日の内容
• コンピュータで何ができるかを知る
– 機械翻訳
2
機械翻訳とは?(1)
• Aという言語からBという言語への
「等価」な置き換え
3
機械翻訳とは?(2)
• Aという言語からBという言語への
「等価」な置き換え
等価とは?
4
機械翻訳とは?(3)
• Aという言語からBという言語への
「等価」な置き換え
等価性 3タイプ
(1) 単語と構造の等価性 ...逐語訳的
(2) 意味内容の等価性 ...意訳
(3) 効果の等価性 ...
高度な意訳や創造的な訳(文学)
5
機械翻訳とは?(4)
• Aという言語からBという言語への
「等価」な置き換え
等価性 3タイプ
表層,形式的
(1) 単語と構造の等価性 ...逐語訳的
(2) 意味内容の等価性 ...意訳
(3) 効果の等価性 ...
高度な意訳や創造的な訳(文学)
言葉の対応以上のものが必要
6
機械翻訳とは?(5)
(1) 単語と構造の等価性 ...逐語訳的
(2) 意味内容の等価性 ...意訳
(3) 効果の等価性 ...
高度な意訳や創造的な訳(文学)
• 現在の機械翻訳は
→(1)が基本.(2)へは挑戦.(3)はまだ無理.
7
機械翻訳とは?(6)
(1)でも結構役立つ...対象を限定すれば.
技術系の文章,科学論文,マニュアル等
がよく対象として選ばれる
(1)のレベルでも比較的理解できそうな対象といえる
処理ドメイン(分野)が限られており,語義
の曖昧性も比較的少ない.
8
どうやる機械翻訳(1)
• 現在の商用システムのほとんどは
構文トランスファー方式
○文を単語に切って品詞を決める
○文の構造を決める
△文中の単語の意味を決める
×照応詞が何を指しているかを推測する
×文章のトピックを推測する
9
どうやる機械翻訳(2)
10
どうやる機械翻訳(3)
①文を単語に切って品詞を決める(形態素解析)
機械が文書を翻訳する.
機械(名詞)/が(助詞)/文書(名詞)/を(助詞)
/翻訳する(翻訳する:動詞・基本形)/.(句点)
活用変化があればその情報も解析する
例:「翻訳した」→ 「翻訳し(翻訳する:動詞・連用
形」+「た(た:助動詞・終止形)」
11
どうやる機械翻訳(4)
②文の構造を決める:
規則1 文=主部+述部
• 構文構造を解析
規則2 主部=名詞句+助詞
– 文法規則に基づき,
文の構造を解析
– 実際のシステムは,
数千から数万の規則
– 文の構造と,各単語
の品詞が決定する
規則3 述部=動詞句
規則4 名詞句=名詞
規則5 動詞句=動詞
規則6 動詞句=名詞句+動
詞句
12
どうやる機械翻訳(5)
②構文解析処理:
文
主部
述部
動詞句
名詞句
名詞句
名詞 助詞 名詞
機械 が 文書
助詞
を
動詞句
動詞
翻訳する
13
どうやる機械翻訳(6)
③単語の意味を決める(意味解析処理)
– 語の意味を決める(辞書から選ぶ)
– 文内の語の意味的関係を決める
翻訳する
動作主
対象物
機械
文書
14
どうやる機械翻訳(7)
③意味解析処理(その他)
– 語の意味を決める
(辞書から選ぶ)
例:I translate Japanese into English.
translate
結局~になる
自動詞
翻訳する 他動詞
移動させる 他動詞
– translateの意味は?
...
– translateに格フレーム
を用意して,対応する格の意味を定義する
格の形から自動詞,他動詞
– 名詞から意味を推測
15
どうやる機械翻訳(8)
④構文(構造)変換処理:構文transfer
– 元言語の構文構造をターゲット言語の構造
に構文変換
翻訳する
動作主
対象
機械
文書
translate
subject
object
computer
document
16
どうやる機械翻訳(9)
⑤構文生成処理
解析例: (ここでは単語は基本形)
機械 が 文書 を 翻訳する
名詞 助詞 名詞 助詞 動詞
a computer
冠詞 名詞
単数
translate a document
動詞
冠詞 名詞
現在
単数
17
どうやる機械翻訳(10)
⑥単語の生成(形態素生成処理)
⑤の結果
a computer translate a document
前後のつながり,時制,数などにより単語を変
化させて,訳文を生成する
A computer translates a document
18
どうやる機械翻訳(11)補足
④のその他:構文(構造)変換処理
– 自然な訳文生成のために,主語や目的語を変換
例:The news made me
disappointed.
主語
目的語 (無生物主語)
「そのニュースが私をがっかりさせた」
このままだと日本語にはなじまない
→人間(me)が主語になるように構文を変換する
「私はそのニュースでがっかりした」
19
どうやる機械翻訳(12)補足
⑤のその他:構文生成処理
– 変換した構造から語順を決定する
例:修飾語句は日本語では修飾語・非修飾語だが,英語で
は語によって語順が変わる
• 高価な本→ an expensive book
• 歴史の本→ a book on history
• 私が買った本→ the book which I bought
– (必要ならば)冗長な語を削除する
• I have a book in my hand.
• 私は私の手に本を持っている.(このままでは冗長)
→例:「主語と共通の代名詞を削除する」などする
20
どうやる機械翻訳(13)補足
⑥のその他:形態素生成処理
– 前後のつながり,時制,数などにより単語を変化
させて,訳文を生成する
日本語:前後のつながりで単語を変化させる
私 が 買う た 本 → 私が買った本
英語:名詞の複数変化,動詞の時制変化,形容詞の
比較級などの処理をする
the book
which
I
buy
冠詞 名詞 関係代名詞 代名詞 動詞
単数
目的格
主格 過去
→ the book which I bought
21