ことばとコンピュータ

ことばとコンピュータ
2006年度1学期 第11回
本日の内容
• 照応詞が何を指しているか決める
– 共通の処理手順
– 名詞の指示性の推定
– 定名詞の先行詞の推定
– 指示詞・ゼロ代名詞の先行詞の推定
2
一般的な共通の処理手順(1)
1. 基本的な文の構造を明らかにしておく
•
•
•
•
•
•
形態素解析
構文解析 (かかりうけ関係)
「は」のつく名詞...主題や焦点になりやすい
「が」のつく名詞...主題や焦点になりやすい
その他の名詞
用言 といった先行詞になりそうな情報の取得
3
一般的な共通の処理手順(2)
2. 未決定の照応詞の候補を探す
3. 対応する先行詞があるかどうかを決める
照応解析処理に移る
1. 先行詞の候補となりそうなものを列挙
•
主題,焦点,名詞,用言など
2. どれが照応詞に対する先行詞として尤もらしい
かを決定する
•
•
言語理論的な決定打はない
ヒューリスティクスで対応
4
一般的な共通の処理手順(3)
•
ヒューリスティクス(経験的手法)
– 人工知能分野のエキスパートシステムの考え方
– 試行錯誤的な方法
•
照応関係
– 文章中のさまざまな表現が複雑に絡んでいる
– ある種の表現が存在→ある種の先行詞をさす可能性が
高い(経験則:推論規則)
– 1つの照応関係の決定に1つの経験則が適用可能という
ことはまれ→複数の経験則が同時に適用
– 適用する経験則ごとに確からしさを計算(確信度)
5
一般的な共通の処理手順(4)
• 最終的に得点の高い候補を先行詞として決
定する Voting
決定
未決定照応詞
文章
形
態
素
解
析
構 格
文 解
解 析
析
照応詞判定
参照先判定
得
点
化
判
定
指示対象候補
• どんな手がかりや,規則を用いるかは照応詞
のタイプによって違う
6
名詞の指示性の推定(1)
• 文章中の名詞が,既出のものさす場合
• 名詞が何をさしているのかを推定
– なぜ必要か?
例:機械翻訳(日英)
名詞に冠詞 a をつけるか the をつけるか
代名詞化できるかどうか
決定するには,名詞が何をさしているか明らかに
する必要がある
7
名詞の指示性の推定(2)
• 例:
おじいさんは地面に腰をおろしました.
やがておじいさんは眠ってしまいました.
→
The old man sat down on the ground.
He soon fell asleep.
8
名詞の指示性の推定(3)
• 文章中のそれぞれの名詞
– 既に出てきた名詞をさしているかどうかを決める
• 名詞の分類を考えておく
名詞
総称名詞(犬はひとなつっこいです)
非総称名詞 定名詞(その犬はひとなつっこいです)
不定名詞 特定性(犬が三匹います)
不特定性(犬を飼っていますか?)
9
名詞の指示性の推定(4)
• 文章中のそれぞれの名詞
総称名詞:
– 既に出てきた名詞をさしているかどうかを決める
「犬」(類)の要素すべてか,
「犬」(類)自体をさす
• 名詞の分類を考えておく
名詞
総称名詞(犬はひとなつっこいです)
非総称名詞 定名詞(その犬はひとなつっこいです)
不定名詞 特定性(犬が三匹います)
不特定性(犬を飼っていますか?)
10
名詞の指示性の推定(5)
• 文章中のそれぞれの名詞
– 既に出てきた名詞をさしているかどうかを決める
非総称名詞:
• 名詞の分類を考えておく
「犬」(類)の要素の一部をさす
名詞
総称名詞(犬はひとなつっこいです)
非総称名詞 定名詞(その犬はひとなつっこいです)
不定名詞 特定性(犬が三匹います)
不特定性(犬を飼っていますか?)
11
名詞の指示性の推定(6)
• 文章中のそれぞれの名詞
– 既に出てきた名詞をさしているかどうかを決める
定名詞: 指示の対象が確定している
• 名詞の分類を考えておく
不定名詞:指示の対象が確定していない
名詞
総称名詞(犬はひとなつっこいです)
非総称名詞 定名詞(その犬はひとなつっこいです)
不定名詞 特定性(犬が三匹います)
不特定性(犬を飼っていますか?)
12
名詞の指示性の推定(7)
• 文章中のそれぞれの名詞
– 既に出てきた名詞をさしているかどうかを決める
特定性:指示するもの(犬)が実際に存在している
• 名詞の分類を考えておく
不特定性:実際に存在していない
名詞
総称名詞(犬はひとなつっこいです)
非総称名詞 定名詞(その犬はひとなつっこいです)
不定名詞 特定性(犬が三匹います)
不特定性(犬を飼っていますか?)
13
名詞の指示性の推定(8)
•定名詞...
文章中のそれぞれの名詞
– 既に出てきた名詞をさしているかどうかを決める
既に現れているものと照応する可能性がある!
その他(総称名詞,不定名詞)...
• 照応せず,その時,初めて出現したと考えられる
名詞の分類を考えておく
名詞
総称名詞(犬はひとなつっこいです)
非総称名詞
定名詞(その犬はひとなつっこいです)
不定名詞
特定性(犬が三匹います)
不特定性(犬を飼っていますか?)
14
名詞の指示性の推定(9)
• 指示性の手がかりは?
– 名詞自身が「固有名詞」か「普通名詞」か
– 名詞の表層格が「が」などの格助詞か
– 主題の手がかり,「は」などが付いているか
– 述部の品詞,時制は何か
– 修飾節の主部に指示性の語があるか
– 修飾節の述部の時制は何か
– 修飾語句が指示詞かどうか
など
15
名詞の指示性の推定(10)
テーブルの上に土産のみかんがあります.
彼らが昨日摘み取ったみかんは味がいいです.
下線を引いたみかんの指示性を決定する
16
名詞の指示性の推定(11)
彼らが昨日摘み取ったみかんは味がいいです.
彼ら かれら 彼ら 名詞 6 普通名詞 1 * 0 * 0 "代表表記:彼等"
が が が 助詞 9 格助詞 1 * 0 * 0 NIL
昨日 きのう 昨日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:昨日"
摘み取った つみとった 摘み取る 動詞 2 * 0 子音動詞ラ行 10 タ形 8 "代表表記:摘み取る"
みかん みかん みかん 名詞 6 普通名詞 1 * 0 * 0 "代表表記:未完"
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
味 あじ 味 名詞 6 普通名詞 1 * 0 * 0 "漢字読み:訓 代表表記:味"
が が が 助詞 9 格助詞 1 * 0 * 0 NIL
いい いい いい 形容詞 3 * 0 イ形容詞アウオ段 18 基本形 2 "代表表記:いい"
です です です 助動詞 5 * 0 無活用型 26 基本形 2 NIL
. . . 特殊 1 句点 1 * 0 * 0 NIL
EOS
17
名詞の指示性の推定(12)
彼らが昨日摘み取ったみかんは味がいいです.
# S-ID:1 KNP:2006/06/29
テーブルの──┐
上に──┐
土産の──┐
│
みかんが──┤
あります.
EOS
# S-ID:2 KNP:2006/06/29
彼らが──┐
昨日──┤
摘み取った──┐
みかんは──┐
味が──┤
いいです.
EOS
18
名詞の指示性の推定(13)
不定
名詞
性
定名
詞性
総称
名詞
性
助詞「は」がつき,述語が現在形
0
2
3
名詞に係る節の述部が過去形
0
1
0
名詞に係る節に「は」か「が」がついた定名詞がある
0
1
0
名詞に係る節に助詞がついた定名詞がある
0
1
0
名詞に係る節に代名詞がある
0
1
0
助詞「は」がつき,述語が形容詞
0
3
4
普通名詞のとき
1
0
0
19
名詞の指示性の推定(14)
不定
名詞
性
定名
詞性
総称
名詞
性
20
定名詞の先行詞の推定(1)
• 名詞がさしている先行詞の候補
– 対象としている名詞の前後の主題,焦点,
その他の名詞などいろいろありうる
ただし,
– 文章中に既に出ている主題,焦点は話題の
中心を担う
→先行詞になりやすい,と考えられる
21
定名詞の先行詞の推定(2)
• 名詞がさしている先行詞の候補
– 主題は前の文の焦点をさすことが多い
– 焦点は次の文などで主題として参照される
ことが多い
– 互いに密接に関係して,つながりを強めあう
話の中心 となる
1つの文の中のそれぞれの語が話の中心に
なる度合い
主題 > 焦点 > その他の名詞
22
定名詞の先行詞の推定(3)
• 名詞がさしている先行詞の候補
– 主題は前の文の焦点をさすことが多い
– 焦点は次の文などで主題として参照される
ことが多い
– 互いに密接に関係して,つながりを強めあう
話の中心 となる センタリング(centering)
1つの文の中のそれぞれの語が話の中心に
なる度合い
主題 > 焦点 > その他の名詞
23
定名詞の先行詞の推定(4)
• 主題や焦点を見つける
– 「が」や「は」などの助詞をマークとして探す
– 「が」格の指示詞・代名詞・ゼロ代名詞は主
題になりやすい
– 焦点へのなりやすさ:「が」格以外の指示詞・代名
詞・ゼロ代名詞,名詞+「が」「も」「だ」「なら」「こそ」
などの順番
– その他,「を」「に」,句読点などなど
こうした順番にあわせて,手がかりにし,
先行する名詞に重みを与える
24
定名詞の先行詞の推定(5)
主
題
表層表現の例
重
み
ガ格の指示詞・代名詞・ゼロ代名詞
21
(名詞)は/には
20
ガ格以外の指示詞・代名詞・ゼロ代名詞 16
焦
点
•
(名詞)が/も/だ/なら/こそ
15
(名詞)を/に/,/.
14
(名詞)へ/で/から/より
13
25
定名詞の先行詞の推定(6)
• 主題や焦点の特定は難しい
• 特に焦点はより難しい
– 出現の時点では主題になっていないが,次の文
で主題になる可能性の高いもの
– 正確に求めるのは困難
• 簡単な特徴を使って,近似する,以上のこと
はなかなか手立てがない
26
定名詞の先行詞の推定(7)
• 簡単な特徴を使って,近似する,以上のこと
はなかなか手立てがない
• その他
– 対象となっている照応詞と,候補の名詞の距離
– 照応詞である名詞と,先行詞の候補につく修飾
語が一致すると,可能性が高い
などの情報も加えて,複数の情報の積み重ねを
用いて,尤もらしいものを選ぶ
27
定名詞の先行詞の推定(8)
その時おじいさんはあまり遠くない所にある空き地
に火が燃えているのに気がつきました.赤い顔をし
て,鼻の青い,恐ろしい目付きの五六人の男が,火
の周りに立っているのを見ました.
名詞「火」の指示性の推定を行う.
28
火の指示性の推定
不定
名詞
性
定名
詞性
総称
名詞
性
29
定名詞の先行詞の推定(9)
• 前の文の状態を調べる
その時おじいさんはあまり遠くない所にある空き地
に火が燃えているのに気がつきました.
主題:
焦点:
30
定名詞の先行詞の推定(10)
• 名詞「火」についての総合評価
前文での焦点
火と火の距離
指示性の推定
その他の調整
31
定名詞の先行詞の推定(11)
• 精度について
– 要因はさまざま
– 何が効くのか
– どういう組み合わせが有効か
総合的に精度よく推定を行うのは難しい
– こうした方法では8割程度の正答率
• より深い意味解析や知識を用いた推論との統合が
必要
– ただし,文脈解析とこれらの知識の順序関係は不明で,
全体の整合性をとりながら,解析をすることは難しい
32
指示詞の先行詞の推定(1)
• 名詞の先行詞を推定した時と同じような枠組
– 規則数や場合はたくさんに増えるので難易度大
• 指示代名詞の先行詞の候補
– 主題,焦点,その他の名詞
– 前文全体,既出の文章など
– 用言など(事象をさす場合)
– 文章中のものを指示していない...
33
指示詞の先行詞の推定(2)
指示代名詞
コ系
名詞形態
これ(ら),ここ(ら)
こちら,こっち
連体詞形態
この,こんな,こういう,
こうした,こういった,
このような
副詞形態
こう
このように,こんなに,
こんなふうに
ソ系
ア系
ド系
34
指示詞の先行詞の推定(3)
• 先行詞の候補となる主題・焦点の重みや,それらから指示詞
までの距離
• 指示詞の種類による性質の違い
• 「~という○がある.この○は~」,名詞に係る指示詞の場合,
その名詞と同一の名詞が前方に見つかるかどうか
• 指示詞の属性と先行詞の候補の属性の類似度
(「ここ」(場所を表す),候補が「駅」とか)
• 先行詞の候補を指示詞の代わりに入れてみて,意味が通じ
るかどうか.(「この実験」の「この」に候補,「化学反応」を入
れて通じるかどうか,意味的近さはシソーラスなどを利用)
などなど
35
指示詞の先行詞の推定(4)
ドル相場は,米新政権の経済政策に対する
期待の高まりなどから116円台に上昇した.こ
のドル高は,米国と欧州各国との間の政策協
調をぎくしゃくさせている.
「このドル高」のさす内容は?
36
指示詞の先行詞の推定(5)
• 人称代名詞の場合
先行詞は,人間か,擬人化されたもの
候補から,なるべく人間に近いものを探す
– 先行詞の候補となる主題・焦点の重みや,それら
から指示詞までの距離
– 指示詞の人称と先行詞の候補の人称の一致度
– 先行詞の候補の「人間」との意味的な距離
– 会話の場合,話者と調査の間の視点の移動など
の情報
37