言語体系とコンピュータ

言語体系とコンピュータ
2006年度2学期
第12回
本日の内容
• 照応詞が何を指しているか決める
– 共通の処理手順
– 名詞の指示性の推定
– 定名詞の先行詞の推定
– 指示詞・ゼロ代名詞の先行詞の推定
2
定名詞の先行詞の推定(1)
• 名詞がさしている先行詞の候補
– 対象としている名詞の前後の主題,焦点,
その他の名詞などいろいろありうる
ただし,
– 文章中に既に出ている主題,焦点は話題の
中心を担う
→先行詞になりやすい,と考えられる
3
定名詞の先行詞の推定(2)
• 名詞がさしている先行詞の候補
– 主題は前の文の焦点をさすことが多い
– 焦点は次の文などで主題として参照される
ことが多い
– 互いに密接に関係して,つながりを強めあう
話の中心 となる
1つの文の中のそれぞれの語が話の中心に
なる度合い
主題 > 焦点 > その他の名詞
4
定名詞の先行詞の推定(3)
• 名詞がさしている先行詞の候補
– 主題は前の文の焦点をさすことが多い
– 焦点は次の文などで主題として参照される
ことが多い
– 互いに密接に関係して,つながりを強めあう
話の中心 となる センタリング(centering)
1つの文の中のそれぞれの語が話の中心に
なる度合い
主題 > 焦点 > その他の名詞
5
定名詞の先行詞の推定(4)
• 主題や焦点を見つける
– 「が」や「は」などの助詞をマークとして探す
– 「が」格の指示詞・代名詞・ゼロ代名詞は主
題になりやすい
– 焦点へのなりやすさ:「が」格以外の指示詞・代名
詞・ゼロ代名詞,名詞+「が」「も」「だ」「なら」「こそ」
などの順番
– その他,「を」「に」,句読点などなど
こうした順番にあわせて,手がかりにし,
先行する名詞に重みを与える
6
定名詞の先行詞の推定(5)
主
題
表層表現の例
重
み
ガ格の指示詞・代名詞・ゼロ代名詞
21
(名詞)は/には
20
ガ格以外の指示詞・代名詞・ゼロ代名詞 16
焦
点
•
(名詞)が/も/だ/なら/こそ
15
(名詞)を/に/,/.
14
(名詞)へ/で/から/より
13
7
定名詞の先行詞の推定(6)
• 主題や焦点の特定は難しい
• 特に焦点はより難しい
– 出現の時点では主題になっていないが,次の文
で主題になる可能性の高いもの
– 正確に求めるのは困難
• 簡単な特徴を使って,近似する,以上のこと
はなかなか手立てがない
8
定名詞の先行詞の推定(7)
• 簡単な特徴を使って,近似する,以上のこと
はなかなか手立てがない
• その他
– 対象となっている照応詞と,候補の名詞の距離
– 照応詞である名詞と,先行詞の候補につく修飾
語が一致すると,可能性が高い
などの情報も加えて,複数の情報の積み重ねを
用いて,尤もらしいものを選ぶ
9
定名詞の先行詞の推定(8)
その時おじいさんはあまり遠くない所にある空き地
に火が燃えているのに気がつきました.赤い顔をし
て,鼻の青い,恐ろしい目付きの五六人の男が,火
の周りに立っているのを見ました.
名詞「火」の指示性の推定を行う.
10
火の指示性の推定
不定
名詞
性
定名
詞性
総称
名詞
性
11
定名詞の先行詞の推定(9)
• 前の文の状態を調べる
その時おじいさんはあまり遠くない所にある空き地
に火が燃えているのに気がつきました.
主題:
焦点:
12
定名詞の先行詞の推定(10)
• 名詞「火」についての総合評価
前文での焦点
火と火の距離
指示性の推定
その他の調整
13
定名詞の先行詞の推定(11)
• 精度について
– 要因はさまざま
– 何が効くのか
– どういう組み合わせが有効か
総合的に精度よく推定を行うのは難しい
– こうした方法では8割程度の正答率
• より深い意味解析や知識を用いた推論との統合が
必要
– ただし,文脈解析とこれらの知識の順序関係は不明で,
全体の整合性をとりながら,解析をすることは難しい
14
指示詞の先行詞の推定(1)
• 名詞の先行詞を推定した時と同じような枠組
– 規則数や場合はたくさんに増えるので難易度大
• 指示代名詞の先行詞の候補
– 主題,焦点,その他の名詞
– 前文全体,既出の文章など
– 用言など(事象をさす場合)
– 文章中のものを指示していない(外界照応)
15
指示詞の先行詞の推定(2)
指示代名詞
コ系
名詞形態
これ(ら),ここ(ら)
こちら,こっち
連体詞形態
この,こんな,こういう,
こうした,こういった,
このような
副詞形態
こう
このように,こんなに,
こんなふうに
ソ系
ア系
ド系
16
指示詞の先行詞の推定(3)
1.
2.
3.
4.
先行詞の候補となる主題・焦点の重みや,それらから指示
詞までの距離
指示詞の種類による性質の違い
「~という○がある.この○は~」,名詞に係る指示詞の場
合,その名詞と同一の名詞が前方に見つかるかどうか
指示詞の属性と先行詞の候補の属性の類似度
(「ここ」(場所を表す),候補が「駅」とか)
先行詞の候補を指示詞の代わりに入れてみて,意味が通
じるかどうか.(「この実験」の「この」に候補,「化学反応」
+「の」を入れて通じるかどうか,意味的近さはシソーラス
などを利用)
などなど
5.
17
指示詞の先行詞の推定(4)
ドル相場は,米新政権の経済政策に対する
期待の高まりなどから116円台に上昇した.こ
のドル高は,米国と欧州各国との間の政策協
調をぎくしゃくさせている.
「このドル高」のさす内容は?
18
指示詞の先行詞の推定(5)
ドル相場は,米新政権の経済政策に対する期待
の高まりなどから116円台に上昇した.
このドル高は,米国と欧州各国との間の政策協調
をぎくしゃくさせている.
1. 「このドル高」の先行詞候補を計算
– 前の文の主題→
– 前の文の焦点→
– その他の名詞→
– 用言→
前文全体,先行詞なし
19
指示詞の先行詞の推定(6)
ドル相場は,米新政権の経済政策に対する期待
の高まりなどから116円台に上昇した.
このドル高は,米国と欧州各国との間の政策協調
をぎくしゃくさせている.
2. 先行詞候補の重みを計算し,順序付け
– 前の文の主題→
– 前の文の焦点→
– その他の名詞→
– 用言→
前文全体,先行詞なし
20
指示詞の先行詞の推定(7)
ドル相場は,米新政権の経済政策に対する期待
の高まりなどから116円台に上昇した.
このドル高は,米国と欧州各国との間の政策協調
をぎくしゃくさせている.
3. 指示詞の場所に,各候補を置き換えてチェック
– 前の文の主題→
– 前の文の焦点→
– その他の名詞→
– 用言→
前文全体,先行詞なし
21
指示詞の先行詞の推定(8)
• 人称代名詞の場合
先行詞は,人間か,擬人化されたもの
候補から,なるべく人間に近いものを探す
– 先行詞の候補となる主題・焦点の重みや,それら
から指示詞までの距離
– 指示詞の人称と先行詞の候補の人称の一致度
– 先行詞の候補の「人間」との意味的な距離
– 会話の場合,話者と調査の間の視点の移動など
の情報
22
指示詞の先行詞の推定(9)
• 人称代名詞の場合 (易)
太郎は次郎と一緒に花子の新居を訪ねた.
彼女は最近この町に引っ越してきた.
– 「彼女」の先行詞の候補
→
– 先行詞の尤もらしさをチェック
23
指示詞の先行詞の推定(10)
• 人称代名詞の場合 (やや難)
太郎は次郎と一緒に花子の新居を訪ねた.
彼も最近この町に引っ越してきた.
– 「彼」の先行詞の候補
→
– 先行詞の尤もらしさをチェック
24
指示詞の先行詞の推定(11)
• 人称代名詞の場合 (難)
太郎は次郎と一緒に三郎の家を訪ねた.
彼は最近この町に引っ越してきた.
– 「彼」の先行詞の候補
→
– 先行詞の尤もらしさをチェック
25
指示詞の先行詞の推定(12)
• ゼロ代名詞
– どこが省略されているかを見つける
おじいさんは地面に腰をおろしました.
やがて眠ってしまいました.
→省略(ゼロ代名詞)は?
用言に注目して格要素を元に考えるのが一般的
26
指示詞の先行詞の推定(13)
• ゼロ代名詞
– 省略(ゼロ代名詞)要素の先行詞は?
• 視点表現:「やる」「くれる」→前の文の主格が行為者
になりやすい
• 知覚動詞:「思う」「欲しい」→一人称が多い
• 様相表現:「だろう」「ようだ」「そうだ」→一人称になりに
くい
27
指示詞の先行詞の推定(14)
•
ゼロ代名詞
用言の意味などを用いると解決しやすい例:
S社は超小型PCを開発.高性能CPUを搭載し,
8月に出荷予定.
「ので」は「は」なら主格が一致,「が」なら一致せず
彼は風邪をひいたので,会社を休んだ.
彼が風邪をひいたので,会社を休んだ.
28
指示詞の先行詞の推定(15)
• 文章の表層上のてがかりを駆使
• 動詞と格の関係
• 名詞と他の名詞との関係,似たような表現
• 聞き手の頭の中にある旧情報との関連
などなど
→文章中の各語がどの語とどのような関係
で結びつくかをすべて考える必要あり
29