ことばとコンピュータ

ことばとコンピュータ
2007年度1学期
第10回
本日の内容
• 照応詞が何をさしているのか決める
• その前に,
– 文脈について
– 照応について
• 照応解析
2
照応詞が何をさしているかを決める
• 文脈が絡む,文脈の解析の1つの分野
• まずは,文脈とは?から
3
文脈とは(1)
• 文脈解析:
– 文と文の関係をとらえることで文章によって表さ
れる概念と事象のつながりを明らかにする
• 文脈とは:
– 文の脈絡,文や語の文章上での論理的な関係な
どの続き具合
– 理解するには,概念,事象間の関係が必要
→これらも含めて文脈ということもいえる
4
文脈とは(2)
• 私たちが伝達したい内容
~空間的,時間的に連続的につながっていたり,
推移があったり,外界の状態をさしたりと,
さまざまな概念,事象が複雑に絡み合っている
↑↓
• 私たちが使える言語
~1次元的,離散的な表現手段.
全ての情報を一度に伝えるのは難しい
5
文脈とは(3)
• 私たちが伝達したい内容
~空間的,時間的に連続的につながっていたり,
推移があったり,外界の状態をさしたりと,
さまざまな概念,事象が複雑に絡み合っている
↑↓
• 私たちが使える言語
~1次元的,離散的な表現手段.
全ての情報を一度に伝えるのは難しい
→適切な文章の形に変えて伝達
6
文脈とは(4)
• 話し手,伝え手
– 適切な文章の形に変えて伝達
– 1文で1つの事柄
– 1文で複数の事柄
– 複数文で1つの事柄
というパターンを使って表現
• 聞き手,受け手
– 文章を解釈し,伝えたい内容を復元
– 文章上の手がかりや自分の知識,外界の状況から判断
– 文と文,語と語,語と概念,概念どうしの対応の理解
→文脈の理解(context understanding)
7
文脈をとらえる研究(1)
• 文脈解析
– 談話構造の理解(首尾一貫性,結束性,新情報・
旧情報)
– 照応,省略,指示の対象を決める
– 文章構造の解析(文間,事象間の論理的関係)
などの研究に関わる
8
談話の構造について
• 一貫性(coherence)と結束性(cohesion)
一貫性:
文章(談話)全体の自然さやまとまりの良さ.
意味,概念的なつながりを指すことば.
例:参考になる本が本屋にあった.
本は赤色で安かった.
それを私は早速買った.
面白かった.
9
一貫性(1)
赤色
参考になる本が本屋にあった.
本は赤色で安かった.
それを私は早速買った.
認識
面白かった.
面白い
本屋
形態
認知
本
認識
あった
場所
動作主
可能化
参考になる
認識
安い
対象
理由
動作主
動作主
動作主
私
動作主
買った
時間
早速
10
一貫性(2)
赤色
本屋
参考になる本が本屋にあった.
本は赤色で安かった.
それを私は早速買った.
面白かった.
形態
認知
本
面白い
事象間の意味的な関係
理由
動作主
動作主
私
いない関係
→文章の背景にあるつながりを示す
可能化
参考になる
安い
対象
動作主
文章中には陽に表現されて
動作主
認識
認識
言葉のさす概念,
認識
あった
場所
動作主
買った
時間
早速
11
談話の構造について
• 一貫性(coherence)と結束性(cohesion)
– 結束性:
文と文,語と語,文と語の表層的なつながり
例:参考になる本が本屋にあった.
本は赤色で安かった.
それを私は早速買った.
面白かった
12
結束性(1)
h-m
本
参考になる本が本屋にあった.
本は赤色で安かった.
それを私は早速買った.
面白かった
s-v
rep.
本屋
あった
h-m{at}
ref.
cj:等位接続 h:主要部
m:修飾要素 s:主語
v:動詞
ref.:参照 rep.:繰り返し
参考にな
る
h-m
赤色
本
h-m
cj{and}
安い
ref.
早速
ref. 私
それ
h-m
h-m
ゼロ
代名詞
買った
h-m
ゼロ
代名詞
ゼロ
代名詞
面白い
h-m
ref.
h-m
13
結束性(2)
h-m
本
参考になる本が本屋にあった.
本は赤色で安かった.
それを私は早速買った.
面白かった
s-v
rep.
本屋
あった
h-m{at}
ref.
cj:等位接続 h:主要部
m:修飾要素 s:主語
v:動詞
ref.:参照 rep.:繰り返し
参考にな
る
h-m
赤色
本
h-m
cj{and}
安い
ref.
早速
ref. 私
それ
h-m
文章上の表層的な関係を示す
h-m
つながりを示す表層的手がかり
ゼロ
代名詞
買った
h-m
ゼロ
代名詞
ゼロ
代名詞
面白い
h-m
ref.
h-m
14
結束性(3)
h-m
本
参考にな
る
参考になる本が本屋にあった.
s-v
rep.
本は赤色で安かった.
本屋
あった
それを私は早速買った.
h-m{at}
結束性は,表層的な関係で処理が可能
面白かった
ref.
h-m
現状では,
cj:等位接続 h:主要部
赤色
本
m:修飾要素 s:主語
cj{and}
h-m
安い
一貫性よりも,コンピュータで処理しやすい
ref.
v:動詞
早速
ref.:参照 rep.:繰り返し
ref. 私
それ
h-m
文章上の表層的な関係を示す
h-m
つながりを示す表層的手がかり
ゼロ
代名詞
買った
h-m
ゼロ
代名詞
ゼロ
代名詞
面白い
h-m
ref.
h-m
15
結束性の分類
• 代名詞+こそあど,指示表現,省略,
代入 (‘a new one’のoneとか’do so’のsoなど)
↑まとめて指示(代名詞,省略,代入)とも言える
• 接続
– 接続詞が出現する前後の文や段落間の関係を
結びつける関係
• 語彙的結束性
– 表層に現われる2つの語の意味的な関係
16
結束性の分類
• 代名詞+こそあど,指示表現,省略,
代入 (‘a new one’のoneとか’do so’のsoなど)
↑まとめて指示照応(代名詞,省略,代入)とも言え
る
照応,語彙的結束性は後ほど扱う
• 接続
– 接続詞が出現する前後の文や段落間の関係を
結びつける関係
• 語彙的結束性
– 表層に現われる2つの語の意味的な関係
17
新情報と旧情報(1)
• 文章:組み立ての基本原則
• 話し手:
– 聞き手が解釈できる文章の構造を作成する必要
がある
• 人間の記憶:
– 直前に話されたものはよく記憶に残っている(短
期記憶)
– この性質が談話の伝達でも使われている.
18
新情報と旧情報(2)
話し手
聞き手
提示―――情報―――意識にのぼる
新情報
初めて聞いたもの
知っていたが思い出したもの
19
新情報と旧情報(3)
話し手
聞き手
提示―――情報―――意識にのぼる
新情報
初めて聞いたもの
知っていたが思い出したもの
提示―新たな情報
20
新情報と旧情報(4)
話し手
聞き手
提示―――情報―――意識にのぼる
新情報
初めて聞いたもの
知っていたが思い出したもの
提示―新たな情報
より豊富な概念 新情報
を伝える
21
新情報と旧情報(5)
話し手
聞き手
提示―――情報―――意識にのぼる
新情報
提示―新たな情報
より豊富な概念 新情報
を伝える
初めて聞いたもの
知っていたが思い出したもの
既に意識に
のぼっていた概念
旧情報になる
22
新情報と旧情報(6)
話し手
聞き手
提示―――情報―――意識にのぼる
新情報
提示―新たな情報
より豊富な概念 新情報
を伝える
初めて聞いたもの
知っていたが思い出したもの
既に意識に
のぼっていた概念
旧情報になる
関係付ける
23
新情報と旧情報(7)
話し手
聞き手
提示―――情報―――意識にのぼる
新情報
提示―新たな情報
より豊富な概念 新情報
を伝える
初めて聞いたもの
知っていたが思い出したもの
既に意識に
のぼっていた概念
旧情報になる
関係付ける
関係を表す情報が含まれている
強調したいこと 焦点 が含まれている(ことが多い)
24
主題と陳述(1)
• また,話の方向を見失わないために...
提示――現在述べていること―
(話の方向を見失わないため)の大まかな流れ
...主題 何について述べられているかを示す
「 我輩 は 猫である」
主題 ~ 我輩について述べられていると理解
「 猫である 」 は述部
陳述 ~ 主題についての説明
焦点を含むことが多い
25
主題と陳述(2)
我輩 は 猫である.
主題
陳述
(旧情報) 新情報
猫 は
主題
旧情報
よく寝る.
陳述
新情報
26
焦点
焦点:
前の文では主題となっていないが,
後の文では主題となる.
新情報―旧情報
主題―焦点
文章で示されている
内容を意味的につなぐ働き.
文章の組み立ての基本的原則
利用すると効率良く内容を伝えられる
27
情報伝達
• 話し手
– 伝えたい内容をまとめる
– 述べる順序を考え、計画を練る
一貫性,結束性
新情報・旧情報,主題焦点 談話構造(を作り)
• 聞き手
文章生成
– 談話構造を解釈(結束性を手がかりに)
– 伝えようとされた一貫性を復元
• 文脈解析
入力文章の結束性を捉え,談話構造を解析
28
照応問題(1)
• 照応・省略の分類
ある表現 が後に現れる 表現 と同じ内容・対象をさす
照応関係
anaphoric relation
29
照応問題(2)
机の上に大きな箱がのっていた.
それは赤い箱だった.
ここで大きな箱は先行詞(antecedent)
それは照応詞(anaphor)
照応詞が現れる前に先行詞が既に現れている照応
→ 前方照応(anaphora)
30
照応問題(3)
机の上にそれは確かにありました.
赤い箱があったのです.
先行詞が照応詞よりも後に現れる照応
→後方照応(cataphora)
31
照応問題(4)
あの猫見て.
どれ?
文章中に照応詞の照応先がないが
外界のあるものを指す
→外界照応(exophora)
32
照応問題(5)
照応現象
外界照応
(exophora)
文脈照応
(endophora)
前方照応
(anaphora)
後方照応
(cataphora)
*外界照応は扱わない.
33
照応問題(6)
僕はその時初めて「ちくわぶ」を知りました.
(ちくわぶは)あまりおいしく感じなかったです.
既に聞き手,読み手の意識にあり,補完が容易な時,
照応詞が省略
→ゼロ代名詞(null-pronoun)(省略)
34
照応問題(7)
太郎は花子に一通の封筒を渡した.
花子はそれを読んだ.
封筒の中身
先行詞が明示的に文章中に該当する表現がない
→間接的照応
(※常識などの知識を使って推論)
35
照応問題(8)
• 照応問題で,現在扱われるのは,
– 前方照応
– 後方照応
– ゼロ代名詞,省略
– (間接照応)
• 扱われていない
– 外界照応
36
照応詞が何を指しているか
一般的な共通の処理手順(1)
1. 基本的な文の構造を明らかにしておく
•
•
•
•
•
•
形態素解析
構文解析 (かかりうけ関係)
「は」のつく名詞...主題や焦点になりやすい
「が」のつく名詞...主題や焦点になりやすい
その他の名詞
用言 といった先行詞になりそうな情報の取得
37
照応詞が何を指しているか
一般的な共通の処理手順(2)
2. 未決定の照応詞の候補を探す
3. 対応する先行詞があるかどうかを決める
照応解析処理に移る
1. 先行詞の候補となりそうなものを列挙
•
主題,焦点,名詞,用言など
2. どれが照応詞に対する先行詞として尤もらしい
かを決定する
•
•
言語理論的な決定打はない
ヒューリスティクスで対応
38
照応詞が何を指しているか
一般的な共通の処理手順(3)
•
ヒューリスティクス(経験的手法)
– 人工知能分野のエキスパートシステムの考え方
– 試行錯誤的な方法
•
照応関係
– 文章中のさまざまな表現が複雑に絡んでいる
– ある種の表現が存在→ある種の先行詞をさす可能性が
高い(経験則:推論規則)
– 1つの照応関係の決定に1つの経験則が適用可能という
ことはまれ→複数の経験則が同時に適用
– 適用する経験則ごとに確からしさを計算(確信度)
39
照応詞が何を指しているか
一般的な共通の処理手順(3)
•
ヒューリスティクス(経験的手法)
– 人工知能分野のエキスパートシステムの考え方
– 試行錯誤的な方法
•
名詞の指示性
センタリング
文章中のさまざまな表現が複雑に絡んでいる
主題・焦点
ある種の表現が存在→ある種の先行詞をさす可能性が
照応関係
–
–
高い(経験則:推論規則)
– 1つの照応関係の決定に1つの経験則が適用可能という
ことはまれ→複数の経験則が同時に適用
– 適用する経験則ごとに確からしさを計算(確信度)
40