PowerPoint プレゼンテーション

意味・談話解析勉強会
チュートリアル
小町守
これまでの研究の目的
ちょっと彼に
連絡伝えてく
れない?
なにを連絡
すればよい
でしょうか?
連絡(する) [ ガ:【聞き手】, ヲ:【外界】, ニ:彼 ]
文内でどのような事態が表されているのかよ
り詳しく解析したい
意味・談話解析勉強会
形態素解析
Chasen
Yamcha
構文解析
意味解析
談話解析
CJE勉強会
Cabocha
意味・談話解析
勉強会
自然言語理解に必要な要素技術
動作性名詞の項構造解析の研究背景
述語項構造解析
意味役割付与: CoNLL 共通タスク [2004, 2005]
He wouldn’t accept anything of value from those he was
writing about.
[A0 He] [AM-MOD would] [AM-NEG n’t] [V accept] [A1
anything of value] from [A2 those he was writing about] .
V: verb; A0: acceptor; A1: thing accepted; A2: acceptedfrom; A3: attribute; AM-MOD: modal; AM-NEG: negation
動作性名詞の項構造解析
ヲ
ガ
【外界】
リスク管理の必要性が強く叫ばれているが、市場
ヲ
の実態が把握できていないため打つ手がないの
が実情。BISが昨年春から調査の手法について検
討していた。
ガ
管理(する) [ ガ:【外界】, ヲ:リスク ]
調査(する) [ ガ:BIS, ヲ:実態 ]
動作性名詞の項構造解析の問題設定
1階の入り口のところの電話で電話をかけた。
電話 <電話機>
電話(する) [ ガ:【話し手】, ニ:【外界】 ]
動作性名詞: 動詞由来の名詞, サ変名詞
1. 事態性判別
動作性名詞の用例に事態性があるかどうか判別
2. (狭義の)動作性名詞の項構造解析
事態性のある動作性名詞の項構造を決定し、項を同定
目次
 はじめに
動作性名詞の項構造解析の問題設定
 予備実験コーパスの作成
 動作性名詞の項構造解析へのアプローチ
事態性判定実験
動作性名詞のヲ格同定実験
 関連研究
 まとめ
 今後の予定
予備実験コーパスの作成
新聞記事(京大コーパス)に事態性や照応の
タグをつけたコーパスを作成中 (仕様は
http://cl.naist.jp/~ryu-i/coreference_tag.html)
事態を表現する名詞にタグ付与
事態性がある場合、項(格要素)が記事中に
あれば該当する名詞にタグ付与、なければ
【外界】タグ付与
全部で約780記事(約6,500文)タグづけ済み
※文間: 文内には出現しないが同一記事中にある
作業者間のタグの一致率
作業者1のみ
作業者2のみ
指示先不一致
タグ一致
ガ
3
4
138
604
ヲ
15
54
30
280
ニ
13
9
5
43
2名の作業者がタグ付与した140記事
 事態性判別と動作性名詞の項構造解析という問題
設定が適切であるかどうか調査
指示先不一致: 事態性タグを付与した動作性名詞と項構造
は一致したが格要素の指示先が不一致
タグ一致: 2名の作業者間で事態性タグを付与した動作性名
詞と格要素がいずれも一致
作業者間のタグの一致率
作業者1のみ
作業者2のみ
指示先不一致
タグ一致
ガ
3
4
138
604
ヲ
15
54
30
280
ニ
13
9
5
43
2名の作業者がタグ付与した140記事
 事態性判別はほとんど揺れなくタグ付与可能
 項同定のためにはタグの仕様を再検討する必要
 ヲ格・ニ格は項構造の選択が難しい
動作性名詞の項構造解析へのアプローチ
モノ
①語の意味クラスの分類問題
出現文脈の情報を使って解く
②文内の項の同定
文構造の情報を
使って解く
名詞
文内
コト
事態性判別
③文内に項の候補が見つからな
かった場合は文外に探しに行く
文間
外界
一人称
二人称
不定
事態性判別の方針
出現用例獲得
…に対する説得工作は失敗に…
辞書
名詞
名詞
リスト
リスト
大量に用意可能
…横にある椅子の取っ手を…
…に対する説得工作は失敗に…
新聞
記事
…横にある椅子の取っ手を…
大量のデータから文構造を教師なし学習
動作性名詞の出現パターンの学習
・・・
説得
交渉
・・・
事態性あり
・・・
椅子
机
・・・
事態性なし
文節内
…説得工作は失敗に…
サ変
サ変
正例
後文脈
…椅子の取っ手を…
負例
の
一般名詞
 用例中の名詞の出現パターンを木構造に変換し、
BACT [Kudo and Matsumoto, 2004] で学習
 学習した木構造が出現パターンのルールに相当
事態性判別実験
方法: SVM を用いて動作性名詞の事態性を
判別(10分割交差検定)
使った素性
意味的な素性
動作性名詞の意味クラス
• 分類語彙表中での分類項目の上位4桁
統語的な素性
動作性名詞の周辺に項になりそうな名詞があるかどうか
• EDR の動詞共起パターン副辞書
BACT で獲得した動作性名詞の出現パターン
事態性判別実験結果
精度
再現率
名詞の出現パターンなし 72.3% 58.7%
73.3% 80.2%
提案手法
新聞記事の事態性判別
 精度=事態性があると分類された動作性名詞のうち正解
 再現率=動作性名詞のうち事態性を正しく判定できた率
 新聞記事80記事(800文)
 動作性名詞1,237個(うち590個が事態性ありの事例)
事態性判別実験エラー分析
項が文外に存在
[ ガ:外界, ヲ:外界 ]
今年の三が日には、お雑煮を食べたらすぐに、のび
のびになっている受賞後第一作の執筆に取りかか
りたい。
周辺文脈が一般名詞のルールにマッチ
「野良黒山の会」のリーダー、木場将弘さん方では、
妻の和枝さんらが現地と電話のやりとりを続けた。
動作性名詞の項構造解析へのアプローチ
モノ
名詞
文内
コト
項構造解析
文間
外界
一人称
二人称
不定
事態性を持つ動作性名詞の項の分布
ガ
ヲ
ニ
文内(同一文節/前文節) 文外(記事内/記事外)
284(18/97)
306(139/167)
235(119/69)
46(44/2)
34(4/13)
6(6/0)
新聞記事80記事(800文)
 ヲ格は文内(かつ動作性名詞から近い場所)に分布
 ガ格は文内・文間・外界に広く分布
 ニ格は絶対数が少ない
ヲ格の項の同定実験
 対象: 文内にヲ格の項がある文
 目的: 動詞の項構造解析モデル [飯田ら, 2006] が
動作性名詞に対しても有効か調査
 使った素性
文の構造情報
ヲ格を持つ動作性名詞の語彙・統語情報
ヲ格候補の語彙・統語・意味・位置情報
ヲ格を持つ動作性名詞とヲ格候補の対の情報
 新聞記事の共起情報から計算した相互情報量
 動作性名詞とヲ格候補の対の距離
ヲ格の項の同定実験結果
精
度
文内に関しては動詞と同じ
モデルでもそこそこ解ける
 評価事例
再現率
新聞記事80記事中文内にヲ格がある動作性名詞235個
関連研究
動作性名詞の項構造解析のコーパス
NomBank [Meyers et al, 2004]
PropBank [Palmer et al, 2005] に従ってタグづけ
文内の項に限定
名詞句の関係解析
名詞の格フレーム辞書の構築 [笹野ら, 2005]
より一般的な枠組み
事態性判別問題を扱っていない
まとめ
動作性名詞の項構造解析のためのコーパス
を作成した
名詞の出現パターンを用いた事態性判別手
法を提案した
精度73.3%・再現率80.2%
動詞の項構造解析モデルを用い、動作性名
詞の文内のヲ格の項同定実験を行った
精度81.9%・再現率81.5%
名詞句の関係解析の研究背景
車を止めてアイドリング状態でエアコンを入れた場合車は大丈夫か?
【話し手】
事態関係
アイドリング(する) [ガ:【話し手】]
動作性名詞の項構造解析だけでは不十分
意見情報抽出・質問応答システムなどには
もっと詳しい情報が必要
名詞句の関係解析
車を止めてアイドリング状態でエアコンを入れた場合車は大丈夫か?
【話し手】
所有関係
【話し手】 [所有:車]
事態関係
アイドリング(する) [ガ:【話し手】]
部分全体関係
エアコン [部分全体:車]
事態関係だけでなく名詞句間のさまざまな関
係を解析対象に
ドメインやタスクに応じた関係解析
名詞句の関係解析の問題設定
車を止めてアイドリング状態でエアコンを入れた場合車は大丈夫か?
【話し手】
所有関係
【話し手】 [所有:車]
事態関係
アイドリング(する) [ガ:【話し手】]
部分全体関係
エアコン [部分全体:車]
1. 関係性判別
名詞句の用例に関係性があるかどうか判別
2. (狭義の)名詞句の関係解析
関係性のある名詞句について関係構造を決定し、
関係名詞を同定
予備実験コーパスの作成目的
名詞句の関係解析のタグ仕様策定
どの関係が解析可能か
ドメインやタスクによって必要となる関係の違い
動作性名詞の事態性判別と同様の手法が適
用可能か解析実験
予備実験コーパスの作成
車ドメインの会話データに名詞句の関係解析
用のタグをつけたコーパスを作成中(仕様は
http://cl.naist.jp/~mamoru-k/wiki/)
関係を表現する名詞句にタグ付け
関係がある場合、関係する名詞句がどの関
係にあるのか、どの名詞句が関係しているの
かタグ付け
全部で1,070会話(2,858文)がタグ付け対象
関連研究
名詞句の関係の言語学的分析 [寺村, 1991]
計算機による名詞句の関係解析
ルールベースの解析 [島津ら, 1986]
格フレーム辞書を用いた解析 [笹野ら, 2005]
ドメインを限定した解析
MUC: Message Understanding Conference [90年代]
ACE: Automatic Content Extraction [1999-]
今後の予定
動作性名詞の項構造解析から名詞句の関係
解析へ
名詞句の関係解析のためのタグ仕様策定
意味・談話解析勉強会