意味フレームの実在性 (黒田・中本・野沢) 状況理解の単位としての意味フレームの 実在性に関する研究 1 (F10) 疫病の流行 (F11) 活動への打撃の発生 (F12) 発病 黒田 航 (通信総合研究所) [email protected] 2.2 事例の意味タグづけとデータベース化 中本敬子 (京都大学教育学部) 参考までに意味タグづけの一例を挙げる.「中世ヨー [email protected] ロッパを襲ったペストのような伝染病が大流行してい 野沢 元 (京都大学大学院) る訳ではない。」という事例は,次のような符号化か [email protected] ら<疫病の流行>フレーム (F11) と同定した. LC [中世ヨーロッパ, 意味役割:被害者, 意味ク ラス:地域[+時間への言及あり]]を 1. 研究の目的 FrameNet (Baker, Fillmore and Lowe 1998) で提唱される T [襲った, [voice: active]] RC [ペスト, 意味役割:襲い手, 意味クラス:疫病] 意味フレーム semantic frames を「ヒトが理解可能な のような伝染病が大流行している訳ではな 状況を定義する認知的構造体」として解釈し,この操 い. 作概念の有効性を検証する研究を行った. Frame L1: 疫病の流行 Frame L2: 打撃[-human,-animate,-intentional,-concrete] Frame L3: 自然災害の発生 2. 分析手法 作業手順は以下の通り,(i) コーパスからの事例の収 LC, T, RC は,それぞれ先行文脈 (Left Context),標的 集と,そのデータベース化,(ii) そのデータベースに (Target),後行文脈 (Right Context) のことである.な 基づく人手解析,(iii) 二つの心理実験結果の多変量解 お,文脈は一文内に限っている.フレームのレベルは 析と,その人手解析の比較である. L1-3 の三段階あり,L1 が最下位で,もっとも特定的 である.L1 が F1-F12 までの12個ある.L2 のフレー 2.1 コーパスからの事例の収集 ムは一般性が表現されるように [+/–human, +/–animate, 日英対訳コーパス (内山・井佐原 2003) から<襲う>の ...] によって素性表現されている.L3 は最大規模のグ 用例 {襲う, 襲い, 襲って, ...} をすべて収集し,用例の ループの名称である. 一つ一つに FrameNet の定める方法に準拠して意味タ グづけした.この際,用例が比喩的であるか否かの区 2.3 心理実験結果 別は,意図的に行わなかった.最終的に 416 例のタグ 次に,この人手分析の妥当性を心理実験 (カード分類 づけから12個の最下位意味フレームが同定された.得 課題と意味素性評定課題) の結果を比較し,確かめ られた意味フレームの内訳は以下の通りである: た.両実験で共通に合計36個の刺激文 (1フレームにつ き3例) を使用した.素性評定課題は,被験者は次の15 (F01) グループ間抗争/紛争 (F02) 軍事侵略 (F03) 強盗 項目の素性に関する判断を 1 [まったくそう思わな い]--5 [強くそう思う] の五段階のスケールで評定する よう依頼した: (F04) 虐待 (F05) 強姦 (1) 襲い手は生物である (F06) 動物の他個への攻撃(捕食系) (2) 襲い手は止むを得ず襲いかかった (F07) 動物の他個体への攻撃(非捕食系) (3) 被害は直接感じられる (F08) (地震などの)大規模な異常気象 (4) 襲う相手はあらかじめ決まっていた (F09) (高波などの)小規模な異常気象 (5) 襲い手は気象現象である 意味フレームの実在性 (黒田・中本・野沢) 2 (6) 襲い手は道具を使って被害を与える F10c: エイズがアフリカの国々を襲った (7) 襲い手の存在は感じ取れる F11a: 大型の不況がその国を襲った (8) 被害の規模は個人/個体を越える F11b: 株価の暴落が市場を襲った (9) 襲い手には生命感がある F11c: 狂牛病問題が畜産業界を襲った (10) 襲い手は集団をなしている F12a: 言いようのない不安が彼を襲った (11) 被害の受け手は死ぬこともある F12b: 悪性のガンが働き盛りの彼を襲った (12) 襲い手は目に見える F12c: 突然の痙攣が少女の全身を襲った (13) 被害は意図されたものである (14) 襲い手は人間である ただし,F[i][j] では [i] は最下位フレームIDを,[j] は (15) 襲い手はあらかじめ襲う準備をしていた 刺激セットを表わす指標である. 評定のために被験者に提示した例文は,以下のような 次に第一段階の人手解析と行動指標データの多変量解 ものである. 析の結果がどれほど一致するかどうかを検討した.ク ラスター分析,非計量多次元尺度法 (MDS),主成分分 F01a: 二人組の強盗がその銀行を襲った 析 (PCA) のいずれの多変量解析の方法でも,最下位 F01b: 外国人のグループが現金輸送車を襲った フレームの分離に関して概ね同じ結果が得られてい F01c: 覆面を被った男が銀座の宝石店を襲った る. F02a: 政治的に孤立した国が隣国を襲った F02b: ドイツの戦車部隊がパリを襲った F02c: テロリストの集団がアメリカ軍基地を襲った F03a: 二人の組員が敵対する組長を襲った F03b: 暴徒と化した民衆が警察隊を襲った F03c: 森の西側の部族が北側の部族を襲った F04a: 通り魔がその小学生を襲った F04b: 5, 6人の少年たちが公園にいた浮浪者を襲った 4. 結論 以上のことから次のことが強く示唆される.(1) 意味 フレームは心理的に実在し,(2) その同定の目的のた めに意味素性評定課題は有効な手法である.特に,ク ラスター分類の下位構造は上位構造よりも安定してお り,カード分類の課題依存性を考えると,意味素性評 定課題の結果の課題中立性は.意味フレームの同定と F04c: 23歳の男性が通行人を次々と襲った いう目的には好ましいと考えられる.また,多変量解 F05a: ストーカーがその女性を襲った 析の結果とコーパスに基づく人手解析と一致が高いこ F05b: 無職の男が一人暮らしの若いOLを襲った とから,(3) 意味フレームは,コーパスなどの言語 F05c: 店長がアルバイトの女子店員を襲った データの人手分析からも同定可能であり,FrameNet F06a: サメが傷ついたイルカを襲った は到達可能なゴールを目指している.(4) 以上のこと F06b: ライオンがインパラの群れを襲った から,FrameNet の成果は今後,言語学のみならず, F06c: ハイエナの群れが国立公園の監視員を襲った 状況理解の単位の体系的・網羅的記述という作業を通 F07a: スズメバチの大群が子供たちを襲った じて,認知科学全体へ重要な研究資源を提供する可能 F07b: イノシシがキノコ狩りに来ていた男性を襲った 性が大きいことが示唆される. F07c: 毒蛇が近づいてきた登山客を襲った F08a: 大洪水が東海地方を襲った F08b: 大型台風が日本列島を襲った 参照文献 F08c: 直下型地震が神戸の町を襲った Baker, Collin F., Charles J. Fillmore, and John B. Lowe. 1998. The Berkeley FrameNet project. In Proceedings of the ACL/COLING-1998, Montreal, Canada. F09a: 突風がテレビのリポーターを襲った F09b: 土砂崩れが民家を襲った F09c: 鉄砲水が避難する住民を襲った 内山将夫・井佐原均. 2003. 日英新聞記事および文を対 F10a: 悪性のインフルエンザがわが国を襲った 応付けるための高信頼性尺度. 自然言語処理, 10 (4): F10b: ペストがその町を襲った 201--220.
© Copyright 2024 ExpyDoc