平成 25 年度自然言語処理定期試験問題

平成 25 年度自然言語処理定期試験問題
配布日:平成 26 年 1 月 27 日(月)1 限
試験時間:60 分(持ち込み不可)
担当:CS 学部 亀田弘之
問題1
文「大きい雲が流れている」を構文解析するプログラムを作りたい。[30 点]。
(ヒント) 大きい(形容詞),雲(名詞),が(助詞)
,流れている(動詞)
(1) 文の構造を分析し,形式文法を書き下せ[10 点]。
(ヒント)開始記号=文,非終端記号 = { 名詞句,動詞,形容詞,名詞,助詞 }
(2) 上記(1)の形式文法をもとに,文法チェックプログラムを作成しなさい[10 点]。
(ヒント Prolog で表現することを試みよ。
)
(3)上記(2)を,構文解析結果を室力できるパーザに拡張しなさい[10 点]。
(【出題意図】1.
言語分析ができ、それに基づき形式文法を自力で定義できる。2. 形式文法に基づきプログラムが書ける。)
問題2 情報検索における TF-IDF 法について答えよ[30 点]。
(1) TF-IDF 法では,
「TF-IDF の値が大きい単語ほど重要である」と考える。TF は用
語(term)の出現頻度であるが,なぜ TF の値が大きいと重要であると言えるのか?[5 点]。
(2) DF は当該用語(term)が各ドキュメント内に出現する頻度であり,IDF はその逆数
である。なぜ IDF の値が大きいと,すなわち,DF の値が小さいと重要であると言えるの
か?[5 点]。
(3) 次のようなデータが得られているとする[20 点]。
文書1:イヌ(3),ネコ(4),トリ(6),ラクダ(3),サル(0)
文書2:イヌ(3),ネコ(2),トリ(6),ラクダ(9),サル(4)
文書3:イヌ(3),ネコ(0),トリ(0),ラクダ(8),サル(2)
文書4:イヌ(3),ネコ(8),トリ(2),ラクダ(4),サル(3)
文書5:イヌ(3),ネコ(4),トリ(3),ラクダ(2),サル(2) [5 点]。
(ア) 文書 1 を特徴づける用語はどれか[10 点]。
(イ) 「イヌ」をキーワード検索した場合,まずどれを検索結果とすべきか。 [10 点]
(【出題意図】1. TF-IDF 法の意味を説明しかつ使用することができる。)
問題3 NLP(自然言語処理)の新しいアプリケーションを1つ提案せよ[20 点]。
ただし、
(A)提案アプリケーションの概要[5 点]、
(B)必要性[5 点]、 (C)利益享受者
[5 点]、および(D)そのアプリケーション実現にために最も重要な要素技術[10 点]
について言及すること。
(【出題意図】1. NLP 技術のアプリケーションを説得力ある形で提案することができる。)
問題4 自然言語処理の用語のうち1つを選び、知るところを 200 文字程度で述べよ[20 点]。
用
語
の
例
(1)自然言語
(5)言語の意味
(2)形態素
(6)感情処理
(3)形態素解析
(7)未知語
(4)構文解析
(8)コーパス
(9)言語処理ツールソフトウェア
(10)人間における言語処理過程
(11)言語表現の曖昧性(ambiguity)
(12)電子化辞書 (13)機械翻訳
(【出題意図】1. NLP に関する用語・概念を自分の言葉で説明することができる。)以 上