平成 25 年度自然言語処理定期試験問題 配布日:平成 26 年 1 月 27 日(月)1 限 試験時間:60 分(持ち込み不可) 担当:CS 学部 亀田弘之 問題1 文「大きい雲が流れている」を構文解析するプログラムを作りたい。[30 点]。 (ヒント) 大きい(形容詞),雲(名詞),が(助詞) ,流れている(動詞) (1) 文の構造を分析し,形式文法を書き下せ[10 点]。 (ヒント)開始記号=文,非終端記号 = { 名詞句,動詞,形容詞,名詞,助詞 } (2) 上記(1)の形式文法をもとに,文法チェックプログラムを作成しなさい[10 点]。 (ヒント Prolog で表現することを試みよ。 ) (3)上記(2)を,構文解析結果を室力できるパーザに拡張しなさい[10 点]。 (【出題意図】1. 言語分析ができ、それに基づき形式文法を自力で定義できる。2. 形式文法に基づきプログラムが書ける。) 問題2 情報検索における TF-IDF 法について答えよ[30 点]。 (1) TF-IDF 法では, 「TF-IDF の値が大きい単語ほど重要である」と考える。TF は用 語(term)の出現頻度であるが,なぜ TF の値が大きいと重要であると言えるのか?[5 点]。 (2) DF は当該用語(term)が各ドキュメント内に出現する頻度であり,IDF はその逆数 である。なぜ IDF の値が大きいと,すなわち,DF の値が小さいと重要であると言えるの か?[5 点]。 (3) 次のようなデータが得られているとする[20 点]。 文書1:イヌ(3),ネコ(4),トリ(6),ラクダ(3),サル(0) 文書2:イヌ(3),ネコ(2),トリ(6),ラクダ(9),サル(4) 文書3:イヌ(3),ネコ(0),トリ(0),ラクダ(8),サル(2) 文書4:イヌ(3),ネコ(8),トリ(2),ラクダ(4),サル(3) 文書5:イヌ(3),ネコ(4),トリ(3),ラクダ(2),サル(2) [5 点]。 (ア) 文書 1 を特徴づける用語はどれか[10 点]。 (イ) 「イヌ」をキーワード検索した場合,まずどれを検索結果とすべきか。 [10 点] (【出題意図】1. TF-IDF 法の意味を説明しかつ使用することができる。) 問題3 NLP(自然言語処理)の新しいアプリケーションを1つ提案せよ[20 点]。 ただし、 (A)提案アプリケーションの概要[5 点]、 (B)必要性[5 点]、 (C)利益享受者 [5 点]、および(D)そのアプリケーション実現にために最も重要な要素技術[10 点] について言及すること。 (【出題意図】1. NLP 技術のアプリケーションを説得力ある形で提案することができる。) 問題4 自然言語処理の用語のうち1つを選び、知るところを 200 文字程度で述べよ[20 点]。 用 語 の 例 (1)自然言語 (5)言語の意味 (2)形態素 (6)感情処理 (3)形態素解析 (7)未知語 (4)構文解析 (8)コーパス (9)言語処理ツールソフトウェア (10)人間における言語処理過程 (11)言語表現の曖昧性(ambiguity) (12)電子化辞書 (13)機械翻訳 (【出題意図】1. NLP に関する用語・概念を自分の言葉で説明することができる。)以 上
© Copyright 2024 ExpyDoc