スライド

output2:
output1 の結果を受けたWSDの今後について
筑波大学
乾孝司
2014/11/27
• 素性情報の欠如(ex. 事例no.10「教えて下さい」).
⇒ 省略(必須格など)の少ない事例を選択的に使用し,(潜在的な)文内
情報だけでどれだけ解けるかを見極める.
• 単語ごとにモデルを作成.誤り分析の結果,単語ごとにモデルの修正
が可能.効率的な単語毎モデルの構築・修正が追求できると,WSD独
自手法が発展するか.
• 新納先生の「WSDは意味解析のモデル問題」という捉え方に同意.
⇒ 応用ごとに問題レベル or 評価データセットを設定してもよいか.
(c.f. 藤田さんの今回の活動: 機械翻訳とWSD)
• 改善方法に基づく分類の場合(村田先生的な分類),人手で完全な素
性を抽出することで仮想的な実験をおこなうことを考える.性能が高い
場合は,WSDの問題は,素性自動抽出の問題に分割できる.
⇒包括的コーパスの作成.そもそも可能?
※ 乾は,output1 を実施していない.主に中間レポートに基いて検討した.
コメント
• - 項目4(白井さん)
– Q. うまく素性として表現できない情報が結構ありそうです
ね.
– A. なるほど.そうですね.
• - 項目4(白井さん)
– 正しい素性が抽出できたという条件の下での実験は、問
題を切り分けることができるので有意義だと思いま
す。 (ただし実際にやるのは大変そう)
• - 項目4(古宮さん)
– Q. 欲しい情報は人用かモデル用か?
– A. モデル用のつもりです.