スライド

output2:
output1 の結果を受けたWSDの今後について
筑波大学
乾孝司
2014/11/27
• 素性情報の欠如（ex. 事例no.10「教えて下さい」）．
⇒ 省略（必須格など）の少ない事例を選択的に使用し，（潜在的な）文内
情報だけでどれだけ解けるかを見極める．
• 単語ごとにモデルを作成．誤り分析の結果，単語ごとにモデルの修正
が可能．効率的な単語毎モデルの構築・修正が追求できると，WSD独
自手法が発展するか．
• 新納先生の「WSDは意味解析のモデル問題」という捉え方に同意．
⇒ 応用ごとに問題レベル or 評価データセットを設定してもよいか．
（c.f. 藤田さんの今回の活動: 機械翻訳とWSD）
• 改善方法に基づく分類の場合（村田先生的な分類），人手で完全な素
性を抽出することで仮想的な実験をおこなうことを考える．性能が高い
場合は，WSDの問題は，素性自動抽出の問題に分割できる．
⇒包括的コーパスの作成．そもそも可能?
※ 乾は，output1 を実施していない．主に中間レポートに基いて検討した．
コメント
• - 項目4（白井さん）
– Q. うまく素性として表現できない情報が結構ありそうです
ね．
– A. なるほど．そうですね．
• - 項目4(白井さん)
– 正しい素性が抽出できたという条件の下での実験は、問
題を切り分けることができるので有意義だと思いま
す。 (ただし実際にやるのは大変そう)
• - 項目4（古宮さん）
– Q. 欲しい情報は人用かモデル用か?
– A. モデル用のつもりです．

Download Report