質問の拡張

質問の拡張
• 質問語の追加
• 関連性フィードバック
目的
 全く別の意図
検索結果を見て満足し、初期の意図は達成。
次に全く異なる意図の質問に切り替わる場合
 意図の更新
検索結果に一応の満足は得たが、結果を見て少し
異なる視点からさらに検索を続けたくなった場合
 元の意図に沿うように
検索結果に満足できなかったので、
元々の意図を達成するために質問を変える場合
質問語の追加
•
•
•
•
•
•
•
質問者が与えた質問のインデックス語をシステム側で増強してしまう
方法
「Windows 」という質問を考えてみよう。シソーラスは次のもの
IT 技術
パソコン
ワークステーション
PC/AT
OS
Linux
Windows
Windows98
WindowsNT
• 一般的な質問にしたければ上位の「OS]や「パソコン」を加え、より特
殊な質問にしたければ下位の 「Windows98 」 「WindowsNT」
を加える
関連性フィードバック、あるいは適合性フィードバック
• Relevance Feedback
• 第i 回めの質問 qi の結果、N+個の質問に適合した文書と、N-個の
不適合な文書が得られたとする。適合性の判定はひとまず質問者が
行なうとしておく。このとき、第i +1 回めの質問 qi+1 を次式によっ
て作る
q
i1
N

 q   D j    D j
j1
j1
i
N
•
•
Dj+適合文書j のインデックス, Dj- 不適合文書j のインデックス
α=1、β=1 をIdeの式という
•
1
1
α= N  、β= N  をRoccioの式という
•
q
i1
N
 q   D j  D1j
i
j1
をIde dec-hi の式という
Pesudo Relevance Feedback
•
大量に検索結果があれば、適合文書を判定することも難しい。そこ
で、人手による適合性の判定をやめて、最上位にランクされた文書
を正解として、その文書だけのフィードバックをかける