検索エンジンごとに固有の検索ポリシー

卒論中間発表
WWW検索キーワードナビゲーションシステム
の設計と実装
栗本亜実
[email protected]
背景
インターネットのWWWは巨大なデータベース
ほしい情報をいかに効率的に得るかが重要

情報検索能力に個人差
 バックグラウンドの有無
専門分野外の検索をする機会の増加

専門分野外は皆素人
 バックグラウンドが活かされない
⇒バックグラウンドのない時の検索が困難
検索要求を検索キーワードに反映することが困難
目的
バックグラウンドのない人の検索を効率化


潜在キーワードを引き出す
キーワード案の提示
バックグラウンド
検索技術
ナビゲーション
目的
モデル
検索エンジン側
ナビゲーション
キーワード入力
?
ユーザ側
検索エンジンごとに固
有の検索ポリシー
-テキストマッチ
-キーワード出現頻度
-タグごとの重み付け
-要素内での出現位置
-キーワードの近接度
-クリック人気
-リンクポピュラリティー
-サイトテーマ
言葉の定義
バックグラウンド…検索する時に活かされるその分野
の基礎知識・経験・全体像
検索キーワード…検索エンジンに入力したキーワード
潜在キーワード…ほしい情報を手に入れるための
キーワード
キーワード案…潜在キーワードを探し当てるための提
案キーワード
現状
専門検索エンジン
シソーラス・関連語辞書の利用
⇒画一的
コミュニティの特性を活かした検索
⇒細かい目的に対応しきれない
有益なキーワードを文書から抽出する技術
⇒検索エンジンのアルゴリズム(日々進化するブ
ラックホール)に左右する
要件
検索エンジンから独立したシステム
目的を問わない臨機応変なシステム



複数カテゴリある際には提示
カテゴリ・キーワードのランキング
キーワードの頻出度によって提案数を変える
ユーザ・
エクスペリメント
の外化/蓄積
提案「しぼりこみアシスタント」①
検索エンジンと切り離したシステム
一つの目的をもったグループで経験を共有(キー
ワード設定)
⇒目的は問わない
経験のない分野でも、他人の経験を利用して効
率的な検索
?
キーワード
キーワード
提案「しぼりこみアシスタント」②
検索結果
キーワード案
ナビゲーションのカテゴリ分け
保存
梅干
アルカリ
ナトリウム
海水
「塩 保存」25point
「塩 梅干」13point
「塩 保存 梅干」5point
「塩 アルカリ」20point
「塩 ナトリウム」10point
「塩 アルカリ ナトリウム」7poin
「塩 海水」10point
Pointを利用して動的に
カテゴリ分けする
動作原理
サーバ
キーワード
1
ブラウザ
「塩 しょうゆ」
検索要求
動作原理
サーバ
1
ブラウザ
「塩 しょうゆ」
キーワードと 2
point登録
検索要求
2
動作原理
サーバ
1
ブラウザ
関連キーワード 2 3
「梅干」
検索結果
2
3
動作原理
サーバ
1
4
ブラウザ
検索結果と
関連キーワード 2 3
(ナビゲーション)
2
3
実装
サーバ(servelet)
データベース(MySQL)
Google API
評価
定量評価




再現率・適合率
検索時間の計測(実験)
検索回数
規模性 スケーラビリティ
定性評価


キーワード案の妥当性
分かりやすさ・使いやすさ・満足度
まとめ
バックグラウンドのない分野でのキーワード
検索に注目
絞込みアシスタントの提案
ひとつの検索エンジンに依存しないシステム
の実現
多用な目的を持ったグループに対応