卒論中間発表 WWW検索キーワードナビゲーションシステム の設計と実装 栗本亜実 [email protected] 背景 インターネットのWWWは巨大なデータベース ほしい情報をいかに効率的に得るかが重要 情報検索能力に個人差 バックグラウンドの有無 専門分野外の検索をする機会の増加 専門分野外は皆素人 バックグラウンドが活かされない ⇒バックグラウンドのない時の検索が困難 検索要求を検索キーワードに反映することが困難 目的 バックグラウンドのない人の検索を効率化 潜在キーワードを引き出す キーワード案の提示 バックグラウンド 検索技術 ナビゲーション 目的 モデル 検索エンジン側 ナビゲーション キーワード入力 ? ユーザ側 検索エンジンごとに固 有の検索ポリシー -テキストマッチ -キーワード出現頻度 -タグごとの重み付け -要素内での出現位置 -キーワードの近接度 -クリック人気 -リンクポピュラリティー -サイトテーマ 言葉の定義 バックグラウンド…検索する時に活かされるその分野 の基礎知識・経験・全体像 検索キーワード…検索エンジンに入力したキーワード 潜在キーワード…ほしい情報を手に入れるための キーワード キーワード案…潜在キーワードを探し当てるための提 案キーワード 現状 専門検索エンジン シソーラス・関連語辞書の利用 ⇒画一的 コミュニティの特性を活かした検索 ⇒細かい目的に対応しきれない 有益なキーワードを文書から抽出する技術 ⇒検索エンジンのアルゴリズム(日々進化するブ ラックホール)に左右する 要件 検索エンジンから独立したシステム 目的を問わない臨機応変なシステム 複数カテゴリある際には提示 カテゴリ・キーワードのランキング キーワードの頻出度によって提案数を変える ユーザ・ エクスペリメント の外化/蓄積 提案「しぼりこみアシスタント」① 検索エンジンと切り離したシステム 一つの目的をもったグループで経験を共有(キー ワード設定) ⇒目的は問わない 経験のない分野でも、他人の経験を利用して効 率的な検索 ? キーワード キーワード 提案「しぼりこみアシスタント」② 検索結果 キーワード案 ナビゲーションのカテゴリ分け 保存 梅干 アルカリ ナトリウム 海水 「塩 保存」25point 「塩 梅干」13point 「塩 保存 梅干」5point 「塩 アルカリ」20point 「塩 ナトリウム」10point 「塩 アルカリ ナトリウム」7poin 「塩 海水」10point Pointを利用して動的に カテゴリ分けする 動作原理 サーバ キーワード 1 ブラウザ 「塩 しょうゆ」 検索要求 動作原理 サーバ 1 ブラウザ 「塩 しょうゆ」 キーワードと 2 point登録 検索要求 2 動作原理 サーバ 1 ブラウザ 関連キーワード 2 3 「梅干」 検索結果 2 3 動作原理 サーバ 1 4 ブラウザ 検索結果と 関連キーワード 2 3 (ナビゲーション) 2 3 実装 サーバ(servelet) データベース(MySQL) Google API 評価 定量評価 再現率・適合率 検索時間の計測(実験) 検索回数 規模性 スケーラビリティ 定性評価 キーワード案の妥当性 分かりやすさ・使いやすさ・満足度 まとめ バックグラウンドのない分野でのキーワード 検索に注目 絞込みアシスタントの提案 ひとつの検索エンジンに依存しないシステム の実現 多用な目的を持ったグループに対応
© Copyright 2024 ExpyDoc