検索サイトの話

検索サイトの話
情報社会と情報倫理
1/22/09
検索エンジン(1)


検索機能を提供するシステム
情報の集め方
 ロボット型検索エンジン
 Google,Yahoo
 ディレクトリ型検索エンジン
 Yahoo
検索エンジン(2)


ロボット型検索エンジン
 クローラと呼ばれるプログラムが情報を自動
収集
 内容のチェックがどこまで行われるのか?
[19/Jan/2009:00:28:22 +0900] “GET /robots.txt
HTTP/1.1” 404 208 “-” “Mozilla/5.0 (compatible;
Googlebot/2.1;
ディレクトリ型検索エンジン
+http://www.google.com/bot.html)”


人手で情報を収集
人手で内容をチェック
最近多い広告

WebサイトのURLを明示するのではなく,検索サ
イト経由で誘導する
広告の手法として定着している



SEM - Search Engine Marketing
検索窓付き広告を成功させる3つのポイント
(CNET)
検索窓が生み出した広告とその窓を開く鍵
(IT Pro)
検索結果はどこまで見られるのか(1)


最初のものが,目的のサイトとは限らない
上位に表示されないものは,クリックされない
 どこまでが上位か?
 1ページ目だけ?
 それ以下は,インターネット上に存在しないの
と同じと言われている
検索結果はどこまで見られるのか(2)

上位に表示されるように工夫

SEO - Search Engine Optimization
検索結果は信頼できるのか?(1)

キャンペーンのような一時的サイト
 終了後,どうなるのか?
 ドメインの有効期限後,無関係の者が登録
検索結果は信頼できるのか?(2)



検索方法・結果の表示方法の詳細は公表されな
い
本当に価値があるサイトを上位に,
SEOだけで上位に表示されないようにする
選別基準・表示順の基準は,検索サイト側で決
める
検索結果は信頼できるのか?(3)


しかし,一時的であっても,怪しげなサイトがトッ
プになる可能性
諸事情で,結果に表示されなくなるサイトがある
検索結果は信頼できるのか?(4)


Googleの広告サービスで悪質ソフトを配布
(ITmedia)
Google Newsが起因 - UAL株価急落事件にみる
、ネット情報と効率化の功罪(マイコミ)
 検索サイトだけの問題ではない
 リテラシの問題
検索結果の利用法


当り前の使い方だけではない
Googleを駆使したWeb攻撃が急増――セキュリ
ティ専門家が指摘(Computerworld)
利用者とサイトの利害(1)

利用者
 自分の目的に合致した結果(だけ)が欲しい

広告の価値も高まる(検索サイトの利益)
利用者とサイトの利害(2)

利用者
 検索語の適切な選択


複数語の選択
 AND OR
易しいことではない
利用者とサイトの利害(3)



検索サイト側
利用者の検索行動を記録
 過去に何を知りたがっていたのか分かれば,
今度は何を知りたいのか類推できる
プライバシの問題
 どのような情報を、いつまで残すか
利用者とサイトの利害(4)



Google、ユーザーデータ保持期間を短縮
(ITmedia)
米Yahoo!、90日後にデータを匿名化する新プライ
バシーポリシー
(INTERNET Watch)
MS、「ユーザーデータ保持期間ゼロでは質の高
い検索は提供できない」
(ITmedia)
次 週(予 定)

試験前のまとめ