いくつかの話題

いくつかの話題
情報社会と情報倫理
第14回
検索サイト
検索エンジン(1)


検索機能を提供するシステム
情報の集め方
 ロボット型検索エンジン
 Google,Yahoo
 ディレクトリ型検索エンジン
 Yahoo
検索エンジン(2)


ロボット型検索エンジン
 クローラと呼ばれるプログラムが情報を自動
収集
 内容のチェックがどこまで行われるのか?
[19/Jan/2009:00:28:22 +0900] “GET /robots.txt
HTTP/1.1” 404 208 “-” “Mozilla/5.0 (compatible;
Googlebot/2.1;
ディレクトリ型検索エンジン
+http://www.google.com/bot.html)”


人手で情報を収集
人手で内容をチェック
最近多い広告

WebサイトのURLを明示するのではなく,検索サ
イト経由で誘導する
広告の手法として定着している



SEM - Search Engine Marketing
検索窓付き広告を成功させる3つのポイント
(CNET)
検索窓が生み出した広告とその窓を開く鍵
(IT Pro)
検索結果はどこまで見られるのか(1)


最初のものが,目的のサイトとは限らない
上位に表示されないものは,クリックされない
 どこまでが上位か?
 1ページ目だけ?
 それ以下は,インターネット上に存在しないの
と同じと言われている
検索結果はどこまで見られるのか(2)

検索結果の上位に表示されるようにサイトに工
夫

SEO - Search Engine Optimization

やり過ぎると,表示されなくなる危険
検索結果は信頼できるのか?(1)



検索方法・結果の表示方法の詳細は公表されな
い
本当に価値があるサイトを上位に,
SEOだけで上位に表示されないようにする
選別基準・表示順は,検索サイト側が決める
検索結果は信頼できるのか?(2)


しかし,一時的であっても,怪しげなサイトがトッ
プになる可能性
諸事情で,結果に表示されなくなるサイトがある
検索結果は信頼できるのか?(3)


Googleの広告サービスで悪質ソフトを配布
(ITmedia)
ブラウザ乗っ取り被害、検索エンジン経由の被害
が増加(INTERNET Watch)
検索結果は信頼できるのか?(4)


ネット検索で危ない有名人の2011年ランキング、
McAfeeが発表
http://www.itmedia.co.jp/news/articles/1109/20
/news032.html
ネット検索で最も危険な有名人、今年は「ハイデ
ィ・クルム」~McAfee調査
http://internet.watch.impress.co.jp/docs/news/
20110920_478757.html
検索結果は信頼できるのか?(5)


というわけで,検索サイトでも対策
グーグル、検索結果でハッキングされた疑いの
あるサイトを警告
http://internet.watch.impress.co.jp/docs/news/
20101220_415942.html
検索結果は信頼できるのか?(6)


こんなことも起こった
Google Newsが起因 - UAL株価急落事件にみる
、ネット情報と効率化の功罪(マイコミ)
 過去のニュース記事が表示
 検索サイトだけの問題ではない
 リテラシの問題
検索結果の利用法


当り前の使い方だけではない
Googleを駆使したWeb攻撃が急増――セキュリ
ティ専門家が指摘(Computerworld)
検索サイトの“もうけ”は(1)


利用者から,料金を取っているのではない
広告による
http://www.google.co.jp/intl/ja/corporate/
検索サイトの“もうけ”は(2)
広 告
検索結果
利用者とサイトの利害(1)


利用者側
 自分の目的に合致した結果(だけ)が欲しい
 そこに表示される広告がクリックされる確率が
上がる
サイト側

広告の値段を上げられる
利用者とサイトの利害(2)

利用者側
 検索語の適切な選択


複数語
 AND OR
検索語ひとつで済ませたい
利用者とサイトの利害(3)

検索サイト側
 http://www.googlezeitgeist.com/ja/

単なる統計データであろうが,記録(ログ)は
残してある
利用者とサイトの利害(4)

検索サイト側
 利用者の検索行動を記録
 過去に何を知りたがっていたのかが分かれ
ば,今度は何を知りたいのか類推できる
 同じ検索語でも,異なる結果の可能性
 プライバシーの問題
 どのような情報を,いつまで残すか
利用者とサイトの利害(5)



Google、ユーザーデータ保持期間を短縮
(ITmedia)
米Yahoo!、90日後にデータを匿名化する新プライ
バシーポリシー
(INTERNET Watch)
MS、「ユーザーデータ保持期間ゼロでは質の高
い検索は提供できない」
(ITmedia)
利用者とサイトの利害(6)


ログインしなければ,とかクッキーを削除すれば
大丈夫か…
ほとんどのブラウザーで個人を識別できる“指紋
”を残す、米EFFが警告
http://internet.watch.impress.co.jp/docs/news/
20100518_367713.html
 ということは知っておくべき
マーケティング
レコメンデーション








“お勧め”
Amazon.com(co.jpでも)
何か商品を買うと,別の商品を勧める
商品Aを買う
Aを買った多くの人が,商品Bも買う
Bを勧めてくる
購入履歴によるマーケティング
他の方法もある
興味連動型広告



オーバーチュアとヤフー、モバイル向けの興味連
動型広告を開始
http://internet.watch.impress.co.jp/cda/news/2
009/01/26/22215.html
検索履歴だけでなく,閲覧履歴から,何に関心が
あるか判断
行動ターゲティング広告
行動ターゲッティング広告

EUが英国に法的措置、行動ターゲティング広告
めぐり
http://www.itmedia.co.jp/news/articles/0904/16
/news005.html
SNS

例えば Facebook
 利用者個人のいろいろな情報を保持
 趣味・嗜好・人間関係
 より効果の高い広告を提示可能
 高い広告料
 しかも,その中で閉じている
 “囲い込み”
クラウド
cloud 雲
ク ラ ウ ド(1)

「iCloud」では音楽のほかアプリや写真も同期、
iOS 5とともに今秋から無料提供
http://internet.watch.impress.co.jp/docs/news/
20110607_451109.html
 iTunes Storeで購入した音楽を,自分のいろい
ろな端末で再生できる
ク ラ ウ ド(2)


Webメール
 メール自体は手元にない
Google Apps のひとつ
 ワープロのソフトと文書データをクラウドに
 インターネットにアクセスできれば,文書の編
集が可能
 データだけでなく,ソフトも雲の中
ク ラ ウ ド(3)


インターネットのサーバにデータやソフト
インターネットにアクセス可能な機器ならば,どこ
からでも利用可能
 パソコンだけでなく,スマートフォンでも
ク ラ ウ ド(4)

インターネットの仕組みは,よく分からない

雲の中はよく分からない

インターネットを“雲”にたとえる
ク ラ ウ ド(6)

問題も指摘されている
 データがどこにあるか不明
 所在地の国の法律を適用される
 サーバを他人と共有
 その他人が悪意を持った者で,サーバのど
こかに脆弱性があったら…
 etc.
次 週(予 定)

試験前のまとめ