2-3論理演算子 p10

9回目 Web情報検索課題の設定と
日本語キーワード検索
1.
2.
3.
4.
Web情報検索課題の設定
課題の概要
提出項目の確認
日本語キーワード検索
1
Googleの検索オプション画面
• 検索式の入力
– 前回(8回目)の用紙返却
2
これまでの検索課題
• 新聞記事
• 断片的な新聞記事情報を時系列かつマクロに把握
する課題を設定
• 図書・雑誌記事
• 学問的な基礎意識や専門的な知識を得ることので
きる課題を設定
• 複数の図書を読むことで偏りのない知識を取得
• Web情報検索
• 自分で信頼性を推定し利用する。
3
Web情報の特徴
1.
2.
3.
4.
5.
6.
7.
8.
パイパーリンクで原文を確認できる
1次情報と2次情報の混在
匿名の情報
書誌事項の欠如
断片的情報
審査を受けない情報
現時点の情報
全分野の情報
4
学習到達目標
1. 複数の検索エンジンを利用することにより異なった結
果が得られ、幅広い情報収集ができること。
– 検索エンジンによる偏りの排除
– 英語のWeb情報にも有用な情報が存在することの理解
2. AND, OR, NOTの論理式を使ったキーワード検索が可
能であること。
– Advanced Searchの理解
3. サイトの信頼性を付帯情報から推定できること。
– 不確かな情報が多数混在する断片的な情報の利用
4. Web情報の中でも一次情報が重要なことを認識でき
ること。
5
具体的な検討内容
•
•
•
•
複数の検索エンジン(3エンジン)
複数の情報源(5サイト)
付帯情報の利用(書誌事項相当項目)
一次情報の選択(原文)
– 直接入手した情報
– 著者が自分で作成した情報
6
1.Web情報検索課題の設定
• 信頼性の定かでない情報が混在する、断片的な
Web情報を、付帯情報を利用して信頼性を推定し、
自分で選択/整理/加工/評価する。
– 一次情報を見極める。
– 基礎知識がない場合ほど慎重に一次情報を見極める。
• 最後に情報源の異なる複数のWeb情報を関連付け
、目的目標の実現に役立つ情報や知識を自分で組
み立てる。
• 特定の地域や日本に限定されない、日本語でも英
語でも検索可能な課題を設定する。
– これまでの検索で設定した課題を使用しても良いが英語
検索が成立するよう修正する
7
2.Web情報検索の概要
• 3種類のWeb情報検索
– 同一課題について3種類の検索を実施する
– アルゴリズムが異なる
– GoogleとYahoo Japanは同じ(Yahooは異なる)
– Google.co.jp とYahoo.co.jp (Yahoo.com)
– 検索方法毎に5サイト以上の情報収集を行う
【検索1】Googleによる日本語キーワード検索
【検索2】Google以外の日本語キーワード検索
【検索3】 英語検索エンジンによる英語キーワ
ード検索
8
使用する3種類の検索エンジン
論理式を使った検索機能&検索件数表示機能
日本語検索エンジン
1
英語検索エンジン
検索1 Google.co.jp
検索3 Google
(○論理式・○件数表示)
Google.com(不完全)
https://www.google.com/webhp?gl=
us&hl=en&gws_rd=cr&pws=0
検索2
Bing
Bing
2 (×論理式・○件数表示)
Yahoo.co.jp
3 (Googleと同じため対象外)
(○論理式・○件数表示)
Ask.com
4 (×検索表示・×論理式)
ask.co.jp
Baidu
6 ○論理式・○件数表示)
(
1
件
選
択
(×論理式・○件数表示)
Bing.com in English
Yahoo
yahoo.com
(○論理式・×件数表示)
1
件
選
択
ASK
(×検索表示・×論理式)
ask.com
9
検索1
日本語キーワード検索(その1 Google )
• Google を使ったキーワード検索
– 詳細検索/Advanced searchを理解する
• 論理式を使った検索を理解する
– AND, OR, NOT
google
soumu.go.jp
.cas.go.jp
.cas.go.jp
.city.yonago.lg.jp
pref.iwate.jp
city.minamisoma.lg.jp
city.fukuoka.lg.jp
.nihombashi-sr.com
city.yokohama.lg.jp
11
google
12
検索2
日本語キーワード検索(その2)
• bing, ASKより1つ選択する
• 複数の検索エンジンの利用により幅広いWeb情報
を収集できることを理解する。
• アルゴリズムの違い
– 問題解決の手順
– コンピュータにプログラムでアルゴリズムを指示している。
Bing(ビング)
soumu.go.jp
.cas.go.jp
mext.go.jp
fukuoka.lg.jp
wikipedia.org
.cas.go.jp
.caa.go.jp
yokohama.lg.jp
pref.mie.lg.jp
.chukyo-u.ac.jp
14
Googleと異なる
15
Ask
metro.tokyo.jp
metro.tokyo.jp
.dir.co.jp
.one.jp
city.shinagawa.tokyo.jp
cao.go.jp 内閣府
city.sakado.lg.jp
.applic.or.jp
.miyauchi-law.com
.city.shizuoka.jp
16
Google, bingと異なる
17
検索3
英語検索エンジン
• Google.com, Bing, Yahoo, ASKから1つ選択
• 英語のWeb情報に有用な情報が存在することを理
解する
• Google.comへの接続
– https://www.google.com/webhp?gl=us&hl=en&gws_rd=cr
&pws=0
– http://www.google.com/webhp?gl=us&hl=en&gws_rd=cr
– Gl=us 国アメリカ, hl=en 言語英語, gws_rd=cr リダイレクト
禁止
3.提出項目の確認
•
•
•
•
【検索の準備】
3)情報検索対象分野
4)情報検索課題(題名)
5) 情報検索内容
– 200-400字程度の文章で具体的に記述
• 6) 情報収集の目的
– 収集した情報を使って最終的に実現したい内容を記述
– 情報の選択・結果のまとめかたに大きく影響する
• 7) 情報収集の目標
– 実現可能な到達レベルや情報の利用方法を記述
【検索1】Googleによる日本語キーワード検索
• 8)検索前に想定した日本語5キーワード
• 9)検索前に想定した5キーワードによるGoogle絞り
込み検索件数
20
• 10) 実際の検索結果
– 試行錯誤を繰り返して、事前に想定したKWと検
索式を修正して得られた、最適の検索式を記述
する。
– 最初に想定した5KWを全て使用する必要はない
– より適切なキーワードが見つかれば変更する
– ORやNOTの使用も考慮して検索式を組み立てる
– 件数を減らすためにキーワードを追加しない。
21
– 10-1実際に使用したキーワード:検索前に想定し
たキーワードを修正した場合はその理由も記述
する。
– 10-2実際に使用した検索式:試行錯誤を繰り返し
て得られた検索式を記述する。
– 10-3検索式の修正:最初に想定したキーワードと
検索式をどのように修正して検索式を作成したか
記述する。
– 10-4検索件数:実際に使用した検索式による検
索件数を記述する。
22
• 11) Googleを使った日本語キーワード方式による情
報収集結果のまとめ
– 11-1) 5サイト以上の情報を、各サイト毎に100~400字で
記述する(5サイトで500~2000字)。サイトのURLと信頼度
を忘れないように記入すること。
– 11-2) 5サイト以上の情報全体から得られた内容を要約す
る。内容を順に記述するのではなく、自分の文章でまとめ
る。
– 11-3) 検索課題の設定で想定した目的と目標に合致する
内容をまとめる。
– 11-4)まとめた内容が目標の達成にどのように役立つか、
あるいはなぜ役に立つか、他人が理解できるよう記述す
る。
– 11-5)可能なら、検索課題に関する現状理解、問題点、将
来展望なども記述する。
23
【検索2】Google以外の日本語検索エンジンに
よるキーワード検索
•
•
•
•
Bing, ASKから選択した1検索エンジンを使用する。
12)使用した日本語検索エンジンの名称
13)検索前に想定した日本語5キーワード
14)検索前に想定した5キーワードによるGoogle絞り
込み検索件数
• 15) 実際の検索結果
–
–
–
–
*10)項参照
10-1実際に使用したキーワード:
10-2実際に使用した検索式
10-3検索式の修正
10-4検索件数
24
• 16) 日本語キーワード方式による情報収集結果のま
とめ
– 16-1) サイト毎の内容、各100~400字で記述すること。サ
イトのURLと信頼度を忘れないように記入する。
– 16-2) 情報全体から得られた内容を要約する。
– 16-3) 検索課題の設定で想定した目的と目標に合致する
内容をまとめる。
– 16-4)まとめた内容が目標の達成にどのように役立つか、
あるいはなぜ役に立つか記述する。
– 16-5) 検索課題に関する現状理解、問題点、将来展望な
ども記述する。
25
【検索3】 英語検索エンジンによる英語キー
ワード検索
• Google, Bing, Yahoo, ASKから選択した1つの検索エ
ンジンを使用した英語キーワード検索
• 17)使用した英語検索エンジンの名称
• 18)検索前に想定した日本語5キーワード
• 19)検索前に想定した5キーワードによるGoogle絞り
込み検索件数
• 20) 実際の検索結果
–
–
–
–
*10)参照
20-1実際に使用したキーワード:
20-2実際に使用した検索式
20-3検索式の修正
20-4検索件数
• 21)英語キーワード方式による情報収集結果のまと
め
– 21-1) 5サイト以上の情報を、各サイト毎に100~400字で
記述する(5サイトで500~2000字)。サイトのURLと信頼度
を忘れないように記入すること。
– 21-2) 5サイト以上の情報全体から得られた内容を要約す
る。内容を順に記述するのではなく、自分の文章でまとめ
る。
– 21-3) 検索課題の設定で想定した目的と目標に合致する
内容をまとめる。
– 21-4)まとめた内容が目標の達成にどのように役立つか、
あるいはなぜ役に立つか、他人が理解できるよう記述す
る。
– 21-5)可能なら、検索課題に関する現状理解、問題点、将
来展望なども記述する。
27
【Web情報検索のまとめ】
• 22.収集した情報の分析
– 目的と目標に対して必要な情報収集ができたか
を3回の検索毎に総括する
• 23.検索エンジンの特徴
– 23-1)【検索1】Google
23-2)【検索2】Bing, ASKから選択
– 23-3)【検索3】英語検索エンジン
検索エンジンの検索内容を比較し、 それぞれ
の特徴を 各100~400字で記述する
• 24. 理解できた内容
– 24-1)Web情報の特徴
– 24-2)Web情報検索に関して新しく理解できたこと
24-3)Web情報利用の注意事項
4.日本語キーワード検索
• 検索式の利用
• キーワードの数
– 概念を組み合わせる場合は、最低3キーワードが必要
• キーワードの選定 2-4-1
– 検索内容を200~400 字程度の文章で表現しその文章から3
~5語のキーワードを抽出する
• 検索内容の整理
– 思いつきのキーワードで情報検索を実行すると、必要な情報
がどの程度収集できたが不明
– 検索内容の文章を作成できない原因は基礎知識の不足
• Googleの検索オプションの紹介
29
検索式と論理演算子
•キーワードの選定と検索式の作成(p10)
•検索式
•論理演算子とキーワードの組み合わせ
•論理式
•AND
•OR
•NOT
かつ
いずれか
除く
「全てのキーワードを含む」
「いずれかのキーワードを含む」
「キーワードを含めない」
•初期画面の入力欄に複数のキーワードをス
ペースで区切って入れるとAND検索となる
30
検索式の作成
• 想定される検索エンジンの使用方法
– キーワードや文章を思いつく順に追加
– スペースでAND検索
– 検索式を意識せずに検索を実行
– 単純な事実や簡単な意味を知りたい場合には、検索式を
作らなくてもほとんどの場合必要な情報を入手できる
• 検索式を使った情報検索が必要な場合
– 有料データベース
– 必要な情報を漏れなく収集する
– 原文の入手が必要
• 検索式の修正
– 試行錯誤を繰り返し修正することは重要
31
• サービス開始当時のウエート付け
– ①リンクが張られている数(バックリンクの数,link juice)
– ②リンクが張られているときの説明文(アンカーテキスト)
– ③Webページ内のキーワード
– ④ドメインの信頼性
• 現在
– ④のウエートを高くし、④、②、③、①の順でWebページが
ウエート付けされている
– 当初重視された①バックリンクのウエートは低くなる
– ④ドメインの信頼性が最も重要視されるようになっている
32
検索オプション
• Google検索を1度実行する。
• 表示されるオプションボタンをクリックし、検索オプ
ションを選択する。
• 検索オプション画面が表示される。
33
検索オプション画面
• ブール演算子によるAND検索、フレーズ検索、OR検
索、NOT検索が可能となる
• 環境汚染または環境破壊に関する情報の検索
– 環境 破壊 OR 汚染
Googleの詳細検索例
2015/4/20
件数は正確ではないが参考となる
• 地球温暖化 and 二酸化炭素
ORの場合はスペース
– 地球温暖化 二酸化炭素
• 地球温暖化 and (二酸化炭素 or CO2)
– 地球温暖化 二酸化炭素 OR CO2
• 地球温暖化 and 温室効果ガス not 二酸化炭素
– 地球温暖化 温室効果ガス -二酸化炭素
- の場合はスペースなし
• 地球温暖化 and 温室効果ガス not (二酸化炭素 or CO2)
– 地球温暖化 温室効果ガス -二酸化炭素 -CO2
• 地球温暖化 and (二酸化炭素 or CO2) not 温室効果ガス
– 地球温暖化 二酸化炭素 OR CO2 -温室効果ガス
地球温暖化 and 二酸化炭素
• 地球温暖化 二酸化炭素
• 約 673,000 件
地球温暖化 and (二酸化炭素 or CO2)
ORの場合はスペース
• 地球温暖化 二酸化炭素 OR CO2
• 約 767,000 件 (0.25 秒)
地球温暖化 and 温室効果ガス not 二酸化炭素
- の場合はスペースなし
• 地球温暖化 温室効果ガス -二酸化炭素
• 約 416,000 件 (0.29 秒)
地球温暖化 and 温室効果ガス
not (二酸化炭素 or CO2)
- の場合はスペースなし
• 地球温暖化 温室効果ガス -二酸化炭素 -CO2
• 約 284,000 件 (0.27 秒)
• 詳細検索のページから実行すると、
googleの検索式が表示される。
• 検索エンジンの説明&
論理式の説明は10回目に再度
9回.今回のまとめ
課題3の概要の理解
3種類の検索エンジンを使用
Google検索式の理解
41
10回 次回の準備
• 課題3の検索課題作成
– 図8を用いて作成する。
• 2種類の日本キーワード検索に着手
– 検索エンジンの決定
– キーワード決定のための予備検索
– 最適検索式はエンジン毎に異なる
42