3 文献検索 - 関西学院大学

生体情報学I
ー医学・生物学のための
文献検索、キーワード検索ー無料動画EGOIST
関西学院大学理工学部生命医化学科
藤 博幸 本日の講義内容と目標
•  文献検索について
•  文献情報を取り扱うデータベースとサーチエンジン
–  文献情報を取り扱っているデータベース
•  PubMed(パブメド)・無料
•  Scopus(スコーパス) ・一部無料
•  CiNii(サイニィ)・一部無料
–  学術文献専用のサーチエンジン
•  Google Scholar(グーグルスカラー) ・無料
•  Scirus(サイラス)
•  PubMedを使ってみる(実習)
•  目標
–  PubMedの特徴を理解する
–  研究に必要な文献情報の検索・収集技術を習得する
本日の講義内容と目標
•  文献検索について
•  文献情報を取り扱うデータベースとサーチエンジン
–  文献情報を取り扱っているデータベース
•  PubMed(パブメド)・無料
•  Scopus(スコーパス) ・一部無料
•  CiNii(サイニィ)・一部無料
–  学術文献専用のサーチエンジン
•  Google Scholar(グーグルスカラー) ・無料
•  Scirus(サイラス)
•  PubMedを使ってみる(実習)
•  目標
–  PubMedの特徴を理解する
–  研究に必要な文献情報の検索・収集技術を習得する
文献検索について
文献検索について
●レポートの作成 や 研究を進める上で重要な作業
自分の考えや主張をまとめるには
先行研究(注目するテーマに関する過去の研究)や
その他の情報を調べて評価・検討する事が必要
文献検索について
文献検索の使用例
腫瘍へのサリドマイドの適用
「神と悪魔の薬 サリドマイド」 トレント・ステフェン, ロック・ブリンナー著
日経BP社
ジューダ・フォークマン (ハーバード大学子供病院)
腫瘍成長には血管新生が必要であることを発見
抗血管新生薬による腫瘍の治療
ロバート・ダマト
フォークマンの研究室で経口できる抗血管新生薬
の開発に取り組む
文献検索について
ダマトの思考実験
成人の身体の中で新たな血管が作られる場所
= 抗血管新生薬により副作用の出てくる可能性
皮膚、毛髪、爪…
女性生殖器
28日ごとにおびただしい血管がつくられている!!
抗血管新生活性を持つ薬は月経周期に影響を及ぼし
月経の減少や消失をもたらすのではないか?
Medlineで副作用として無月経が指摘されている薬を検索
膨大な数の薬が検出され、絞り込めない
文献検索について
妊娠している女性の場合
胎盤の形成や胎児の成長には血管形成が必要
抗血管新生薬は、胎児の奇形を生じさせるのでは?
副作用として胎児奇形の可能性のある薬を検索
やはり膨大な数の薬が検出された
二つの検索結果を組み合わせると6つの薬が残り
そのトップがサリドマイドだった
実験による確認
サリドマイドそのものでは血管新生は抑制されなかったが
その代謝産物により血管新生が抑制された
文献検索のための基礎知識
A AND B
●検索語入力の注意点
色々な可能性を考慮した検索語を考えないと
検索漏れにつながる
1.  異なる表記
例) 癌, ガン
2.  同義語=言い換えできる語
例) 病気, 疾病, 疾患
例) disorder, disease, malady
3.  語尾変化
例) homology, homologous
→一方で、ユーザーが意識しなくてもDBの保有する同義語集(シソー
ラス, Thesaurus)により、検索漏れを防ぐ用意もされている
文献検索のための基礎知識
●熟語検索
2語以上で構成されるキーワードの場合、
ワード間に半角スペースを挟み、熟語の前後
を「””」(半角ダブルクォーテーション, PubMedの場合)で
囲んだ状態で入力する。
例:
“tumor suppressor gene”
スペース
文献検索のための基礎知識
●検索演算子
①AND(論理積)
A AND B
A
B
A OR B
A
B
A NOT B
A
B
②OR(論理和)
③NOT(理論差)
文献検索のための基礎知識
●検索演算子
①AND(論理積, かつ)
A AND B
キーワードAとキーワードBの両方を含む文献
例:
大腸菌 AND 病原性
A
キーワード
「大腸菌」
を含む文献
B
キーワード
「病原性」
を含む文献
文献検索のための基礎知識
●検索演算子
②AND(論理和, または)
A OR B
キーワードAとキーワードBのどちらかを含む文献
例:
大腸菌 OR 病原性
A
キーワード
「大腸菌」
を含む文献
B
キーワード
「病原性」
を含む文献
文献検索のための基礎知識
●検索演算子
③NOT(論理差, を除く)
A NOT B
キーワードAを含む文献からキーワードBを含む文
献を除いたもの
例:
大腸菌 NOT 病原性
A
B
キーワード キーワード
「病原性」
「大腸菌」
を含む文献 を含む文献
文献検索のための基礎知識
●前方一致検索
キーワードの後方に「*」(半角アスタリスク, PubMedの場
合)をつける事で、「*」以降にどんな文字が続いてい
るものも全て検出する。
例:
phylog* → phylogeny, phylogenetic など
splic* → splice, spliced, splicing など
600以上の語尾変化パターンがある場合は
警告が表示される。
文献情報データベース
キーワード: PubMed
PubMedとは
●医学・生物関係の文献データベースの定番
o  対象として生物医学ー医学・看護学・歯学・獣医学・
薬学・健康科学ーを含む
o  収録数が膨大(収録範囲:1949年〜現在)
o  1997年から無料に公開
o  インターネットを介して世界中から利用可能
o  1997年から無料に公開
o  米国立医学図書館(NLM: National Library of
Medicine)が編纂する医学文献データベース
(MEDLINE)にその他の生命科学分野の文献を
追加した文献データベース
PubMedへのアクセス
●Firefox等のブラウザで下記のURLにアクセス
http://www.ncbi.nlm.nih.gov/pubmed/
PubMedのトップページ
詳細検索機能
キーワードの入力ボックス
PubMedの使い方
・クイックマニュアル
・フリーアクセスできる
論文の取得について
・FAQ
・チュートリアル
・最新情報
PubMedのツール
・モバイル端末向けサービス(β版)
・特定論文の簡易検索
・複数論文の一括検索
・臨床医学領域でのEBM文献検索
・特定のトピックに絞った検索
追加情報資源
・MeSHデータベース
・ジャーナルデータベース
・臨床試験情報
・インターフェースを利用せずにデータを
取り込むE-ツール
基本検索
キーワードの入力
入力するキーワードについて
・医学/生物用語→現象名や分子名など興味のある言葉
(例)apoptosis, genome
・著者名→family name(フル)・first name(イニシャル)・middle name(イニシャル)の順番
(例) miyata t, van der Vaart JM
・雑誌名→フルタイトル、略誌名、ISSN(国際標準逐次刊行物番号, この時ハイフンも必要)
(例) Journal of Bacteriology(フル)、J Bacteriol(省略形でもピリオド無),
1098-5530(ISSN)
*英語
*大文字/小文字どちらでも良い(論理演算子は大文字表記)
*ギリシャ文字はアルファベットで綴る (例)α→alpha, β→beta, γ→gamma
*特殊記号の扱い (例)「’」「!」「?」「%」「$」などの記号は省略。「-」→スペース
*ローマ数字の扱い(例)I->i, II→ii, IX→ix
基本検索
(例題)Escherichia coli, O111
キーワードの入力と
検索の実行
①入力ボックスにキーワードを入れる。
複数のキーワードはスペースで区切る。
(スペース区切りは論理積検索に相当)
②ボックスに入力されたキーワードに基づき
候補のワードが表示される。
③目的の用語があったらそれをクリックすると
検索が開始される。
④候補の中に目的の
用語が無かったら、最
後まで入力し、 このボ
タンを押す、または
「Enterキー」を押して検
索を開始する。
基本検索
検索結果① Summary形式
検出総数:
921件
論文タイトル
著者名
収録誌(略)名
略誌名の上にマウス
↓
正式名称が表示
出版年;巻(号);ページ
・921件の論文情報 がSummary形式
の一覧として出力
・点線枠内が
各論文タイトル
の内容
関連文献リスト
無料で全文を
閲覧できるリンク
チェックするには
多すぎる
↓
キーワードを
追加して絞り込む
基本検索
検索結果② ①キーワードとして「pathogen」を追加
検出総数:
53件
・53件の論文情報 がSummary形式
の一覧として出力
タイトルと要旨を
一通りチェックしてみる
↓
1ページ当たりの
表示件数が20件
に設定されており
確認しにくい
↓
表示件数を
変更する
基本検索
出力表示
設定変更 ①Display Settings
のリンクをクリックする
②出力形式の設定をしてApplyボタンをクリック
・ ファイル形式:summary→abstruct
・ 1ページ当たりの出力件数:20→100
・ 並び替えの基準(出版年、著者順など):Recently Added→Pub Date
検出総数:
53件
・53件の論文情報 がSummary形式
の一覧として出力
タイトルと要旨を
一通りチェックしてみる
↓
1ページ当たりの
表示件数が20件
に設定されており
確認しにくい
↓
表示件数を
変更する
基本検索
検索結果③
各論文のabstractと
電子ジャーナルのリンク
の表示
電子化されている文献
である事を表すリンク。
但し、所属機関が購読
契約を結んでいる場合
に全文の閲覧が可能。
全文無料文献である事
を表すリンク
基本検索
検索結果④
電子ジャーナルのリンク先へ行き
論文の全文を見てみる
該当文献のサイト
ここで全文が読める
全文無料文献のリンク
をクリック
基本検索
検索結果⑤
電子ジャーナルのダウンロード
PDFファイルの
リンクをクリック
更にPDFファイルとして
文献のダウンロード
も出来る
目的文献の取得
基本検索(例題:Escherichia coli
O111)
文献リストの作成
「検索結果③」の一覧から重要と
思われる文献リストを作成する
①
②
①各論文のabstractを確認し、
重要だと思われる文献の
チェックボックスにマークする
②再びDisplay Settingsを選択し、Abstract → Summaryに変更して”Apply”ボタンをクリック
マークした文献だけの情報を持つオリジナル文献リスト
基本検索(例題:Escherichia coli
O111)
マークした文献だけの情報を持つオリジナル文献リスト → 文献リストを保存する。 Send to をクリック
基本検索(例題:Escherichia coli
O111)
文献リストの保存
作成した文献リストを保存する
①
②
③
①「send to」をクリック
②「file」をクリック
③保存形式を指定し、
「Create File」ボタンをクリック
④ファイルのダウンロード画面が現れ、作成した
リストがファイルとしてダウンロードできる
④
基本検索(例題:Escherichia coli
保存した文献リスト
pubmed_result.txt
というファイルに
保存される
(MacOSXの場合、
この名前のファイルが
ダウンロードフォルダ
に作成される) O111)
詳細検索(Advanced search)
(例題)Escherichia coli, O111 トップページのAdvanced searchを選択
検索結果の履歴と
論理演算子(AND, OR, NOT)
を用いた検索
Historyに過去の検索履歴が
入っている。
詳細検索(Advanced search)
Search Builderのプルダウンメニューから[Text Word]を選択し、「genome」を入
力
詳細検索(Advanced search)
genomeを入力
詳細検索(Advanced search)
① Add to Historyをクリックする
② genomeがHistory
に Historyリストに登録
される
詳細検索(Advanced search)
② 2000年から2001年を
ボックスに入力
③ “Add to history”をクリック
①Builderのプルダウンメニュー
から “Date - Publication”を選択
詳細検索(Advanced search)
① HistoryリストにPublication
Dateとして2000年から2001年
がエントリされる。
② History中の
#1 Escherichia coli O111
#4 genome
#5 2000 – 20001
のAddをクリック
③ Builderに選択した項目が入力されていることを確認して
Searchボタンをクリック
詳細検索(Advanced search)
今回はANDのままで検索するが、検索目的に応じて
プルダウンメニューから条件を選択する
詳細検索(Advanced search)
一件だけ条件に該当する論文が検出
注意点
•  PubMedは医学生物系の文献検索には強力なツールであるが、
その他の分野の検索に使えない事もある
•  一般検索サービス (yahoo, google)の活用により、上記のポイント
を補うだけでなく、論文以外の講演/学会発表要旨等の情報も得
る事が期待される。
•  一方で、ネット上の情報の中には学術情報としての信頼性が確認
できず、参考情報として引用できないものもあるので注意が必要
である。
•  今回のAdvanced Searchは、利用の一例であり、異なるやり方
で同様のことを実行できる。
演習
• “breast cancer”で検索
何件検索できたか確認
• “allelic variant”で検索
何件検索できたか確認
• Advanced Searchに移動してHistoryから上記検索を
AddでBuilderに入力し、ANDの条件で検索し、
何件になるかを確認
• “driver mutations”で検索
何件検索できたか確認
• Advanced SearchでHistoryを利用して”breast cancer”と”driver
mutations”のANDでの検索
何件検索できたか確認
マニュアル・参考書
•  PubMed Quick Start Guide / PubMed Tutorials (http://
www.ncbi.nlm.nih.gov/pubmed)
•  PubMedの使い方(2010)New version ダイジェスト第2版』
(東邦大学医学メディアセンター)
(http://www.mnc.toho-u.ac.jp/mmc/pubmed/)
•  改訂第2版『バイオデータベースとウェブツールの手とり足とり活用
法』 (中村保一、石川淳、磯合敦、平川美夏、坊農秀雄 編集) 洋土社
文献検索をこえて
Bibliome:The bibliome is the totality of biological text corpus.
This term was coined around 2000 in EBI (European
Bioinformatics Institute) to denote the importance of biological
text information.
手法:テキストマイニング (text mining)
文字列を対象としたデータマイニングのことである。通常の文章
からなるデータを単語や文節で区切り、それらの出現の頻度や
共出現の相関、出現傾向、時系列などを解析することで有用な
情報を取り出す、テキストデータの分析方法
文献検索をこえて
文献検索をこえて
•  PubMedで”text mining”で検索 1036件検出
文献検索をこえて