4.データベース

4.データベース
定義
1.あるデータの集合の一部または全部であり、少なく
とも一つのファイルから成るデータの集合であって、
与えられた目的またはデータ処理システムを満足さ
せるもの(JIS情報処理用語X0004-1981)。
2.論文、数値、図形その他の情報の集合物であって、
それらの情報を電子計算機を用いて検索するよう
に体系的に構成したもの(著作権法)。
データベースの種類
(1)文字を中心としたデータベース
書誌データベース、全文データベース
(2)数値を中心としたデータベース
統計データベース、株価データベース、物性デー
タベース
(3)画像を中心としたデータベース google画像
(4)音声を中心としたデータベース iTunes
(5)動画を中心としたデータベース YouTube
書誌データベースと全文データベース
 書誌データベース
タイトル、著者、出版者等の書誌事項と、内容を表す索引
語、抄録から構成される。
主要な索引誌、抄録誌の大多数は書誌データベース化さ
れている。
OPACも書誌データベースの1つである。
 全文データベース
図書や雑誌論文といった1次情報が電子媒体に文字情報
として収められ、テキストそのものをコンピュータ上で閲
覧したり、検索したり、加工したりすることができるもの。
全文データベースは、新聞記事や判例の分野から始まっ
た。テキストのみ閲覧できる場合と、写真や図版を含めて
閲覧できる場合とがある。
(2)データベースの特性
1.公開・共用性
データベースは作成者以外に対して公開されなけ
ればならない。不特定多数の人々が利用できるよ
うになっている必要がある。
2.汎用性
データベース自体は特定の目的を持っていない。
さまざまな利用者が多様な目的で利用できるように
なっていなければならない。
(4)書誌データベース発展の経過
1.情報量の増大と索引・抄録誌の創刊。
2.文献量の増大により、索引・抄録誌の編集面でのコン
ピュータ化が要請され、また印刷物による検索が困難に
なってきた。
3.米国国立医学図書館(NLM)の索引誌編集作業のコン
ピュータ化とコンピュータ検索が始まる。
1962年、索引誌 Index Medicusの編集をコンピュータ化
し、同時にデータベースも作成された。
1964年にはバッチ処理によるコンピュータ検索サービス
(MEDLARS)が始まった。MEDLARSは、後にMEDLINE
というオンライン検索システムに移行する。
NLM(National Library of Medicine)
米国国立医学図書館
LC、NAL(National Agricultural Library)、ととも
に、アメリカの3国立図書館の一つ。NLMとNAL
はそれぞれ医学、農学分野の蔵書を所蔵し、各
分野の専門情報センターの役目を果たす。さら
に各分野の索引データベースを作成・提供して
いる。図書館機能のほか、抄録・索引サービス機
関としての機能を持つ。
医学分野のデータベースであるMEDLINEと、そ
の無料Web版のPubMedを提供する。
4.オンライン検索サービスの発展
• 商用オンライン検索サービスの開始
1972年、商用オンライン検索サービスDIALOGが
開始。順調に成長し、多くの機関が同様なサービ
スを始めた。
• 従来の学術中心のデータベースに加え、経済・ビ
ジネス分野のデータベース、判例や新聞の全文
データベース、統計データベースなどが出現し、
広く利用されるようになった。
5.日本のオンライン検索サービス
JOISとJ DreamⅡ
1976年、JICST(日本科学技術情報センター、現
JST、科学技術振興機構)が、日本初のオンライ
ン文献検索システムを開発した。
その後、1997年にはWeb版JOIS-Ⅳとなり、さら
に2006年には、J Dreamと統合し、J DreamⅡと
いう名称になる。
PATOLIS
• 日本特許情報センター(JAPATIC)の提供する、特
許情報検索システムとして発足。
• 1979年サービス開始
• 2000年民間企業PATOLISがサービスを引き継ぐ
日経テレコン
• 1972年、財務情報NEEDS-TS/Iのサービスを開始。
• 1981年、新聞記事情報NEEDS-IRのサービスを
開始。
• 1998年 日経テレコン21と改称。
(5)データベース提供サービスのしくみ
• プロデューサ
データベースを作成する機関(企業や研究機関)。
典型的には、CASやNLMのような抄録・索引
サービス機関が該当する。
• ディストリビュータ
プロデューサが作成したデータベースを流通させ
るために必要なホストコンピュータとネットワーク
を保有し、ユーザーへのサービスを行う。
DIALOGのようなサービス機関が該当する。
• 代行検索業者
情報ブローカーともいい、ユーザーの情報ニーズ
に対し代行検索を行う業者。具体的には、データ
ベースの選択、検索式の作成、検索の実行、検
索結果の評価、その他コンサルティング等の業
務を行う。
プロデューサとディストリビュータは、兼ねることが
ある。JSTやCASがそれである。Web環境が普及
し、サービスを提供しやすくなってからは、兼ねる
形態が増えている。
(6)代表的なデータベース提供システム
DIALOG
• ProQuest(アメリカ)の一部門
• 歴史と現状
1972年商用サービス開始。
日本では丸善と紀伊國屋が販売代理店。
• 提供サービス
提供するデータベースは、科学技術情報のほか、
美術、哲学、歴史、政治、法律など人文科学、社
会科学関係も網羅する。データベースの種類は約
400種。
OCLC
• 運用機関:Online Computer Library Center, Inc.
• 歴史と現状
1967年設立。
図書館、教育機関、並びにそのユーザーを対象に、
コンピュータ利用に基づく書誌・資料情報サービス
を提供する会員制非営利法人。世界最大の書誌
ユーティリティ。
オンライン目録作成、相互貸借、情報検索サービス
(以上を3大サービスという)、および関連サービス
を提供。
• 提供サービス
①Connexion
世界最大の目録データベースであるWorldCatを
中心にした目録作成システム。OCLCの中核
サービス。
②First Search
オンライン情報検索サービス。OCLC総合目録
(WorldCat)のほか、60以上のデータベース群を
対象として提供する。現在はインターネットの
Webに対応。検索と同時に原文献提供サービス
(Document Delivery Service)も利用できる。
JST(科学技術振興機構)
• J DreamⅡ
雑誌論文検索のためのオンライン検索システム。中
心は『科学技術文献速報』のデータベース版
(JSTPlus)であるが、他にJMEDPlus(日本発行の
医学薬学関係論文データベース)、MEDLINE等が
利用できる。 J DreamⅡお試し版
• J-STAGE
JSTが構築した「科学技術情報発信・流通総合シス
テム」。学協会を支援し、学協会の発行する学会
誌・論文誌を容易にかつ低コストで電子化し、JST
のサイトを通して発信する仕組み。
日経テレコン21
• 旧NEEDS-IR。年日経テレコン21と改称。日経作
成の経済・各種企業やビジネス情報のほか、他社
作成の企業情報。朝日、読売新聞などの新聞記
事検索。ビジネス系雑誌の記事検索。辞典類の検
索。ニュース速報、株価・債権市場。など多数。
G-Search
• 1991年データベース提供サービス開始。
• 提供データベース
新聞記事全文、一部の雑誌記事全文、ビジネス情
報など。その他、学術、特許、ビジネスといった分
野で海外のデータベース多数を利用できる。
• 日経テレコンと並ぶ商用データベース提供大手。
国立情報学研究所(NII)
1986年に学術情報センター(NACSIS)という名称で
発足。その後2000年に国立情報学研究所と改称。
大学図書館ネットワークの中心として、各大学の図
書、雑誌の目録所在情報サービス(NACSIS-CAT
/NACSIS-ILL)と、広く学術情報を研究者に提供
する機能等を持つ。
• NACSIS-CAT(総合目録形成サービス)
• NACSIS-ILL (相互貸借システム)
• GeNii
(学術系コンテンツサービスの中心)
• 研究開発機能
目録所在情報データベース形成機能
(NACSIS-CAT/ILL)
国公私立大学図書館の所蔵する図書、雑誌の所
在目録を各大学が共同で作り上げ、書誌情報を
共有するとともに、参加大学図書館の総合目録
を形成する。
NACSIS-ILL
目録所在データベースで検索した図書や雑誌の
相互貸借の依頼を掲示板的なシステムを利用し、
オンラインで行えるものである。
情報検索機能 GeNii(ジ-ニイ)
学術論文、図書・雑誌、研究成果概要など多様な
学術情報を統合的に検索できる「ポータル」(入り
口)。
論文検索 CiNii Articles
GeNii検索サービスの1つ。検索可能な書誌情報
は、「雑誌記事索引」を中心母体とする論文情報。
あと、NII-ELS事業の結果作成された各大学の紀
要および学協会雑誌の論文データベース等も含
まれている。NII-ELS経由で入力された論文の一
部は電子ジャーナルとして論文本体を直接利用
可能。
電子ジャーナル
1.電子ジャーナル(Electronic journal)とは
原稿作成、審査、編集、発行まで、つまり雑誌論
文の著者の投稿から読者の利用まで、紙を用い
ずにすべて電子的に行おうとするもの。
ただし現実には、印刷版の雑誌を持ち、別途その
電子版をも提供するような雑誌も電子ジャーナル
と呼んでいる。現在3万(?)タイトルほどが出版さ
れている。
2.電子ジャーナルの仕組み
①論文の著者:通信回線を通してホストコンピュータに論文を
入力する。
②公共ファイル:入力された論文は公共ファイルに収録され、
他の研究者はそれを自由に読むことができる。そのコメント
を著者まで送ることもできる。
③編集者:著者は第三者からのコメントにより修正を加え、最
終原稿を手もとのコンピュータから編集者に転送する。
④査読者:査読者は手もとのコンピュータから、論文の批評・評
価を行い、その内容を編集者を経由して著者に送る。
⑤利用者:受理された論文は、編集者によって完全原稿として
ファイルに入力される。利用者はネットワークを介して、手も
とのコンピュータから論文を読むことができる。
論文データの形式
(1)ページイメージ画像
1ページ分を1枚の画像ファイルとして提供。ファイル容量が
大きくなり、文字としての認識はできない。
(2)プレーンテキスト
文字情報のみを提供。図や写真の表示はできない。
(3)HTML
WWW上のハイパーテキスト文書形式。文字部分はテキスト
データなので検索等が可能。図や写真は表示できるが、冊
子版とのレイアウト面での対応が取れない。
(4)PDF
Adobe社が開発した電子文書配布用フォーマット。専用の閲
覧ソフト(Adobe Reader)を必要とする。印刷したページのレイ
アウトをほぼ忠実に再現できる。もっともよく普及している。
提供方式の種類(1)
• 商業出版系提供サービス
Science Direct(Elsevier社)、Springer-LNK
(Springer社)など。出版社ごとにまとめて契約す
る。出版社のWebサイトをとおして提供する。
• 学協会系
ACS Publications(American Chemical Society発
行の電子ジャーナル)など。学協会ごとにまとめ
て契約し、その運営サイトをとおして提供する。
提供方式の種類(2)
• 統合系提供サービス
(1)アグリゲータ
EBSCOHost(EBSCO社)、ProQuest社など。
種々の出版社の電子ジャーナルを寄せ集めて適当
な群ごとに提供。学内からEBSCO Hostを使う。
(2)プラットフォーム提供型
HighWire Press スタンフォード大学が運営。
J-STAGE JSTが運営する学協会発行雑誌の電子
化と提供システム。
NII-ELS NIIが運営する学協会発行雑誌の電子化
支援事業。データ提供はCiNiiによる。