OAI-PMHと図書館サービス

OAI-PMHと図書館サービス
-千葉大学附属図書館での事例を交えて-
千葉大学附属図書館
尾城 孝一
[email protected]
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
1
OAIとは
 正式名称
 使命と支援組織
 歴史
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
2
正式名称
 Open Archives Initiative
http://www.openarchives.org/
 “Open”とは
「無償」ではなく「開かれたシステム」
 “Archive”とは
厳密な意味での「アーカイブ」ではなく,広い意
味での情報を蓄積するためのリポジトリ(サー
バ)
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
3
使命と支援組織
 使命
多様な電子コンテンツの効果的配信を促すた
めに,相互運用性に関する標準を策定し,そ
れを普及させる
 支援組織
Coalition for Networked Information: CNI
Digital Library Federation: DLF
National Science Foundation: NSF
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
4
OAIの歴史
 1999年10月(サンタフェ会議)
OAIの結成
eプリント・アーカイブの相互運用性の確立
メタデータ・ハーベスティングに基づくフレーム
ワーク(サンタフェ協定)
 2000年6月(第2回会議)
活動範囲の拡大(eプリント・アーカイブ→各種
電子コンテンツのリポジトリ)
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
5
OAIの歴史(続き)
 2001年1月
メタデータ収集プロトコル(Open Archives
Initiative Protocol for Metadata Harvesting:
OAI-PMH) Ver.1.0が制定
 2002年6月
OAI-PMH Ver.2.0発表
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
6
OAI-PMHとは
 基本的概念と定義
OAIフレームワークの構成者
ハーベスタとリポジトリ
アイテムとレコード
セットと選択的収集
 プロトコルの特徴
 OAI-PMH要求
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
7
OAI-PMHフレームワークの構成者
 データプロバイダ
リポジトリを維持し,OAI-PMHによりメタデータ
を開示する
 サービスプロバイダ
OAI-PMHを使用してデータプロバイダから収
集したメタデータに基づき,付加価値のある
サービスを提供する
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
8
リポジトリとハーベスタ
 リポジトリ
 OAI-PMHの要求に対して応答することのできるネット
ワークアクセス可能なサーバ
 ハーベスタに対してメタデータを開示するために,
データプロバイダが管理する
 ハーベスタ
 OAI-PMH要求を発行するクライアント・アプリケーショ
ン
 サービスプロバイダがリポジトリからメタデータを収集
する手段として使用する
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
9
リポジトリとハーベスタの関連図
データプロバイダ
各種要求,収集条件,
メタデータのフォーマット等の指定
サービスプロバイダ
要求
リポジトリ
ハーベスタ
応答
利用可能なメタデータフォーマット,
リポジトリの情報,メタデータレコード等
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
10
OAIの3層モデル
クロス
検索
評価
リンキング
プロトコル層
メタデータ・ハーベスティング
eプリント
アーカイブ
2003/6/17
電子図書館
サーバ
OPAC
サービス層
(サービスプロバイダ)
リポジトリ
ライブラリーシステム研究会(慶応大学三田図書館)
データ層
(データプロバイダ)
11
アイテムとレコード
 アイテム
 リポジトリの構成要素
 あるひとつのリソースに関するメタデータを複数の
フォーマットで蓄積する概念的な容れ物(コンテナ)
 アイテムに包含されるさまざまなフォーマットのメタ
データは,OAI-PMHを通じてレコードとして収集される
 リポジトリのなかでアイテムを一意に同定する識別子
を持つ
 レコード
 あるひとつのフォーマットで表現されたメタデータ
 OAI-PMHの要求に対して,XMLでコード化されたバイ
ト・ストリームとして返戻される
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
12
アイテムとレコードの関連図
ダブリンコア
ダブリンコア形式
のレコードを要求
レコード
ハーベスタ1
アイテム
スキーマA
スキーマA形式
のレコードを要求
レコード
ハーベスタ2
リポジトリ
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
13
セットと選択的収集
 セット
選択的収集のために複数のアイテムをグルー
ピングする概念
必須ではない
 選択的収集
セットと日付スタンプを指定して,選択的にメタ
データを収集することが可能
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
14
プロトコルの特徴
 HTTP要求
 OAI-PMHの要求は,HTTPのGETもしくはPOSTを使っ
て送信される
 XML応答
 OAI-PMHの要求に対する応答は,全てXMLでエン
コードされ,文字コードにはUTF-8が使用される
 メタデータ・フォーマット
 OAI-PMHは複数のメタデータ・フォーマットでのレコー
ドの送信をサポート
 限定詞なしのダブリンコア(Simple DublinCore)での
送信は必須
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
15
OAI-PMH要求
 GetRecord
 リポジトリから個々のメタデータ・レコードを取得する
 Identify
 リポジトリに関する情報を取得する
 ListIdentifiers
 リポジトリからレコード中のヘッダー情報のみを取得する
 ListMetadataFormats
 リポジトリにおける利用可能なメタデータ・フォーマットの一覧を
取得する
 ListRecords
 リポジトリから条件に合致するレコード全てを取得する
 ListSets
 リポジトリのセット構造を取得する
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
16
要求サンプル(GetRecord)
ベースURL
http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0?
要求の種別
verb=GetRecord&
metadataPrefix=oai_dc&
identifier=oai:mitizane.ll.chiba-u.jp:00020115
引数
リポジトリ(http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0)から
識別子oai:mitizane.ll.chiba-u.jp:00020115のレコードを
oai_dcのメタデータフォーマットで取得せよ
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
17
要求・応答例
 OAI Repository Explorer
http://oai.dlib.vt.edu/cgibin/Explorer/oai2.0/testoai
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
18
日本語訳
 OAI-PMHの日本語訳(NII)
http://www.nii.ac.jp/metadata/oai-pmh2.0/
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
19
OAI-PMHの適用事例
 関連プロジェクト
 データプロバイダ
 サービスプロバイダ
 千葉大学附属図書館の事例
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
20
関連プロジェクト
 NSDL(National Science Digital Library)
http://nsdl.org/
NSFが助成するプロジェクト
サイエンスに関する多様なデジタル・コンテン
ツを提供する電子図書館の構築をめざす
NSDLのシステム・アーキテクチャにおいて,
OAI-PMHは重要な役割を果たしている
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
21
関連プロジェクト(続き)
 メロン財団メタデータ・ハーベスティング・イニシャ
ティブ
 7機関
 助成金総額150万ドル
 課題
複数機関,複数分野にまたがる広範囲なメタデータに
基づくポータル・サービスの設計
アーカイブや特殊コレクションからのメタデータ・ハーベ
スティング
特定主題の多様なフォーマットの資料に関するメタデー
タ・ハーベスティング
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
22
関連プロジェクト(続き)
 OAIster
http://oaister.umdl.umich.edu/o/oaister/
ミシガン大学のプロジェクト
イリノイ大学が開発したハーベスタを使用
167機関から収集した1,183,995件(2003年5
月1日現在)のメタデータ・レコードの検索サー
ビスを提供
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
23
データプロバイダ
 現在,94のリポジトリがOAI-PMH(ver.2.0)
に準拠したデータプロバイダとして登録さ
れている
http://www.openarchives.org/Register/Bro
wseSites.pl
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
24
サービスプロバイダ
 OAI準拠登録サービスプロバイダ
 http://www.openarchives.org/service/listproviders.html
 ARC
 http://arc.cs.odu.edu/
 オールドドミニヨン大学が開発した複数リポジトリのクロス検索システム
 my.OAI
 http://www.myoai.com/
 OAI準拠のデータベースを統合検索するための多機能サーチエンジン
 NDLTD OAI Union Catalog
 http://rocky.dlib.vt.edu/~etdunion/cgi-bin/index.pl
 電子学位論文ネットワーク(Networked Digital Library of Theses and
Dissertations: NDLTD)のOAI版総合目録
 SCIRUS
 http://www.scirus.com/
 エルゼビア社が開発した学術文献に特化したサーチエンジン。OAIPMHによって収集されたメタデータを含む
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
25
千葉大学におけるプロジェクト
 千葉大学学術情報リポジトリ・プロトタイプ
の構築
学術機関リポジトリ(Institutional Repository)
の一種
千葉大学内で生産された電子的な知的生産
物(学術論文,学位論文,プレプリント,統計・
実験データ,教材,ソフトウェアなどの学術情
報)を蓄積,保存し,学内外に発信するための
インターネット上の保存書庫
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
26
NIIとのOAI連携概念図
千葉大学
国立情報学研究所
世界に向けた情報発信
JuNii
検索インターフェイス
図書館
・リポジトリ管理
・メタデータ管理
・ライセンス管理
・長期保存
・既存資料(紙媒体)
の電子化
OAI-PMHのよるメタデータ連携
千葉大学
学術情報リポジトリ
(仮称)
メタデータ
データベース
コンテンツ
投稿システム
論文
プレプリント
ファクトデータ
ソフトウェア
データベース
学位論文
電子教材
学内研究者等
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
27
Z39.50とOAI-PMH
 目的の違い
 横断検索システム構築における長短
 相互補完的な仕組み
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
28
目的の違い
 共に分散サーバ(リポジトリ)間の相互運
用性を確立するための規格とみなされて
いるが...
 目的が違う
Z39.50は情報検索用のプロトコル
OAI-PMHはメタデータ収集のためのプロトコ
ル
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
29
横断検索システム構築における長短
 Z39.50
 OAI-PMH
 分散型
 集中型
 実装コスト(高)
 実装コスト(低)
 検索機能が豊富
 検索機能なし(サービスプ
 レスポンスはサーバの性
ロバイダが用意する必要
あり)
 レスポンスの問題は少ない
 スケーラビリティの問題は
少ない
 タイムラグの問題あり(収
集頻度に依存)
能,ネットワークの渋滞度
の影響を受ける
 スケーラビリティに限界
 タイムラグなし
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
30
相互補完的な仕組み
 コミュニティ内の複数リポジトリからメタデータをOAI-PMHで
収集
 統合データベースにZ39.50ターゲット機能を実装して検索
サービスを提供
 事例
 RDN ResourceFinder
 http://www.rdn.ac.uk/
 RDNは英国のサブジェクト・ゲートウェイのネットワーク
 参加サブジェクト・ゲートウェイからOAI-PMHによってメタ
データを収集し,ResourceFinderという統合データベース
を構築し,Z39.50による検索サービスを提供。
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
31
NIIメタデータデータベースと
OAI-PMH
 サービスプロバイダとしてのNII-MDDB
 データプロバイダとしてのNII-MDDB
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
32
サービスプロバイダとしての
NIIメタデータデータベース
ナショナル・リポジトリ
NIIメタデータ
データベース
OAI-PMHによるメタデータ・ハーベスティング
A大学
B大学
学術機関リポジトリ
D研究所
C大学
学術機関リポジトリ
学術機関リポジトリ
学術機関リポジトリ
論文
教材
論文
教材
論文
教材
論文
教材
データ
ソフトウェア
データ
ソフトウェア
データ
ソフトウェア
データ
ソフトウェア
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
33
データプロバイダとしての
NIIメタデータデータベース
データプロバイダ
NIIメタデータ
データベース
サービスプロバイダ
OAI-PMHによる
選択的収集
各種
ポータル
サービス
利用者
登録処理
直接入力
2003/6/17
個別収集
OAI-PMH
収集
ライブラリーシステム研究会(慶応大学三田図書館)
34
おわりに:開発メーカーの皆さんへ
のお願い
 OAI-PMH関連ツールのオープンソース化
 リポジトリ関連ツール
 OAIB
 Access,Oracle,MySQL等のリレーショナル・データベースに蓄積され
たメタデータをハーベスタに開示するためのツール
 http://dlt.ncsa.uiuc.edu/oaib/
 OAICat(OCLC)
 http://www.oclc.org/research/software/oai/cat.shtm
 DSpace
 http://www.dspace.org/
 EPrints.org
 http://www.eprints.org/
 ハーベスタ
 OAIHarvester(OCLC)
 http://www.oclc.org/research/software/oai/harvester.shtm
 付加価値サービスのためのソフトウェアで競争
2003/6/17
ライブラリーシステム研究会(慶応大学三田図書館)
35