OAI-PMHの適用事例

OAI-PMHの適用事例
-千葉大学学術情報リポジトリとNIIメタ
データ・データベースとの相互運用-
千葉大学附属図書館
尾城 孝一
[email protected]
2003/10/3
NII総合目録データベース研修
1
アウトライン
 OAI-PMH
 適用事例
千葉大学学術情報リポジトリ計画
NIIメタデータ・データベース共同構築事業
OAI-PMHによるメタデータ連携
 課題と展望
2003/10/3
NII総合目録データベース研修
2
OAIとは
 OAI(Open Archives Initiative)
 http://www.openarchives.org/
 「メタデータ・ハーベスティング」を通じて多様な電子図
書館間の相互運用を促進することを目的とした国際
的な運動
 Open?
 「無償」ではなく「開かれたシステム」
 Archive?
 厳密な意味での「アーカイブ」(保存庫)ではなく,広い
意味での電子情報を蓄積するためのリポジトリ(サー
バ)
2003/10/3
NII総合目録データベース研修
3
OAIの歴史
 1999年10月(サンタフェ会議)
eプリント・アーカイブの相互運用性の確立
メタデータ・ハーベスティングに基づくフレーム
ワーク(サンタフェ協定)
OAIの結成
2003/10/3
NII総合目録データベース研修
4
OAIの歴史(続き)
eプリント・アーカイブ
arXiv.org
物理学
CogPrints
認知科学
NCSTRL
コンピュータ科学
利用者
2003/10/3
NII総合目録データベース研修
NDLTD
学位論文
RePEC
経済学
5
OAIの歴史(続き)
eプリント・アーカイブ
利用者
2003/10/3
統合
メタデータ
DB
メ
タ
デ
ー
タ
・
ハ
ー
ベ
ス
テ
ィ
ン
グ
arXiv.org
物理学
CogPrints
認知科学
NCSTRL
コンピュータ科学
NII総合目録データベース研修
NDLTD
学位論文
RePEC
経済学
6
OAIの歴史(続き)
 2000年8月
DLF(Digital Library Federation)とCNI
(Coalition of Networked Information)が支
援表明
対象範囲の拡大(eプリント・アーカイブ→各種
電子コンテンツのリポジトリ)
2003/10/3
NII総合目録データベース研修
7
OAIの歴史(続き)
 2001年1月
メタデータ・ハーベスティング・プロトコル
(Open Archives Initiative Protocol for
Metadata Harvesting: OAI-PMH) Ver.1.0が
制定
 2002年6月
OAI-PMH Ver.2.0発表
2003/10/3
NII総合目録データベース研修
8
OAI-PMHとは
 基本的概念と定義
OAIフレームワークの構成者
リポジトリとハーベスタ
アイテムとレコード
セットと選択的収集
 OAI-PMH要求
 プロトコルの特徴
2003/10/3
NII総合目録データベース研修
9
OAI-PMHフレームワークの構成者
 データプロバイダ
リポジトリを維持し,OAI-PMHによりメタデータ
を開示する
 サービスプロバイダ
OAI-PMHを使用してデータプロバイダから収
集したメタデータに基づき,付加価値のある
サービスを提供する
2003/10/3
NII総合目録データベース研修
10
リポジトリとハーベスタ
 リポジトリ
 OAI-PMHの要求に対して応答することのできる
ネットワークアクセス可能なサーバ
 ハーベスタに対してメタデータを開示するために,
データプロバイダが管理する
 ハーベスタ
 OAI-PMH要求を発行するクライアント・アプリケー
ション
 サービスプロバイダがリポジトリからメタデータを
収集する手段として使用する
2003/10/3
NII総合目録データベース研修
11
リポジトリとハーベスタの関連図
データプロバイダ
各種要求,収集条件,
メタデータのフォーマット等の指定
サービスプロバイダ
要求
リポジトリ
ハーベスタ
応答
利用可能なメタデータフォーマット,
リポジトリの情報,メタデータレコード等
2003/10/3
NII総合目録データベース研修
12
OAIの3層モデル
クロス
検索
評価
リンキング
プロトコル層
メタデータ・ハーベスティング
eプリント
アーカイブ
2003/10/3
電子図書館
サーバ
OPAC
NII総合目録データベース研修
サービス層
(サービスプロバイダ)
リポジトリ
データ層
(データプロバイダ)
13
アイテムとレコード
 アイテム
 リポジトリの構成要素
 あるひとつのリソースに関するメタデータを複数の
フォーマットで蓄積する概念的な容れ物(コンテナ)
 アイテムに包含されるさまざまなフォーマットのメタ
データは,OAI-PMHを通じてレコードとして収集される
 リポジトリのなかでアイテムを一意に同定する識別子
を持つ
 レコード
 あるひとつのフォーマットで表現されたメタデータ
 OAI-PMHの要求に対して,XMLでコード化されたバイ
ト・ストリームとして返戻される
2003/10/3
NII総合目録データベース研修
14
アイテムとレコードの関連図
ダブリンコア
ダブリンコア形式
のレコードを要求
レコード
ハーベスタ1
アイテム
スキーマA
スキーマA形式
のレコードを要求
レコード
ハーベスタ2
リポジトリ
2003/10/3
NII総合目録データベース研修
15
セットと選択的収集
 セット
選択的収集のために複数のアイテムをグルー
ピングする概念
必須ではない
 選択的収集
セットと日付スタンプを指定して,選択的にメタ
データを収集することが可能
2003/10/3
NII総合目録データベース研修
16
OAI-PMH要求
リポジトリに
関する情報
を得るため
の要求
メタデータ収
集のための
要求
2003/10/3
要求(動詞)
機能
Identify
リポジトリに関する情報を取得する
ListMetadataFormats
リポジトリにおける利用可能なメタデー
タ・フォーマットの一覧を取得する
ListSets
リポジトリのセット構造を取得する
ListIdentifiers
リポジトリからレコード中のヘッダー情
報のみを取得する
ListRecords
リポジトリから条件に合致するレコード
を全て取得する
GetRecord
リポジトリから個々のレコードを取得す
る
NII総合目録データベース研修
17
プロトコルの特徴
 簡潔で「敷居の低い」プロトコル
 機能の制限
 既存の標準の流用→実装コストの低減化
 HTTP要求
 OAI-PMHの要求は,HTTPのGETもしくはPOSTを使って送信され
る
 XML応答
 OAI-PMHの要求に対する応答は,全てXMLでエンコードされ,文
字コードにはUTF-8が使用される
 メタデータ・フォーマット
 OAI-PMHは複数のメタデータ・フォーマットでのレコードの送信を
サポート
 限定詞なしのダブリンコア(Simple DublinCore)での送信は必須
2003/10/3
NII総合目録データベース研修
18
使用例(GetRecord)
ベースURL
http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0?
要求の種別
verb=GetRecord&
metadataPrefix=oai_dc&
identifier=oai:mitizane.ll.chiba-u.jp:00020115
引数
リポジトリ(http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0)から
識別子oai:mitizane.ll.chiba-u.jp:00020115のレコードを
oai_dcのメタデータフォーマットで取得せよ
2003/10/3
NII総合目録データベース研修
19
要求・応答の実際
 OAI Repository Explorer
http://oai.dlib.vt.edu/cgibin/Explorer/oai2.0/testoai
2003/10/3
NII総合目録データベース研修
20
日本語訳
 OAI-PMHの日本語訳(NII)
http://www.nii.ac.jp/metadata/oai-pmh2.0/
2003/10/3
NII総合目録データベース研修
21
データプロバイダ
 現在,115のリポジトリがOAI-PMH
(ver.2.0)に準拠したデータプロバイダとし
て登録されている
http://www.openarchives.org/Register/Bro
wseSites.pl
2003/10/3
NII総合目録データベース研修
22
サービスプロバイダ
 現在,16のサービスがOAI準拠のサービ
スプロバイダとして登録されている
http://www.openarchives.org/service/listpr
oviders.html
2003/10/3
NII総合目録データベース研修
23
関連プロジェクト
 NSDL(National Science Digital Library)
http://nsdl.org/
NSFが助成するプロジェクト
サイエンスに関する多様なデジタル・コンテン
ツを提供する電子図書館の構築をめざす
NSDLのシステム・アーキテクチャにおいて,
OAI-PMHは重要な役割を果たしている
2003/10/3
NII総合目録データベース研修
24
関連プロジェクト(続き)
 メロン財団メタデータ・ハーベスティング・イニシャ
ティブ
 7機関
 助成金総額150万ドル
 課題
複数機関,複数分野にまたがる広範囲なメタデータに
基づくポータル・サービスの設計
アーカイブや特殊コレクションからのメタデータ・ハーベ
スティング
特定主題の多様なフォーマットの資料に関するメタデー
タ・ハーベスティング
2003/10/3
NII総合目録データベース研修
25
関連プロジェクト(続き)
 OAIster
http://oaister.umdl.umich.edu/o/oaister/
ミシガン大学のプロジェクト
イリノイ大学が開発したハーベスタを使用
197機関から収集した1,538,431件(2003年8
月28日現在)のメタデータ・レコードの検索
サービスを提供
2003/10/3
NII総合目録データベース研修
26
千葉大学学術情報リポジトリとは
 学術機関リポジトリ(Institutional
Repository)の一種
 千葉大学内で生産された電子的な知的生
産物(学術論文,学位論文,プレプリント,
統計・実験データ,教材,ソフトウェアなど
の学術情報)を蓄積,保存し,学内外に発
信するためのインターネット上の保存書庫
2003/10/3
NII総合目録データベース研修
27
システム概念図
情報発信
検索インターフェイス
・リポジトリ管理
・メタデータ管理
・長期保存
・既存資料(紙媒体)
の電子化
千葉大学
学術情報リポジトリ
(仮称)
図書館
コンテンツ登録
学術論文
プレプリント
実験・統計データ
ソフトウェア
データベース
学位論文
電子教材
学内研究者等
2003/10/3
NII総合目録データベース研修
28
NIIメタデータ・データベース
共同構築事業
 大学からの情報発信支援
 メタデータの共同分担入力→メタデータ・
データベースの構築
直接入力
既存メタデータの一括登録
 GeNii/JuNiiでの公開
2003/10/3
NII総合目録データベース研修
29
OAI-PMHによるメタデータ連携
NII
千葉大学
情報発信
検索インターフェイス
・リポジトリ管理
・メタデータ管理
・長期保存
・既存資料(紙媒体)
の電子化
千葉大学
学術情報リポジトリ
(仮称)
図書館
JuNii
メタデータ連携
OAI-PMH
メタデータ
データベース
コンテンツ登録
学術論文
プレプリント
実験・統計データ
ソフトウェア
データベース
学位論文
電子教材
学内研究者等
2003/10/3
NII総合目録データベース研修
30
サービスプロバイダとしての
NIIメタデータデータベース
サービスプロバイダ
NIIメタデータ
データベース
OAI-PMHによるメタデータ・ハーベスティング
データプロバイダ
A大学
B大学
学術機関リポジトリ
C大学
学術機関リポジトリ
学術機関リポジトリ
D研究所
学術機関リポジトリ
論文
教材
論文
教材
論文
教材
論文
教材
データ
ソフトウェア
データ
ソフトウェア
データ
ソフトウェア
データ
ソフトウェア
2003/10/3
NII総合目録データベース研修
31
データプロバイダとしての
NIIメタデータデータベース
データプロバイダ
NIIメタデータ
データベース
サービスプロバイダ
OAI-PMHによる
選択的収集
各種
ポータル
サービス
利用者
登録処理
直接入力
2003/10/3
個別収集
OAI-PMH
収集
NII総合目録データベース研修
32
課題と展望
 OAI-PMHの可能性
 分散・統合型総合目録の形成
 各種ポータルサービスへの応用
 相互運用性に対する意識の向上
 電子情報資源(データベース,電子図書館サーバ,リ
ポジトリ等)をインターネット上の「孤島」に終わらせな
いために
 OAI-PMHの普及
 広報・宣伝活動の必要性
 関連ソフトウェアのオープン・ソース化
 OAI関連ツール
 http://www.openarchives.org/tools/
2003/10/3
NII総合目録データベース研修
33
OAI-PMHに関する情報源
 http://www.nii.ac.jp/metadata/oai-pmh/
2003/10/3
NII総合目録データベース研修
34