OAI-PMHの適用事例

OAI-PMHの適用事例
-千葉大学学術情報リポジトリとNIIメタ
データ・データベースとの相互運用-
千葉大学附属図書館
尾城 孝一
[email protected]
2003/11/14
NII総合目録データベース研修
1
アウトライン
 はじめに
 メタデータ・ハーベスティングとその意義
 OAI-PMH
 プロトコルの紹介
 適用事例
 海外の事例
 国内の事例(千葉大学-NII)
 OAI-PMHによるメタデータ連携
 おわりに
 課題と展望
2003/11/14
NII総合目録データベース研修
2
現在の電子情報環境の問題点
多様な電子情報資源
eプリント
利用者の悩み
•何がどこに?
•どのようにアクセ
スするのか?
•まとめて検索
できない
図書館
目録
貴重書DB
EJ
画像DB
2003/11/14
NII総合目録データベース研修
3
メタデータ・ハーベスティングによる解決
多様な電子情報資源
eプリント
統合
メタデータ
DB
メ
タ
デ
ー
タ
・
ハ
ー
ベ
ス
テ
ィ
ン
グ
図書館
目録
貴重書DB
EJ
画像DB
2003/11/14
NII総合目録データベース研修
4
OAIとは
 OAI(Open Archives Initiative)
 http://www.openarchives.org/
 「メタデータ・ハーベスティング」を通じて多様な電子
情報サーバ間の相互運用を促進することを目的と
した国際的な運動
 Open?
 「無償」ではなく「開かれたシステム」
 Archive?
 厳密な意味での「アーカイブ」(保存庫)ではなく,広
い意味での電子情報を蓄積するためのサーバ
2003/11/14
NII総合目録データベース研修
5
OAIの歴史
 1999年10月(サンタフェ会議)
eプリント・アーカイブ(無償でアクセスできる電
子論文サーバ)の代表者の集まり
メタデータ・ハーベスティングに基づくフレーム
ワーク(サンタフェ協定)
OAIの結成
2003/11/14
NII総合目録データベース研修
6
OAIの歴史(続き)
 2000年8月
DLF(Digital Library Federation)とCNI
(Coalition of Networked Information)が支
援表明
対象範囲の拡大(eプリント・アーカイブ→各種
電子コンテンツのサーバ)
2003/11/14
NII総合目録データベース研修
7
OAIの歴史(続き)
 2001年1月
メタデータ・ハーベスティング・プロトコル
(Open Archives Initiative Protocol for
Metadata Harvesting: OAI-PMH) Ver.1.0が
制定
メタデータを刈り取る側と刈り取られる側の間
の約束事(規約)
 2002年6月
OAI-PMH Ver.2.0発表
2003/11/14
NII総合目録データベース研修
8
OAI-PMHフレームワークの構成者
 データプロバイダ
電子情報サーバを維持し,OAI-PMHによりメ
タデータを開示する
 サービスプロバイダ
OAI-PMHを使用してデータプロバイダから収
集したメタデータに基づき,付加価値のある
サービスを提供する
2003/11/14
NII総合目録データベース研修
9
リポジトリとハーベスタ
 リポジトリ
 OAI-PMHの要求に対して応答することのできる
ネットワークアクセス可能なサーバ
 メタデータを開示するために,データプロバイダが
管理する
 ハーベスタ
 OAI-PMH要求を発行するクライアント・アプリケー
ション
 サービスプロバイダがリポジトリからメタデータを
収集する手段として使用する
2003/11/14
NII総合目録データベース研修
10
データプロバイダとサービスプロバイダ
(1)
要求
メタデータ
+
(データ)
メタデータ
ハーベスタ
応答(メタデータ)
データプロバイダ
サービスプロバイダ
2003/11/14
リポジトリ
NII総合目録データベース研修
11
データプロバイダとサービスプロバイダ
(2)
要求
DP
eプリント
DP
図書館目録
DP
貴重書DB
DP
EJ
リポジトリ
リポジトリ
SP
ハーベスタ
リポジトリ
利用者
リポジトリ
応答(メタデータ)
DP
画像DB
リポジトリ
2003/11/14
NII総合目録データベース研修
12
OAIの3層モデル
クロス
検索
評価
リンキング
プロトコル層
メタデータ・ハーベスティング
eプリント
アーカイブ
2003/11/14
電子図書館
サーバ
図書館
目録
NII総合目録データベース研修
サービス層
(サービスプロバイダ)
リポジトリ
データ層
(データプロバイダ)
13
リソース-アイテム-レコード
リソース:
メタデータが指し示す「物」
デジタルでも非デジタルで
もよい
アイテム:
「阿修羅像」に関する全ての
利用できるメタデータ
ダブリンコア
メタデータ
2003/11/14
リソースに関する複数の
メタデータを格納する概
念的な入れ物
一意の識別子を持つ
レコード:
MARC
メタデータ
JuNii
メタデータ
NII総合目録データベース研修
ある特定のフォーマットで
表現されたメタデータ
XMLでコード化されやりとり
される
Simple DCは必須
14
セットと選択的収集
 セット
選択的収集のために複数のアイテムをグルー
ピングする概念
必須ではない
 選択的収集
セットと日付スタンプを指定して,選択的にメタ
データを収集することが可能
2003/11/14
NII総合目録データベース研修
15
OAI-PMH要求
要求(動詞)
機能
リポジトリに関する情報を取得する
リポジトリに Identify
関する情報
を得るため ListMetadataFormats リポジトリにおける利用可能なメタ
データ・フォーマットの一覧を取得す
の要求
る
ListSets
リポジトリのセット構造を取得する
ListIdentifiers
メタデータ
収集のため
の要求
ListRecords
GetRecord
2003/11/14
リポジトリからレコード中のヘッダー
情報のみを取得する
リポジトリから条件に合致するレコー
ドを全て取得する
リポジトリから個々のレコードを取得
する
NII総合目録データベース研修
16
プロトコルの特徴
 簡潔で「敷居の低い」プロトコル
機能の制限
 既存の標準の流用→実装コストの低減化
HTTP要求
OAI-PMHの要求は,HTTPのGETもしくはPOSTを
使って送信される
XML応答
OAI-PMHの要求に対する応答は,全てXMLでエン
コードされ,文字コードにはUTF-8が使用される
2003/11/14
NII総合目録データベース研修
17
使用例(GetRecord)
ベースURL
http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0?
要求の種別
verb=GetRecord&
metadataPrefix=oai_dc&
identifier=oai:mitizane.ll.chiba-u.jp:00020115
引数
リポジトリ(http://mitizane.ll.chiba-u.jp/cgi-bin/oai/oai2.0)から
識別子oai:mitizane.ll.chiba-u.jp:00020115のレコードを
oai_dcのメタデータフォーマットで取得せよ
2003/11/14
NII総合目録データベース研修
18
要求・応答の実際
 OAI Repository Explorer
http://oai.dlib.vt.edu/cgibin/Explorer/oai2.0/testoai
2003/11/14
NII総合目録データベース研修
19
OAI-PMHを理解するために
 OAI-PMHの日本語訳(NII)
http://www.nii.ac.jp/metadata/oai-pmh2.0/
 OAI for Beginners - the Open Archives
Forum online tutorial
http://www.oaforum.org/tutorial/
NIIによる日本語化の計画あり
2003/11/14
NII総合目録データベース研修
20
データプロバイダ
 現在(2003年10月29日),121のリポジトリ
がOAI-PMH(ver.2.0)に準拠したデータプ
ロバイダとして登録されている
http://www.openarchives.org/Register/Bro
wseSites.pl
2003/11/14
NII総合目録データベース研修
21
サービスプロバイダ
 現在(2003年10月29日),16のサービス
がOAI準拠のサービスプロバイダとして登
録されている
http://www.openarchives.org/service/listpr
oviders.html
2003/11/14
NII総合目録データベース研修
22
関連プロジェクト
 NSDL(National Science Digital Library)
http://nsdl.org/
NSFが助成するプロジェクト
サイエンスに関する多様なデジタル・コンテン
ツを提供する電子図書館の構築をめざす
NSDLのシステム・アーキテクチャにおいて,
OAI-PMHは重要な役割を果たしている
2003/11/14
NII総合目録データベース研修
23
関連プロジェクト(続き)
 メロン財団メタデータ・ハーベスティング・イニシャ
ティブ
 7機関
 助成金総額150万ドル
 課題
複数機関,複数分野にまたがる広範囲なメタデータに
基づくポータル・サービスの設計
アーカイブや特殊コレクションからのメタデータ・ハーベ
スティング
特定主題の多様なフォーマットの資料に関するメタデー
タ・ハーベスティング
2003/11/14
NII総合目録データベース研修
24
関連プロジェクト(続き)
 OAIster
http://oaister.umdl.umich.edu/o/oaister/
ミシガン大学のプロジェクト
イリノイ大学が開発したハーベスタを使用
203機関から収集した1,723,003件(2003年
10月1日現在)のメタデータ・レコードの検索
サービスを提供
2003/11/14
NII総合目録データベース研修
25
千葉大学学術情報リポジトリとは
 学術機関リポジトリ(Institutional
Repository)の一種
 千葉大学内で生産された電子的な知的生
産物(学術論文,学位論文,プレプリント,
統計・実験データ,教材,ソフトウェアなど
の学術情報)を蓄積,保存し,学内外に発
信するためのインターネット上の保存書庫
2003/11/14
NII総合目録データベース研修
26
システム概念図
情報発信
検索インターフェイス
・リポジトリ管理
・メタデータ管理
・長期保存
・既存資料(紙媒体)
の電子化
千葉大学
学術情報リポジトリ
(仮称)
図書館
コンテンツ登録
学術論文
プレプリント
実験・統計データ
ソフトウェア
データベース
学位論文
電子教材
学内研究者等
2003/11/14
NII総合目録データベース研修
27
NIIメタデータ・データベース
共同構築事業
 大学からの情報発信支援
 メタデータの共同分担入力→メタデータ・
データベースの構築
直接入力
既存メタデータの一括登録
 GeNii/JuNiiでの公開
2003/11/14
NII総合目録データベース研修
28
OAI-PMHによるメタデータ連携
NII
千葉大学
情報発信
検索インターフェイス
・リポジトリ管理
・メタデータ管理
・長期保存
・既存資料(紙媒体)
の電子化
千葉大学
学術情報リポジトリ
(仮称)
図書館
JuNii
メタデータ連携
OAI-PMH
メタデータ
データベース
コンテンツ登録
学術論文
プレプリント
実験・統計データ
ソフトウェア
データベース
学位論文
電子教材
学内研究者等
2003/11/14
NII総合目録データベース研修
29
サービスプロバイダとしての
NIIメタデータデータベース
サービスプロバイダ
NIIメタデータ
データベース
ハーベスタ
データプロバイダ
千葉大学
B大学
学術機関リポジトリ
C大学
学術機関リポジトリ
学術機関リポジトリ
D研究所
学術機関リポジトリ
論文
教材
論文
教材
論文
教材
論文
教材
データ
ソフトウェア
データ
ソフトウェア
データ
ソフトウェア
データ
ソフトウェア
2003/11/14
NII総合目録データベース研修
30
データプロバイダとしての
NIIメタデータデータベース
データプロバイダ
NIIメタデータ
データベース
サービスプロバイダ
OAI-PMHによる
選択的収集
各種
ポータル
サービス
利用者
登録処理
直接入力
2003/11/14
個別収集
OAI-PMH
収集
NII総合目録データベース研修
31
課題と展望
 OAI-PMHの可能性
 分散・統合型総合目録の形成
 各種ポータルサービスへの応用
 相互運用性に対する意識の向上
 電子情報資源(データベース,電子図書館サーバ,リ
ポジトリ等)をインターネット上の「孤島」に終わらせな
いために
 OAI-PMHの普及
 広報・宣伝活動の必要性
 関連ソフトウェアのオープン・ソース化
 OAI関連ツール
 http://www.openarchives.org/tools/
2003/11/14
NII総合目録データベース研修
32
OAI-PMHに関する情報源
 http://www.nii.ac.jp/metadata/oai-pmh/
2003/11/14
NII総合目録データベース研修
33