メタデータ

メタデータ
定義
• データに関するデータ。
• 広義では図書館目録もメタデータの一種である
が、事実上ネットワーク情報資源を対象として使
われる。
• 図書館目録的なメタデータは、記述メタデータと
いい、多くのメタデータのひとつに過ぎない。
メタデータの種類
 管理メタデータ
情報資源の収集に関わる情報やメタデータの登録・更新
情報
 記述メタデータ
情報資源を特定し、検索するためのもの
 保存メタデータ
コンテンツの作成履歴、保存システムで受け入れた日付
等の情報
 権利メタデータ
情報資源の利用に関する情報を扱う
 技術メタデータ
情報資源を再生するために必要な技術情報
メタデータの種類(続き)
 現実のメタデータは、例えば記述メタデータと権
利メタデータというように、いくつかの要素を含ん
でいる。
 1つの情報資源に対し、複数のメタデータが作ら
れることも多い。
 METS (Metadata Encoding & Transmission
Standard) 1つの情報資源に対する複数のメタ
データを管理する仕組み。LCが開発したスキー
マ。
ダブリンコア
 代表的な記述メタデータ。
 Dublin Core Metadata Element Setの略。
 DCMI (Dublin Core Metadata Initiative)が管理す
る。
 図書館界を中心にネットワーク情報資源を記述
するのに広く用いられている。
 2003年には、ISO15386として国際規格に採用。
 15種類の粗い項目が定義されている。
ダブリンコア(続き)
(1)タイトル Title
(2)著者あるいは作者 Creator
(3)主題およびキーワード Subject
(4)内容記述 Description
(5)公開者(出版者) Publisher
(6)寄与者 Contributor
(7)日付 Date
(8)資源タイプ Type
(9)形式 Format
(10)資源識別子 Identifier
(13)関係 Relation
(11)情報源(出所)Source
(14)対象範囲(空間的・時間的)
(12)言語 Language
(15)権利関係 Rights
ダブリンコアの特徴と批判(1)
①15の記述要素それぞれの記載方法には特に決
まった書式はなく、自由記述方式である。
②データ要素が非常におおざっぱであり、精密な
データの記述を行おうとするものではない。
③図書館界や博物館界、文書館界等を越えた枠
組み相互のデータ互換として、都合がよいという
見解もある。
④セマンティックスのみを定め、シンタックスに関し
ては他の基準を採用する。
XMLとRDFが推奨されている。
ダブリンコアの特徴と批判(2)
⑤情報専門家ではない情報資源の作成者自身が
付与しうるというねらいもある。
⑥CreatorとContributorがなぜ分離しているのか
SubjectとCoverageとでは重なりがある。
⑦DCQ(Dublin Core Qualified)とDCS(Dublin Core
Simplified)がある。
qualifier(限定子)を使う場合をDCQといい、ダム
ダウン原則(Dumb-Down Principle)を持つ。
目録におけるセマンティックスとシンタックス
メタデータの出現を契機として、目録におけるセマン
ティックスとシンタックスという区分が意識されるよ
うになった。
○セマンティックス
目録データの記載内容を論じる観点である。記述
対象に関して、どのような要素をどのような基準に
もとづいて選択し、採用するかという問題。
○シンタックス
採用した記述要素を、どのような順序でどのような
書式で表現するかという問題。
セマンティックスとシンタックス(続)
 ダブリンコアの場合は、セマンティックスのみを規
定し、それをどのような順序でどのような識別方
法で記載するかは一切規定しない。その部分は、
別途XML等のマークアップ言語やRDFといったシ
ンタックス専用の書式を用いて行う。
 メタデータといっても多くの種類があり、千差万別
セマンティックス、シンタックス両方を備えるようなメ
タデータも存在する(例:TEIヘッダ)。
RDF (Resource Description Framework)
メタデータを記述するための汎用的な枠組
み。主としてXMLを用いて記録される。
Web上の資源をRDF/XMLの書式により記
述することにより、コンピュータはWeb資源
を汎用的書式で把握することが出来る。こ
れを利用してWeb資源を、検索などさまざ
まな方面で利用することが行われている。
RDFで定める記述要素の定義は、RDF
Schemaという書式を用いて行われる。
FRBR
 Functional requirements for bibliographic records :
final report (1998)
IFLA研究グループによる『書誌的記録の機能要
件』
・1980年代の情報処理分野における「実体関連分
析」(E-R分析)手法を用い、利用者の観点から目
録の機能要件モデルを提示したもの。
・記述対象等を「実体」entityとしてモデル化する。次
に各実体がもつ「属性」、各実体間の「関係」をモ
デル化する。
FRBRにおける記述対象としての4実体