ネットワーク情報資源の組織化

ネットワーク情報資源の組織化
整理技術研究グループ
堀池博巳、吉田暁史
1.はじめに
・膨大なネットワーク情報資源から良質の
情報資源を選択・提供するサービスは
必須
・ネットワーク情報資源の組織化のための
プロセスを概観し、問題点を検討
2.ネットワーク情報資源と発見ツール
2-1.ネットワーク情報資源の特徴
(1)情報資源の量は膨大である
(2)内容は玉石混淆である
(3)存在が不安定である
3.図書館におけるネットワーク情報資源
3-1.既存の探索ツールとその問題点
(1)一般的探索ツール
A.商用、汎用検索サービスの利用
B.リンク集の利用
C.非インターネットのツールの利用
(2)検索ツールの問題点
A.精度(precision)の欠如
B.再現率(recall ratio)の低さ
C.無関係な分野や低品質な情報資源も検索
図書館コミュニティ独自の検索システム
の構築が必要
3-2.ネットワーク情報資源と所蔵資料
一体的な検索・提供の必要性
資料/情報の提供方法
・所蔵資料の場合:
選択→収集→組織化→配架→提供→保存
・ネットワーク情報資源の場合:
選択→組織化→提供
3-3.ネットワーク情報資源を扱う上での
問題点[1]
(1)情報内容が玉石混淆→選択機能の必要性
(2)情報資源の量が膨大→協力体制の必要性
→選択機能の必要性
(3)種々の不安定性
→監視機能の必要性
(4)記録様式が多様
→目録上の問題
3-3.ネットワーク情報資源を扱う上での
問題点[2]
(5)あらゆる階層の情報資源の存在
→目録上の問題
(6)特別なツールの必要ケース→ 技術的な問題
(7)著作権処理
→利用形態の問題
3-4.問題点の対応策
・選択機能の問題
・協力体制の問題
・監視機能の問題
・目録上の問題
・技術的な問題
・利用形態の問題
→
→
→
→
→
→
選択基準の構築
多様な協力体制確立
監視機能の開発
目録原理の構築
ツールの組み込み
著作権処理など
4.サブジェクト・ゲートウェイにおける
情報資源の選択、目録等の過程
4-1.サブジェクト・ゲートウェイとは
・主題索引を施され、特に分類によって体系的
な検索が可能な、情報資源発見を支援する
インターネットサービス
4-2.ネットワーク情報資源の選択的収集
選択基準
(1)内容 的確なタイトル、概要、目的、想定される読者
などの情報の提供
(2)著者の信頼性 情報資源に責任を持つ著者の特定
(3)情報の鮮度 情報資源は更新される性質のものか
最終更新日付は示されているか
(4)ナビゲーション 情報資源全体の構成は明確か
(5)デザイン 情報資源は見た目にもわかり易いか
4-3.メタデータ・データベースの構築
(1)仕様の決定
A.ネットワーク情報資源の書誌記述方式
B.主題索引方式、典拠コントロール
C.データ収集法
D.データ選択基準の作成
E.データベースの検索インターフェースの設計
(2)メタデータの属性
A.記述的な側面
タイトル、サブタイトル、URI、著者、言語等
B.主題の側面
分類コード、件名標目、等
C.管理上の側面
資源保持者、最終更新日付、権利所有者等
(3)メンテナンスの問題
5.情報資源組織化としてのメタデータ
5-1.メタデータとは何か
・データに関するデータ
データに関する構造化されたデータ
・メタデータの対象は事実上ディジタル情報資
源特にネットワーク情報資源に限定されて
いるようである
5-2.メタデータの種類[1]
(1)利用目的によって分ける方法
A.管理的なもの(administrative)
B.記述的なもの(descriptive)
C.保存的なもの(preservation)
D.技術的なもの(technical)
E.利用的なもの(use)
5-2.メタデータの種類[2]
(2)データの複雑さ、構造化の程度によって分
ける方法
第1レベル
第2レベル
第3レベル
レコード 単純フォーマット
構造化フォーマット 高度なフォーマット
特性
独自
フルテキスト索引
新興標準
フィールド構造
国際標準
精緻なタグ付け
使用例
Lycos
AltaVista
Yahoo
Dublin Core
IAFA template
RFC 1807
SOIF
CIMI
EAD
TEI Header
MARC
5-4.図書館界に相応しいメタデータ
(1)基本的には、DLO(Document -Like Object)
文書的情報資源が中心
(2)従来の目録規則では何が困るのか
A.ファイル形式などディジタル情報特有の情報を、
適切に記述できない
B.著作権処理などの管理データを表す適切な記述
要素がない
C.データ要素の不安定さへの対応が不十分
D.タイトルや著者などが把握しにくいケースが多い
E.物的な側面を表す必要がない、あるいは表現でき
ないことが多い
(3)なぜダブリンコアか
(4)今後どうあるべきか
A.データ要素の不安定さを適切に処理する
仕組みが必要
B.物と、内容としての側面を切り分けること
により、両者を分離し、記述する枠組みを
作る
C.作業性を考慮し、必須データ要素、オプショ
ン要素といったランク付けを行う
5-5.他のコミュニティとの連携を行うた
めのメタデータの条件
(1)各コミュニティにおけるメタデータの相違
コミュニティ
主として用いられるメタデータ
図書館
MARC
文書館
EAD
博物館・美術館
CIMI
(2)コミュニティ内部および相互流通のた
めのメタデータ
コミュニティ内部
→ 詳細な第3レベル
コミュニティ間
→ 簡略な第2レベル
5-6.目録対象の階層把握と記述対象
目録対象となる階層レベル(粒度の問題)
・どのレベルで情報を記述するのか
Webサイト全体、個々のファイル、
個々の文書、文書中の章や節 など
論理的階層と物理的階層を区別して把握
階層構造の柔軟な表現
6.まとめ
6-1.情報資源の選択
6-2.所蔵資料とネットワーク情報資源の一
体的な検索・提供
6-3.協同目録作業、サブジェクトゲート
ウェイ同士の連携の必要性
6-4.メタデータに求められる要件
略語一覧
ダブリンコア
Dublin Core Metadata Element Set
TEI Text Encoding Initiative
EAD Encoded Archival Description
CIMI Consortium for the Computer
Interchange of Museum Information
(現在はCIMIが正式名称)