Z39.50を利用したデータベースの自動分類の試み

2001年5月19日
情報知識学会第9回研究報告会
情報共有による
Z39.50データベース選択支援環境
江草由佳,高久雅生,宇陀則彦,石塚英弘
図書館情報大学
研究の背景
• Z39.50
– 情報検索のための通信プロトコル
– Z39.50を利用することにより異なるシステム間で
の相互運用が可能
• 様々なZ39.50データベースの存在
– OPAC
– 書誌データベース
– 抄録、新聞記事データベース
• データベースの選択が困難
既存のシステム(1)
• WWW-Z39.50ゲートウエイシステム
長所
– WWWブラウザから検索可能
– 多くのデータベースを登録
– データベースを分野ごとに分類して配列
短所
– 利用者の好みによってカスタマイズできない
– 利用者自身によるデータベースの追加、削除
ができない
既存のシステム(2)
• Z39.50クライアント
長所
– 多くのデータベースを登録
– 利用者の好みによってカスタマイズ可能
– データベースの追加、削除可能
短所
– 接続情報の更新の手間がかかる
– 利用者自身で組織化しなければならない
研究の目的
• Z39.50データベース選択支援環境
– Z39.50データベースに関する情報を共有
– 共有した情報の中からすぐに検索に移れる
– データベースリンク集
– WWW-Z39.50クライアント
Z39.50データベース選択支援環境
作成
WWWによる
情報共有空間
作成
データベース
提供者
図書館員
参照
作成
参照
利用者
検索
A
検索
本システム
データの流れ
URL参照
Z39.50データベース
利用者
B
WWWの枠組み
• 情報共有システム
– 個人や組織が作成したコンテンツをお互いに利用できる
点に優れている。
• Z39.50用URL
– Z39.50データベースを一意に表現
– 書式
z39.50s://ホスト名[:ポート番号]/データベース名
– 例
図書館情報大学ディジタル図書館 opac データベース
z39.50s://lib.ulis.ac.jp:210/opac
データベースリンク集の例
<html> <head> <title>医学関連のデータベースリスト</title> </head>
<body>
<h1>医学関連のデータベースリスト</h1>
※ OCLCの無料アクセス可能なデータベースは最近一年分のみの提供。
<ul>
<li><a href="z39.50s://Tikal.dev.oclc.org/Medline">MEDLINE</a><br>
医学の全領域にわたる文献DB。収録範囲は9,000雑誌以上。(OCLC,
FirstSearch)
<li><a href="z39.50s://Tikal.dev.oclc.org/AidsCancerResearch">
Aids and Cancer research</a><br>
エイズ・癌研究に関する文献DB。収録範囲は2,440雑誌以上。(OCLC,
FirstSearch)
<li><a href="z39.50s://Tikal.dev.oclc.org/MDX_Health">
MDX Health</a><br>
医学・薬学・生理学文献の引用・抄録DB。(OCLC, FirstSearch)
</ul>
</body> </html>
予稿集 図3
データベースリンク集の例
<html> <head> <title>医学関連のデータベースリスト</title> </head>
<body>
<h1>医学関連のデータベースリスト</h1>
※ OCLCの無料アクセス可能なデータベースは最近一年分のみの提供。
<ul>
<li><a href="z39.50s://Tikal.dev.oclc.org/Medline">MEDLINE</a><br>
医学の全領域にわたる文献DB。収録範囲は9,000雑誌以上。(OCLC,
FirstSearch)
<li><a href="z39.50s://Tikal.dev.oclc.org/AidsCancerResearch">
Aids and Cancer research</a><br>
エイズ・癌研究に関する文献DB。収録範囲は2,440雑誌以上。(OCLC,
FirstSearch)
<li><a href="z39.50s://Tikal.dev.oclc.org/MDX_Health">
MDX Health</a><br>
医学・薬学・生理学文献の引用・抄録DB。(OCLC, FirstSearch)
</ul>
</body> </html>
予稿集 図3
データベースリンク集の例
<html> <head> <title>医学関連のデータベースリスト</title> </head>
<body>
<h1>医学関連のデータベースリスト</h1>
※ OCLCの無料アクセス可能なデータベースは最近一年分のみの提供。
<ul>
<li><a href="z39.50s://Tikal.dev.oclc.org/Medline">MEDLINE</a><br>
医学の全領域にわたる文献DB。収録範囲は9,000雑誌以上。(OCLC,
FirstSearch)
<li><a href="z39.50s://Tikal.dev.oclc.org/AidsCancerResearch">
Aids and Cancer research</a><br>
エイズ・癌研究に関する文献DB。収録範囲は2,440雑誌以上。(OCLC,
FirstSearch)
<li><a href="z39.50s://Tikal.dev.oclc.org/MDX_Health">
MDX Health</a><br>
医学・薬学・生理学文献の引用・抄録DB。(OCLC, FirstSearch)
</ul>
</body> </html>
予稿集 図3
WWW-Z39.50クライアント
本システム
参照
利用者 検索
WWWによる
情報共有空間
WWWブラウザ
呼
び
出
し
URL
Z39.50クライアント
データの流れ
URL参照
Z39.50データベース
WWWブラウザ
HTML
ビューア
URL
URL
ハンドラ
http://…
Z39.50s://…
• 機能
– WWWブラウザの基本的機能
Z39.50
クライアント
• HTMLの取得、表示
– Z39.50用URLリンクを解析しZ39.50クライアン
トを起動
Z39.50クライアント
• 機能
– WWWブラウザから渡されたZ39.50用URLを
解析してデータベースに接続
– データベースの検索
– 検索結果の取得
– 単体のみで利用可能
データベースリンク集の作成
(データベースリンク集は存在しないため…)
1. データベースに関する情報の収集
–
–
プログラムでデータベースに関する情報の収集サイ
トから取得
人手でデータベース作成機関の公開情報などから
収集
2. Z39.50用URLに変換し、HTMLに埋め込み
–
プログラムで作成
<a href=“Z39.50s://….”> …… </a>
3. データベースリンク集の作成
–
–
プログラムでホスト名毎に並び替え
人手で分野ごとに分類
予稿集 図5
予稿集 図6
予稿集 図7
おわりに
• データベースのリンクをたどるとすぐに検索
• データベースリンク集の共有
– 各個人がデータベースリンク集を作成しなくても、
図書館員などが作成したリンク集を利用可能
– 各利用者が自分の用途に合わせたリンク集を作成
可能
• データベース選択支援環境を実現
Z39.50データベース選択支援環境
作成
WWWによる
情報共有空間
作成
データベース
提供者
図書館員
参照
作成
参照
利用者
検索
A
検索
本システム
データの流れ
URL参照
Z39.50データベース
利用者
B
Z39.50におけるデータベースの選択(1)
• 必要なこと
– データベース接続情報をクライアントに登録
• データベース接続情報が分からないとデータベースに接続できな
いため
– データベースをわかりやすく並び替える
– データベースの内容を知る
• データベースの内容が分からなければ選択できないため
• 問題点
– データベース接続情報の入力の手間
– データベース接続情報の再利用が困難
• WWW上の収集サイトやクライアント独自の形式で記述されてい
るので、それぞれの形式に変換しなければならない
– 自分でデータベースを組織化しなければならない
Z39.50におけるデータベースの選択(2)
• 解決策
全てのデータベース接続情報を収集し組織化し
て、あらかじめクライアントに登録しておく
– データベースが増加しているので、全てを登
録するのは困難
– 全ての利用者の検索要求にあった組織化は
困難
Z39.50におけるデータベースの選択
(3)
• 解決策
データベース接続情報の共有
• 利用者が収集・組織化したデータベース接続情報
を利用者同士で利用可能にする
– お互いに補完できるので全てを収集し組織化
しなくてもよい
– 個人が自由に組織化できる
WWWの枠組み
• ハイパーテキストの概念に基づく分散型情報システム
– HTTP
インターネット上でファイルの送受信を行うためのプロトコル
– HTML
機種に依存しないハイパーテキストのための文書形式
– URL
インターネット上に存在する様々なリソースを表すためのアドレス
• 情報共有システム
– 個人や組織が作成したコンテンツをお互いに利用できる点に
優れている。
WWWとZ30.50を組み合わせた
システム
• WWWゲートウエイシステム
WWWゲートウエイ ネットワーク サーバの
ユーザの ネットワーク のマシン
マシン
マシン
WWW
ゲートウエイ
Z39.50
WWW
WWW
HTTP
サーバ
サーバ Z39.50
ブラウザ
Z39.50
オリジン
・WWWブ
ラウザさえ
あればよい
処理が
集中する
・セッションがきれる
・直接Z39.50でつながっていない
本システムとプロトコル
ユーザのマシン
ネットワーク
サーバのマシン
Z39.50
クライアント
Z39.50
オリジン
Z39.50
WWW
ブラウザ
HTTP
本システム
Z39.50
サーバ
WWW
サーバ
関連システム
• WAIS
– Directory-of-servers
• データベースに関する情報を扱うデータベース
– データベースの作成は困難
– ユーザからの発信は難しい