Z39.50とその動向 インテック・ウェブ・アンド・ゲノム・インフォマティクス 株式会社 技術部 石田 茂 1 2001.9.21 Web & Genome 内容 2 Z39.50とは何か? Z39.50はどのように使用するのか? 市場動向 Z39.50はどのように機能するのか? Z39.50とILL(図書館間相互貸借) 国内利用に向けて必要な環境(合意) Z39.50の将来 2001.9.21 Web & Genome Z39.50とは何か? ネットワークベースの情報検索プロトコル OSI参照モデル7層 - ASN.1、BER サーバ/クライアント型 ANSI/NISO Z39.50-1995 (ISO 23950:1998) NISO - National Information Standards Organization ISO - International Standards Organization 米国議会図書館にMaintenance Agency設置 3 Ray Denenberg がまとめ役 2001.9.21 Web & Genome ZIG - Z39.50 Implementors Group 4 Z39.50システムの開発者グループ 改正、修正、問題認識ならびに提起等を議論 実装者合意を作成 5ヶ月に一度の会合(北米、EU、ワシントンDC) コンセンサス主導の作業方針 2001.9.21 Web & Genome 開発経緯 1978-82 1982-83 NISOに再提出。Z39.50-1988として承認 1979-89 5 開発継続 1988 ANSI Z39に提出.Z39.50-1984.承認投票に失敗 1984-87 Linked Systems Project Protocol 1983-84 初期の開発/調査研究 Z39 SC D 2001.9.21 Web & Genome 開発経緯 1984-91 1990 6 ZIG(実装者グループ)設立 1989-90 ISO SR → ISO 10162/10163 Search & Retrieve (1993) Z39.50 Maintenance Agency設立 1992 Z39.50-1992 (version 2) version 3開発 Z39.50-1995 ISO 23950 1990-95 1995 1998 2001.9.21 Web & Genome 目的 クライアント・サーバシステム間で情報検索の相互連携性を 確保する ベンダー間の相互連携 組織間の相互連携 公共図書館と大学図書館 様々なコミュニティにおける図書館 コミュニティ間の相互連携 7 様々な図書フォーマット ユーザグループ間の相互連携 様々なDBとユーザIF 図書館、出版社、 DBサービス、美術・博物館等 2001.9.21 Web & Genome どのように使用するか? 抽象化DB 標準化されたアクセスポイント 標準化された検索式 標準化された返戻形式 8 属性集合 スキーマ 選択可能なレコード構文 返戻時にレコードの選択が可能 レコード内容に左右されない検索処理 2001.9.21 Web & Genome どのように使用するか? 抽象化されたDBは、実際のDBのフロントエ ンドとして実装される。 Z39.50クライアント アプリ 機能 9 Z39.50サーバ Z39.50 クライアント Z39.50 サーバ 2001.9.21 DB Web & Genome 補足機能 10 走査 永続的検索結果集合 定期的検索実行 蔵書注文 DB更新 仕様導出、発動 2001.9.21 Web & Genome 相互連携にみる特徴 DB毎に異なる機能 DB毎に異なる情報形式 11 アクセスポイント等の属性集合、実装特徴 US MARC, UNIMARC, SUTRS, GRS-1 所蔵情報の内包、分離 2001.9.21 Web & Genome Profile 標準仕様の使用方法に関する合意規定 12 どのアクセスポイントが有効? どの属性が有効? レコード構文には何が指定できる? どの(補足)機能が一般に利用できる? どのオプションが利用できる? 特定分野向けのデータは許容される? 2001.9.21 Web & Genome Profile例 ATS-1 GILS 13 Author, Title, Subject 初期の図書向け簡易仕様 (廃止) 行政情報所在案内サービス 汎用的な情報所在案内サービスの参照モデル 2001.9.21 Web & Genome Profile例 CIMI 14 美術館情報をコンピュータ上で交換するためのコ ンソーシアムが作成 テキスト以外に画像情報も検索対象とする CIP Catalogue Interoperability Protocol 国際的な地球観測衛星委員会が作成 地理空間情報の検索にも利用される 2001.9.21 Web & Genome Profile例 GEO STAS 15 地理空間情報を対象 科学工学向け属性集合を規定 正確にはProfileではない 2001.9.21 Web & Genome 主要な図書館向けProfile ONE CENL 16 OPAC Network Europe 1996年作成 ノルウェー、ドイツ、英国で利用 アクセスポイントと要素集合に関する最小規定 Conference of European National Librarians 1997年作成、1998年後半に批准 ONE profileの拡張版 2001.9.21 Web & Genome 主要な図書館向けProfile Finnish Z39.50 profile Danish Z39.50 profile 17 国際的なONE profileに対して、分類方式に関する国内 仕様を追加規定 CENLとONEの拡張版 2001.9.21 Web & Genome 主要な図書館向けProfile Union Catalogue Profile 18 Union catalogue向けに要求仕様を定義 オーストラリアで作成 1998年に受理 2001.9.21 Web & Genome Z39.50の難点 複雑なプロトコル 難解な用語 元はISO/OSI規格に準拠 19 TCP/IP上で実装 難解な理論ベースのプロトコル 様々な抽象化レベル 2001.9.21 Web & Genome Z39.50の難点 機能的に収斂した製品が未だ無い 今後、MozillaのRDF実装が該当? 適切な専門化が極少数 製品の長期的なサイクルを考慮 標準化の前に仕様上の十分な探索がされていない 広く普及させることで困難な問題点を解決! 20 2001.9.21 Web & Genome Z39.50の適用方法 21 サーバ(Target) ゲートウェイ クライアント(Origin) 2001.9.21 Web & Genome サーバ(Target) 抽象化DBを実装 特殊な開発作業 ツールキットのカスタマイズ サーバモジュールの準備 DBコンフィグレーション 22 Z39.50サーバ Z39.50 サーバ DB 実際のDBを抽象化DBとしてどのように表現するか? 2001.9.21 Web & Genome ゲートウェイ IFに二つの顔を持つ Z39.50サーバに対して、Z39.50クライアント として通信する顔 一般的なクライアントと通信する顔 23 クライアントプロトコルにはHTML, Telnet, Z39.50… 2001.9.21 Web & Genome Webゲートウェイ Z39.50サーバ Webブラウザ HTTP サーバ 24 ビジネス Z39.50 ロジック クライアント 2001.9.21 Web & Genome 横断的ゲートウェイ Z39.50サーバ Z39.50 クライアント Z39.50クライアント Z39.50サーバ Z39.50 サーバ ビジネス Z39.50 ロジック クライアント Z39.50 クライアント 25 2001.9.21 Z39.50サーバ Web & Genome 高度なゲートウェイ 複数のZ39.50サーバと接続する 両方のIFに様々なプロトコルに対応する 26 並列検索 連続検索 検索結果のマージ SQL, LDAP, HTML, DNS… 2001.9.21 Web & Genome 高度なゲートウェイ Z39.50サーバ Z39.50クライアント Z39.50 サーバ Z39.50 クライアント Webブラウザ SQLサーバ ビジネス SQL ロジック クライアント HTTP サーバ 専用システム 27 専用 プロトコル サーバ 2001.9.21 LDAP クライアント LDAPサーバ Web & Genome クライアント(Origin) グラフィカルなユーザIFのプロトコル処理部 ユーザから複雑さは隠されている 拡張コンフィグレーションの必要性 同時に複数のサーバに接続する場合あり Z39.50クライアント アプリ 機能 28 Z39.50 クライアント 2001.9.21 Web & Genome 市場動向 統合システム 図書館システム 海外の主要なシステムは全てZ39.50機能をもつ 専用クライアントあるいはWebゲートウェイ 小規模システムにもZ39.50を採用するものあり 多くのシステムはVersion 2 を採用する INNOPAC等の米国製システムに多い 29 2001.9.21 Web & Genome 市場動向 スタンドアロン製品 ツールキットレベル製品 システムインテグレーション・コンサルタント 30 Crossnet (UK) Fretwell-Downing (UK) Indexdata (Denmark) Sunstone (Sweden) Blueangel Technologies (US) Finsiel (Italy) 2001.9.21 Web & Genome 市場動向(国内) 主な機能 Server Web G/W NACSIS-ELS/ NII国立 情報学研究所 ○ (NII内) ○ (NII内) ○ INNOPAC/ Innovative Interface Inc. 日本IBM ○ ○ ○ ○ ○ メーカ/ サービスベンダー LibCruiser Pro/ NTT東日本 Gateway-CAT/ 丸善 JOIS with STN/ JST科学技術 振興事業団 InfoLib-Global Finder/ 日商岩井インフォコム SiteSearch/ OCLC, 紀伊国屋 ERL/ Silver Platter, 紀伊国屋 Ovid/ Ovid Technologies Inc, ユサコ Telnet G/W ○ (丸善内) ○ (JST内) ○ (JST内) ○ ○ ○ ○ ○ ○ ○ ○ ○ 日本語 ○ ○ (丸善経由) ○ Proxy ○ ○ 採用機関/特徴 早稲田大学 東京工業大学、図書館 情報大学、神戸大学 OpenText RLG Zephyer Server 大学系図書館(多数) CAS Server ○ ○ OpenText 大学系図書館(多数) ○ CharsetandLanguageNego(3) ○ UTF8/ISO2022-JP対応 NACSIS-CAT,MARC21対応 新日鉄ソリューション大分 31 外部連携 大学系図書館(多数) ○ LibVision V3(LVZ)/ 日本IBM、紀伊国屋、 検索エンジン 2001.9.21 Web & Genome Z39.50はどのように機能するか? 機能とサービス 32 機能は一つ以上のサービスから構成される 2001.9.21 Web & Genome 初期化機能 初期化サービス Z-アソシエーションの確立 クライアント 初期化要求 サーバ Version、ID/パスワード、オプション、 メッセージサイズ、実装情報 初期化応答 結果、Version、オプション、 メッセージサイズ、実装情報 33 2001.9.21 Web & Genome 初期化機能 使用可能なサービスとオプションを交渉する クライアントは“初期化要求”内のリストで様々なサー ビスを要求する サーバは自身の機能・能力と比較調整し、可能なサー ビスならびにオプションを初期化応答でクライアントに 返す 34 2001.9.21 Web & Genome 検索機能 検索サービス クライアント 検索要求 検索式タイプ、検索式、DB, 結果集合名 サーバ 検索応答 ヒット件数、返戻レコード件数、 ステータス情報、(レコード) 35 2001.9.21 Web & Genome 返戻機能 返戻サービス クライアント 返戻要求 レコード件数、開始順位、 結果集合名 サーバ 返戻応答 レコード件数、ステータス、 (レコード) 36 2001.9.21 Web & Genome 返戻機能 セグメントサービス レコードを“セグメント”することで、初期化時に設 定したメッセージサイズよりも大きいレコードを転 送することができる 二つのレベル Level 1: 一つのセグメントに複数のレコードを格納 Level 2: 一つのレコードを細分化して各セグメントに 格納 37 2001.9.21 Web & Genome 検索結果集合削除機能 削除サービス クライアント サーバ 削除要求 結果集合リスト 削除応答 ステータス 38 2001.9.21 Web & Genome アクセス制御機能 アクセス制御サービス クライアント サーバ 要求(一般) アクセス制御要求 セキュリティ申請 アクセス制御応答 セキュリティ申請応答 応答(一般) 39 2001.9.21 Web & Genome 課金・リソース制御機能 リソース制御サービス トリガリソース制御サービス リソース報告サービス 40 リソースの使用を制御、報告する複雑な機能 主に課金情報を作成するために使用される 2001.9.21 Web & Genome ソート機能 ソートサービス ソート要求 ソート対象の結果集合、 ソート済結果集合、 ソート方式 クライアント サーバ ソート応答 ステータス 41 2001.9.21 Web & Genome 走査機能 走査サービス クライアント サーバ 走査要求 DB、単語リスト、開始位置、 単語数、(ステップサイズ) 走査応答 ステータス、単語数、(単語) 42 2001.9.21 Web & Genome 拡張サービス機能 拡張サービス タスクパッケージ 43 永続的検索結果集合 永続的検索式 定期的検索実行 蔵書注文 DB更新 仕様導出、発動 拡張サービス要求を作成、修正、削除するために使用 2001.9.21 Web & Genome 説明機能 説明サービス サーバ情報のアクセス手段を提供する DB アクセスポイント 検索言語 要素集合 ... 44 2001.9.21 Web & Genome 終了処理 完了サービス 45 Z-アソシエーションを終了する 2001.9.21 Web & Genome 属性集合 使用可能な、ドメイン固有の抽象化されたア クセスポイント BIB-1 STAS 46 2001.9.21 Web & Genome 転送プロトコル TCP/IP (通常) ISO OSI 47 TCP予約ポート番号210 現在、殆ど使用されていない 2001.9.21 Web & Genome BER 基本符号化規則 Basic Encoding Rules 転送データの符号化方式 可読形式のコードではない 48 コンピュータのみ解釈可能 型 長さ 値 2001.9.21 Web & Genome ASN.1 抽象構文記法1 Abstract Syntax Notation 1 データ型を定義する記述言語 実装方式とは独立した表現形式 Permissions ::= SEQUENCE OF SEQUENCE{ userId [1] IMPLICIT InternationalString, allowableFunctions [2] IMPLICIT SEQUENCE OF INTEGER{ delete (1), modifyContents (2), modifyPermissions (3), present (4), invoke 49 2001.9.21 (5)}} Web & Genome APDU Application Protocol Data Unit 要求と応答を含むデータパッケージ InitializeRequest ::= SEQUENCE{ referenceId protocolVersion options preferredMessageSize exceptionalRecordSize idAuthentication implementationId implementationName implementationVersion userInformationField otherInfo 50 ReferenceId OPTIONAL, ProtocolVersion, Options, [5] IMPLICIT INTEGER, [6] IMPLICIT INTEGER, [7] ANY OPTIONAL, -- see note below [110] IMPLICIT InternationalString OPTIONAL, [111] IMPLICIT InternationalString OPTIONAL, [112] IMPLICIT InternationalString OPTIONAL, [11] EXTERNAL OPTIONAL, OtherInformation OPTIONAL} --Note: -- For idAuthentication, the type ANY is retained -- for compatibility with earlier versions. -- For interoperability, the following is recommended: -IdAuthentication [7] CHOICE{ -open VisibleString, -idPass SEQUENCE { -groupId [0] IMPLICIT InternationalString OPTIONAL, -userId [1] IMPLICIT InternationalString OPTIONAL, -password [2] IMPLICIT InternationalString OPTIONAL }, -anonymous NULL, -other EXTERNAL -- May use access control formats for 'other'. See Appendix 7 ACC. 2001.9.21 Web & Genome 検索式 検索式タイプ Type-0: 二者間の専用タイプ Type-1: RPN (標準) Type-2: ISO 8777 Type-100: Z39.58 Type-101: 拡張RPN (v 2) Type 102: Ranked List query 51 重み付け検索 Relevance Feedback(関連検索) 2001.9.21 Web & Genome Type-1検索式 構成要素 52 AND,OR,NOT論理演算子と連携した一つ以上 のオペランド オペランドは二項関係の再帰表現を構成する オペランドは7つの要素から構成される 2001.9.21 Web & Genome Type-1オペランド 0. Term 1.Use Attributes アクセスポイント 2.Relation Attributes 53 検索語 各アクセスポイントにおけるTermとデータの関係 <、=、接辞処理等 2001.9.21 Web & Genome Type-1オペランド 3.Position Attributes 4.Structure Attributes 54 Termのアクセスポイント中の位置 フィールドの先頭、サブフィールドの先頭等 Termの扱い方 フレーズ、単語、日付、正規化名称等 2001.9.21 Web & Genome Type-1オペランド 5.Truncation Attributes 6.Completeness Attributes 55 短絡形等の適用方法 左側短絡、左右短絡、短絡なし、正規表現 Termが照合される対象 サブフィールドの一部、サブフィールド全体、フィー ルド全体 2001.9.21 Web & Genome 検索式の例 AND George Alec Effinger 56 Islam 1:1003 1:1035 2:3 2:3 3:1 3:3 4:1 4:101 5:100 5:100 6:1 6:2 2001.9.21 Web & Genome 検索結果集合 57 デフォルト結果集合 名前付き結果集合 永続的結果集合 2001.9.21 Web & Genome DBスキーマ 抽象化DBのレイアウトを定義 要素(返戻時の抽象化された項目) 58 要素仕様 要素集合名 2001.9.21 Web & Genome タグ 要素または部分構造に一意にラベル付ける 識別子 schemaIdentifier datatype: OBJECT IDENTIFIER 59 2001.9.21 Web & Genome タグ集合 特定のデータ構造のための識別子の集合 1.schemaIdentifier datatype: OBJECT IDENTIFIER 2.elementsOrdered datatype: BOOLEAN 3.elementOrdering datatype: INTEGER 4.defaultTagType datatype: INTEGER 60 2001.9.21 Web & Genome 構成仕様 61 返戻したいデータ構造の一部分(あるいは全 体)を指示する方法 2001.9.21 Web & Genome 実装と連携の現実 62 Z39.50は幾つかのレベルで相互連携を許容 する、情報検索の複雑な標準仕様である。 真の相互連携システムの実現には、多くの知 識と実証作業が必要となる。 2001.9.21 Web & Genome Z39.50とILL(図書館間相互貸借) Z39.50と ISO ILL(ISO 10160/10161)を連携 するための仕様 63 Z39.50/ILL Profile 1/2 検索、返戻、所蔵確認(Z39.50)~注文、貸出、 返却(ILL)までの一連の処理をネットワーク経由 で連携 2001.9.21 Web & Genome ILLプロトコル ISO 10160/10161-1 Peer-to-Peer 全サービスは非確認型 OSIプロトコル Prompt-1応答 ディレクトリ情報 64 MIME-encoded SMTPまたはTCP/IP セキュリティ ASN.1、BERまたはEDIFACT APDU転送 “要求”に対する“応答”を必要としない 外部オブジェクト 2001.9.21 Web & Genome Z39.50でILL Z39.50蔵書注文 ISO ILLと連携 Z39.50/ILL Profile 1 ISO ILLプロトコルAPDUを転送するためのZ39.50蔵書注文拡張 サービスを使用するProfile ISO 10161で定義される全トランザクション Z39.50/ILL Profile 2 65 拡張サービスによる要求・応答 Z39.50蔵書注文でILL-Request APDUでパラメータを指定する Profile 2001.9.21 Web & Genome 使用手順 66 Z39.50で検索 所蔵スキーマを用いて、Z39.50により所蔵情報を 返戻 Z39.50拡張サービスからILL Request Z39.50拡張サービスからILL Answer Z39.50/ILL Profile 1 2001.9.21 Web & Genome 使用手順 Request後の使用手順 Status request: Z39.50サーバのタスクDBからの応答: 67 STATUS-QUERY STATUS-OR-ERROR-REPORT 2001.9.21 Web & Genome 1.1 Search 1.2 Retrieve Holdings: Directory U. of Penn Union Catalogue (RLIN) Colorado State Brown U. 2.1.1 2.3.2 ILL-ANSWER: Harvard Law (RLG ILL Manager) will- supply 2.3.1 ILL-REQUEST Z39.50 query 2.1.2 Response: Checked Out 2.2.1 Brown U. (via OCLC Central ILL system) 2.2.3 ILL- Z39.50 query REQUEST U. Penn catalogue 2.2.2 Response: Item Available Colorado State U. (RSS) 68 2001.9.21 2.3.4 ILL-ANSWER unfilled (n.o.s.) 貸出処理: ILL Protocol & Z39.50 Web & Genome Local ISO ILL Application Library Consortia MnSCU/ PALS LIDDAS Bibliographic Utilities CIC Distributed System OCLC Central ILL, DRSS RLG RLIN Communications Network NLM’s ISO ILL Gateway National Libraries NAVIS (Canada) Kinetica (Australia) Te Puna (N.Z.) Docline 69 2001.9.21 BLDSC ISO ILL Gateway LIBRIS (Sweden) BLDSC ART System Web & Genome 国内利用に向けて必要な環境 (合意) 70 2001.9.21 Web & Genome 言語面 現状の検索式、診断レコードの国際化 8bitバイナリデータは扱える 文字集合の符号化方式と言語の交渉 日本語の場合 複数の分かち書きの可能性 多くの異表記 71 ISO2022、ISO10646-1 ローマ字、片仮名、漢字 複雑な典拠コントロール アクセスポイント、レコード構文の対応 2001.9.21 Web & Genome 言語面 検索式に対するZIGの考え 72 欧米のZIGにはアジア圏を考慮する必然性が無い 国際的に普及の兆し 各言語から特性を反映 2001.9.21 Web & Genome MARC 海外では“MARC=ISO2709準拠” 日本語表現可能なMARC 書誌目録の観点から 73 Japan/MARC MARC21(UTF-8,ISO2022-JP) NACSIS/CAT MARCベンダー独自のMARC 2001.9.21 Web & Genome 新規レコード構文を登録する場合 レコード構文の識別子(OID) 属性集合の定義、拡張(必要に応じて) 要素集合の定義(B…) 書誌目録の場合 74 所蔵レコードの取り込み方法 ILLとの連携の可能性 合意形成作業が(労多くとも)最も重要 2001.9.21 Web & Genome 実運用システムの課題 ベンダー間で相互連携性を検証 日本語対応システム ユーザフレンドリな日本語クライアント(ゲートウェイ) Z39.50の開発動機を思い起こしたい 75 NIIの取り組みは、レコード数と将来の相互連携数の規模 から有望な実証事例 ネイティブなレコード構文による書誌目録の流通を促進 相互連携性テストスーツ・仕様を規定 ネットワーク経由の共同目録作成作業を支援する 2001.9.21 Web & Genome Z39.50の将来 Z39.50-200x(V4)Draft ZNG - Z39.50 Next Generation 76 現在作業中 XML,URI,SOAP,HTTP Stateless ASN.1,BER,RPN Queryを使用しない Explain機能を普及させたい 抽象構文、スキーマは使用し続ける Z39.50MAは公式には参加していない(LCボランティア) 2001.9.21 Web & Genome Z39.50の将来 77 Webと親和性の高い、実装の容易なプロトコ ルが欲しい Statelessでいい、必要ならセッション管理を 付けよう 各目録規則を適切に扱う前提は崩したくない 目録規則と流通方式(検索/返戻)の各技術を 相互に独立して発展させたい 2001.9.21 Web & Genome Z39.50の将来 78 現在のZ39.50規格は、長年の図書館界にお ける情報検索の研究成果 検索式、レコード構文の高度な、特筆すべき 拡張性 ネットワーク図書館を構成する、現時点の有 望な、洗練されたフレームワークであることに 変わりはない! 2001.9.21 Web & Genome 参照文献 79 August 1999 Z39.50 Tutorial in Stockholm January 2000 ZIG Meeting in San Antonio ANSI/NISO Z39.50-1995(JIS X 0806:1999) ISO 10160/10161-1 Interlibrary Loan Service Definition and Protocol Specification Z39.50/ILL Profile ½ The ZNG Initiative “Z39.50 Next Generation” 2001.9.21 Web & Genome 質疑応答 80 2001.9.21 Web & Genome
© Copyright 2024 ExpyDoc