新しいシステムの提案 - 慶應義塾大学図書館

図書館システムの歴史と
日本語処理を考える
研究会事務局
入江 伸
図書館システムトッピクス
– 1980年代
• 個別開発システム(カナ・英字) 金工大システム
• パッケージ販売 CALIS ILIS Biblion Dobis LICS 情報館
– 1990年代(パッケージシステム 遡及 書誌Utility)
•
•
•
•
データ遡及事業(遡及単価 1500円)
LIMEDIO
ダウンサイジング DBMSの輸入
インターネット 電子図書館
– 2000年代
•
•
•
•
データ遡及 (100円割れ)
標準化 Unicode 海外システムの日本語化
XML EJ アーカイブ ポータルサイト
業務システム主導からサービスシステム主導へ
世代交代と新しい環境
•
•
世代交換
– 必要な経験の継承
• 図書館側 :独自開発世代の経験の継承
• メーカ側 :図書館知識と理解の継承
• 分類・件名検索 典拠管理 KWIC検索
– 問題解決への手がかり
• 図書側 :システム経験者が少なくなっている
• メーカ側 :メーカとしての業務提案が弱い
新しいし環境
– 図書館側
• 新しい投資部門の出現 EJ アーカイブ
• 図書館経営環境の悪化
• 図書館へ要求される機能の増加
– メタデータデータベース 大学ポータル 学部ポータル
• 国立大学・NIIの独立法人化
– 新しい情報環境
• 標準化
• 電子化資料の本格的な流通
• XML 全文検索 関連検索
• DBMS戦略
• UniCode
– メーカ
• 外国製システムの流通
– コンソーシアム アウトソーシング ASPの模索
今 なんで日本語処理?
海外パッケージの流入とUnicodeへの対応
•
•
•
海外パッケージの採用可能性
– 図書館業務の標準化と海外システムの適用可能性の拡大
– 日本語処理の拡張
Unicodeを日本語処理として利用する場合
– ローマ字・カナ処理から漢字処理への移行期と同様な問題の発生
– 入力
– 表示 印刷
• これまでの外字のマッピング
• 日本語文字の認定
– 検索
– ソート
• 異体字処理
UniCodeを多言語として利用する場合の問題(同じデータベースに多言語のデータが混在する場合)
– 入力
– 表示・印刷
– 検索
– ソート
•
•
多言語の並び順
言語処理層(日本語)の明確化
– 文字コードの正規化(異体字変換を含)・日本語文字識別
– 検索機能の標準化
– ソート処理の標準化
新しいシステムアプローチ
• メーカグループと図書館グループの共同開発
– 仕様の標準化
– インターフェースの国際標準
– モデル設定
– 機能の部品化
• 新しい導入モデル
– サブシステムごとの導入
• 運用アプローチ
– アウトソーシング・ASP
• 他データベース・アーカイブとの連携機能の装備