情報検索概説II(99秋)

情報検索概説II(99秋)
第2回 1999/10/7
情報検索の歴史(1)
使用文献
講座図書館の理論と実際5
情報検索 細野公男編
連絡事項
講義のホームページ
http://www.mita.keio.ac.jp/~msyk/irg2/
索引方式
索引
– ある対象を的確に示す用語
事前結合索引方式
– 索引語がそのまま対象に対応している
事後結合索引方式
– 複数の索引語から主題を導く
– 索引語の組み合わせを後から行う
– その結果、対象が導かれる
情報検索システムの発展経緯
機械的な手段は1930年代から
現在の検索システムの普及要
因
コンピュータの出現と、その急激な技術的
進歩と普及
コンピュータを効率的に使うデータベース
放逐技法の発展
データベース化技術の発展に伴う印刷物
のデータベース化の普及
通信網の普及
1950年以前-萌芽期
米国での20世紀初頭
– 文書の記録にマイクロフィルム
– データ計算管理にパンチカード
第二次世界大戦頃に、こうした機材を情
報検索に使うようになった
特徴
– 逐次検索方式による検索機械
– パンチカードを使用した事後結合索引方式
逐次検索方式による検索機械
1938年、米国農務省、ショー
Rapid Selector
マイクロフィルム
– 文献
– 2進数のコードで示した主題
パンチカードによる事後結合索
引方式
1940年ごろ、バッテン、特許情報の管理
パンチカードのもとになった「ほれリスカー
ド」を使う
– 主題→1枚のカード
– 文献番号からカードの位置
– カードを重ねる
ピーカブーシステム
– 主題の数は無制限にできる
Zatocoding System
1940年代末、ムアズ
ホールソートカード(へり穴カード)
– カードには書誌情報
– カードのヘリに主題概念をあらわす穴
– 用語(ディスクリプタ)に応じた穴
統制語彙
– あらかじめ決められた主題
1950年代-揺籃期
事後結合索引方式の確立
コンピュータによる情報検索システム
転置ファイル
ブール代数
事後結合方式の確立
1951年、タウベ、事後結合方式の提案
1953年、ユニターム方式、カードで実現
– 索引語ごとにカードを用意
– カードにその主題を含む文献番号を記載
– 複数の索引語の場合、いずれのカードにも含
む文献番号から検索できる
コンピュータによる検索システ
ム
 1951、MITでオンライン情報検索システムの可
能性が研究される
 1954、IBMが汎用コンピュータで最初の情報検
索システムの実験
 1958、ウェスタンリザーブ大学、ペリーとケント、
磁気テープ
 同時にパンチカード、16ミリフィルム、マイクロ
フィルムも研究されたが、60年代のコンピュータ
の広がりの中、この種の検索機械は衰退する
転置ファイル
データ自体を逐次検索すると非常に時間
がかかるようになる
1958、タウベ
データのありかを記録したファイル
1960年代-成長期
1957年、スプートニックショック
– 米国の科学技術予算の増大
オフラインバッチ型情報検索システム
オンライン会話型情報検索システム
オフラインバッチ型検索システ
ム
 米国国立医学図書館、MEDLARS
– 医学文献を対象
– 磁気テープを利用
– 検索に2週間、結果が得られるまで6週間
 ロッキード、USAirforce、SDC
 ハーバード大学ソルトン、SMART
 ピッツバーグ大学ホーティ、法律の条文のフル
テキスト
– USAirforce、LITE
オンライン会話型検索システム
SDC、ロッキード:Protosynthex
– Goloden Book Encyclopedia
– 転置ファイル、全文検索機能
– 近接演算、部分一致演算
OLEX
ORBIT
– Arpanetで利用
ロッキード:DIALOG
1970年代-発展期
オンライン会話式検索の商用サービス
– データ通信の発達
– タイムシェアリングシステムの普及
商用サービスの展開
サービス範囲の拡大
– 書誌情報から法律、記事、特許
データベースがビジネスになる
書誌ユーティリティ
代行検索者
利用者訓練
データベースの発展経緯
データベースの意味
–
–
–
–
–
データとプログラムの分離
整合性の維持
セキュリティ
複数ユーザーの同時利用
障害時のデータの保護
1950年代-揺籃期
入力
– パンチカード、紙テープ
記憶
– 磁気テープ
パンチカードによる人口調査
– UNIVAC
コンピュータを利用した印刷
1960年代-成長期
 磁気テープ、磁気ディスク
 さまざなデータが蓄積されるようになった
–
–
–
–
–
–
–
米国国立医学図書館、MEDLARS
米国航空宇宙局、STAR
Chemical Abstracts Service
索引誌、抄録誌
米国議会図書館
百科事典、法令
物性データ(Chemical Registry System)
1970年代-発展期
1972年、商用サービス、DIALOG
リレーショナルデータベース
– IBMのコッドが理論体系を作り上げた
– 現在の主流となるデータベース管理手法
パソコンの登場