7.情報検索の特徴と技法

7.情報検索の特徴と技法
(1)情報検索の種類
Information retrieval (IR)
1.文献情報と事実情報
文献情報の検索(Document Retrieval)
ある分野、ある著者等に関しどんな文献があるか
を検索する。
事実情報の検索(Fact Retrieval)
物質の質量や、物理的・化学的・機械的性質など
の数値情報、原料の生産高、商品情報、企業情
報など、さまざまな事実に関する情報の検索。
2.情報検索の時代的遡及による種類
• 遡及検索(Retrospective search)
あることがらについて、過去にさかのぼって検索する。研
究の初期や周辺的なテーマなどの検索のとき、その分野
について歴史的に見通す必要があるときに行なう。
• カレントアウェアネス(Current awareness search)
あるテーマについて、新しい情報を検索する。
• SDI(Selective Dissermination of Information)(選択的情
報提供サービス)
知りたいテーマについて、検索内容をあらかじめ登録して
おく。そのテーマについて定期的に検索して、利用者に
検索結果を報告する。カレントアウェアネスの1つ。
索引言語 Indexing language
索引言語の種類
• 自然語
同義語や同形異義語の統制を行わない。 多くは、タイトル
や抄録中の語をコンピュータが自動的に採録する。
索引者が独自に付与する場合もある。
語尾の統一など若干の統制を行う場合もある。
• 統制語
「本」という概念は、本、図書、書物、書籍、冊子、というように
種々の名辞で表現される。索引時にこれらを、例えば「図
書」という名辞に代表させて与えておくと、同じ概念のものを
まとめて検索することができる。これを統制語による索引語
付与という。
統制語の辞書
統制語を用いるには辞書が必要である。
• キーワードの場合
件名標目表(図書館で用いられる)
シソーラス (抄録索引界で用いられる)
• 分類記号の場合
分類表
分類記号は統制語の一種と考えられる。