スライド 1 - SQUARE - UMIN一般公開

Introduction of
SNOMED-CT and UMLS
Kimikazu Kashiwagi
National College of Nursing
Patient Records
Numerical Data
Narrative Text
 International Classification
of Diseases (ICD)
Adverse Reaction terminology
 WHO Adverse Reaction Terminology
 J-ART:Japanese Adverse Drug Reaction
Terminology
 COSTART:Coding Symbol for Thesaurus of
Adverse Reaction Terms (FDA)
 MedDRA: Medical Dictionary for drug
regulatory affairs (ICH)
Case: Organ Plant Center
Organ Plant Center
Renal Transplant
Database
Dialysis Center
Dialysis Database
Same Patient - Different Terminology
From. “Ontology in Medicine”
Question:
 To find the patients who have a heart
disease from both database, in order to
evaluate the correlation between heart
diseases and the renal transplant result.
 Renal transplant recipient
To check if they have heart diseases,
renal diseases, lung diseases, and liver
diseases for evaluation study.
Problem
If disease doesn’t have a link
to body site, we can’t find
“Lung Disease.”
Relationship between Disease and Site
Disease
Has_site
Site
 もし、すべての疾患
が左のモデルに準
じていれば・・・・
 「肺」の部位に関連
する疾患を探すこと
ができる
Simple Ontology
Diesease
疾患
Has_Lesion
Lesion
病因
Has_site
Has_finding
Site
部位
Finding
所見
Narrative Text
 「トレッドミルではST変化がみられたが、24時間
ホルターでは不整脈はみられない」
Natural Language
Processing
Dictionary
トレッドミル負荷試験:心電図ーST変化
24時間ホルター心電図検査:不整脈なし
SNOMED-CT
SNOMED-CTとは
 Systematized Nomenclature of Medicine
 米国臨床病理医協会(CAP:The College of
American Pathologists)が作成
 当初は病理の用語集だったが、現在ではもっと
も大きな医療用語集の1つ
 概念数:34万
 http://www.snomed.org/
SNOMEDの歴史(1)
 1965年の病理学構造化用語集
(SNOP:Systematized Nomenclature of
Pathology)
 1974年 SNOMED
 2000年5月 SNOMED-RT (Reference
Terminology)
SNOMEDの歴史(2)
 2002年1月 イギリスの国民保健サービス
(NHS:National Health Service)が作成した
Clinical Terms Version 3(ReadCode)を統合し
たものがSNOMED-CT (Clinical Terms)
 半年に1回のペースで改訂され、最新版は
2003July版
SNOMEDのライセンス
 SNOMEDは無料で利用できず、年間ライセンス
契約を結ぶ必要がある。
 料金は、使用目的によって異なり、詳細は公開さ
れていない。
 ライセンス契約を結べば、年2回ほど最新版の
CD-ROMが郵送されてくる
 内容はテキストデータと、簡単な検索ツール(CL
UE)のみ
SNOMED-CTのライセンス
 2003年7月
NLM(米国医学図書館)と3240万ドル(38億
8800万円:1$=\120)で5年間のライセンス契約
を結び、SNOMED-CTのCore Content(付属
ツールやUS Drug Extensionなどを除いたもの)
は、NLMが作成しているUMLSに含まれることに
なっている。
 最初のバージョンは2004年第一四半期に
UMLS2004AA版として公開
今後のSNOMED-CTのライセンス
 UMLSに含まれたSNOMED-CTは米国内および
米国政府施設では、無料で使用できる
 UMLSの利用ライセンスを取得するには、ホーム
ページ上で申し込めばよい。
Object, Concept, Description
Object
Concept
Description
いす
Chair
椅子
概念と記述子の関係(1)
概念
記述子
いす
椅子
Chair
概念と記述子の関係(2)
概念
記述子
Gold
Friday
Money
金
同義語(Synonym)について
 SNOMED-CTでは、1つの概念に対して、複数
の記述子が登録されているため、それぞれが同
義語となる
 SNOMED-CTの同義語には3種類の区別があ
る。
1)完全修飾語 (Fully Specified Name)
2)優先語(Preferred)
3)同義語(Synonym)
同義語の例
概念
「便失禁」
kind(種)
完全修飾語
incontinence of feces (finding)
優先語
incontinence of feces
同義語
bowel incontinence
同義語
involuntary stool
同義語
bowels: incontinent
Strict HierarchyとPolyhierarchy
疾患
感染症
コレラ
髄膜炎
肺疾患
肺結核
J.J.Cimino.Practical Considerations for Choosing Terminologies in Health Care Applications.
AMIA 2003 Symposium Tutorial
顔(Entire face)はどこに?
SNOMED CT Concept
body structure
anatomical concepts
physical anatomical entity
anatomical structure
body region structure
surface region
body part structure
body surface region
upper body structure
upper body part structure
head and neck structure
head structure
head part
face and neck structure
region of head face structure
surface region of head
entire face
関連の種類
インフルエンザ
ウィルス性肺炎
is-a
is-a
インフルエンザ
肺炎
肺組織
Associatedmorphology
炎 症
インフルエンザ
ウィルス
カテゴリと関連
疾患
インフルエンザ
ウィルス性肺炎
インフルエンザ肺炎
生物
部位
心臓
肺
インフルエンザ 結核菌
ウィルス
SNOMED-CTの構成
 すべての概念は「SNOMED CT Concept」という最
上位概念の下位概念になっている
SNOMED CT Concept
所見 Finding
疾患 Disease
処置 Procedure
・・・・・
19のカテゴリー
 「所見」「疾患」「処置」などの最上位概念のすぐ下の概念を、
「カテゴリー」と呼び、全部で19種類ある。
すべての概念はいずれかのカテゴリーに属する
SNOMED-CT:19カテゴリー
所見 (Finding)
疾患 (Disease)
処置 (Procedure)
観察項目 (Observable entity)
人体構造 (Body structure)
生物 (Organism)
物質 (Substance)
薬剤 (Pharmaceutical /
biologic product)
検体 (Specimen)
物 (Physical object)
物理力 (Physical force)
出来事 (Events)
地域・場所 (Environments and
geographical locations)
社会的内容 (Social context)
状況依存カテゴリー (Contextdependent categories)
尺度 (Staging and scales)
属性 (Attribute)
修飾語句 (Qualifier value)
特殊概念 (Special concept)
1.所見 (Finding) 39,138概念
 所見は、主に症状が入るカテゴリーである。
例:
 「62315008 下痢 diarrhea (finding) 」
 「48694002 不安 anxiety (finding) 」
2.疾患 (Disease) 70,832概念
 疾患カテゴリーは、いわゆる病名
例:
 「74400008 虫垂炎 appendicitis (disorder)」
 「127013003 糖尿病性腎症 diabetic renal disease
(disorder)」
 所見との違いは、医学的な判断が含まれているかどうか
である。


「248255005 まったく眠れない cannot sleep at all
(finding)」は所見
「193462001 不眠症 insomnia (disorder)」は疾患
3.処置 (Procedure) 50,319概念
 処置には、検査や治療などの医療行為が入る。
 例:
 「6143009 糖尿病患者教育 diabetic patient education
(regime/therapy)」
 「10870009 総肺静脈結合異常の完全修復における心房
中隔欠損修復術 Repair of atrial septal defect in total
repair of total anomalous pulmonary venous
connection (procedure)」
 「371754007 退院計画 discharge planning
(procedure) 」
 「2475000 24時間蓄尿 urine specimen collection、 24
hours (procedure) 」
UMLS
UMLSとは
 Unified Medical Language System
 統一化医療言語体系
 米国国立医学図書館(NLM)が作成
 さまざまな用語集の用語を登録し、管理されてい
る用語集
 無償で公開されている
 年に3~4回更新される
UMLSの利用
 ホームページに必要事項を入力すると72時間
以内に確認電子メールが届く
 ホームページを開き確認すると、ライセンス番号
を5日以内に発行してくれる
UMLSの成果物
1. Metathesaurus

さまざまな用語集の用語を含む用語集
2. Semantic Network

医学用語体系
3. SPECIALIST Lexicon and Lexical Programs

自然言語処理のツールプログラム
1.Metathesaurus
 143の用語集の用語を登録した用語集
 約100万概念、約430万名称
 登録されている各用語集ごとにライセンス形態
が異なる
UMLSに含まれる主要な用語集
 ICD-10
 ICPC :The International Classification of Primary Care
 SNOMED Clinical Terms
 MedDRA :Medical Dictionary for Regulatory Activities Terminology
 DSM-IV :Diagnostic and Statistical Manual of Mental Disorders
 HL7 :Health Level Seven Vocabulary
 MeSH :Medical Subject Headings
 RxNorm
 Gene Ontology
UMLSに含まれる用語集
 看護用語
 NANDA nursing diagnoses
 Home Health Care Classification of Nursing Diagnoses
and Interventions
 Patient Data Care Set (PCDS)
 米国支払いコード
 Current Procedural Terminology (CPT)
 Healthcare Common Procedure Coding System
(HCPCS).
 日本語シソーラス(医学中央雑誌)
 JAMAS Japanese Medical Thesaurus (JJMT)
UMLSに含まれる翻訳版の例














Basque Translation.
Danish Translation.
Dutch Translation.
Finnish Translation.
French Translation.
German Translation.
Hebrew Translation, Denmark
Hungarian Translation.
Italian Translation.
Norwegian Translation.
Australian Modification.
Portuguese Translation.
Spanish Translation.
Swedish Translation.
14カ国語に翻訳
されたものが
登録されている
The International Classification of Primary Care (ICPC).
メタシソーラス
 ダウンロードしたファイルは圧縮されており、
どの用語集の用語を取り出すかを指定する
ツールが添付されている
 ツール:MetamorphoSys
Metathesaurusに含まれている
各用語集のライセンス
 カテゴリ1
 別の成果物を作成したり、翻訳してはいけない
 カテゴリ2
 カテゴリ1の制限に加え、実用システムで用いてはいけない。
 研究、開発のために用いてもよい
 カテゴリ3

同一組織内の研究、開発、統計処理のためにだけに用いて
もよい(インターネット上に公開してはいけない)
 カテゴリ4(SNOMED-CTのみ)
 米国内、および米国政府関連施設でのみ使用可
MetamorphoSysツール
用語集の選択(1)
用語集の選択(2)
MetamorphoSysのその他の機能
 出力形式の選択
 データベース取り込みのためのスクリプト
 Oracle
 MySQL
 ASCII以外の文字の出力の制御(UTF-8)
UMLSの構造
Concept (CUI)
Terms (LUIs)
C000000
肝臓癌
肝臓がん
肝癌
肝がん
L0000001
肝臓癌
肝臓がん
L0000002
肝癌
肝がん
Strings
(SUIs)
S0000001
肝臓癌
Atoms (AUIs)
A0000001
肝臓癌(from ---)
A0000002
肝臓癌(from ---)
S0000002
肝臓がん
A0000003
肝臓がん(from-)
S0000003
肝癌
A0000004
肝癌 (from -)
S0000004
肝がん
A0000005
肝がん(from ---)
UMLSの構造
○○病名集
Concept
Term
String
肝癌
肝癌
肝がん
String
肝ガン
肝癌
2.Semantic Network
 医学用語の概念関連図


概念のグループ:Semantic Type 135種類
概念間の関連:Semantic Relation 54種類
 Metathesaurusのすべての概念は、どれかの
Semantic Typeに含まれている
 1つの概念が複数のSemantic Typeに登録され
ていることもある
Semantic TypeとSemantic Relationの例
Physical Object
IS_A
Clinical
Drug
Group
使う
生成する
Occupation
成分
Antibiotic
引き起こす
Disease
Semantic Typeの概要
Semantic Type
Event
Entity
Physical
Object
Conceptual
Entity
Activity
Phenomenon
or
Process
Semantic Relationの概要
Semantic Relation
isa
associated_with
physically_related_to
spatially_related_to
functionally_related_to
temporally_related_to
conceptually_related_to
Semantic Group
(Semantic Typeのシンプル版)
1. Activities & Behaviors
9. Living Beings
2. Anatomy
10. Objects
3. Chemicals & Drugs
11. Occupations
4. Concepts & Ideas
5. Devices
6. Disorders
12. Organizations
13. Phenomena
7. Genes & Molecular
14. Physiology
Sequences
8. Geographic Areas
15. Procedures
3.SPECIALIST Lexicon
 原文を処理するツール
1. Remove Genitive
2. Replace Punctuation With Space
3. Strip Stop Words
4. Strip Diacritics
5. Split Ligatures
6. Lowercase Words
7. Uninflect Words
8. Citation
9. Sort Words By ASCII Order
10. Symbol Name Synonmy
句読点を除く
対象外の語を除く
メタシソーラスへのマッピングツール
MetaMap Transfer (MMTx)
例)閉塞性睡眠時無呼吸 「Obstructive Sleep Apnea」
 Meta Candidates (7)
 1000 Sleep Apnea, Obstructive
 901 Apnea, Sleep (Sleep Apnea Syndromes)
 827 Apnea
 827 Obstructive (Obstructed)
 827 Sleep
 Meta Mapping (1000)
 1000 Sleep Apnea, Obstructive [Disease or
Syndrome]
Knowledge Source Server
 Metathesaurus、Semantic Network、
SPECIALISTそれぞれについてホームページで
簡単な検索システムが公開されている。
 プログラムからアクセスするためのインター
フェースも公開されている
例文データ(WSD Test Collection)
 I am taking aspirin for my cold.
 Let's go inside, I'm cold.
 英語のColdには、慢性閉塞性肺疾患(COLD)、
風邪、寒いの意味があり、それは文脈によって
変わる。
 このような例文を集め、それぞれどの意味に解
釈すべきかの正解を作成したコレクション
用語モデル研究会ホームページへ