Introduction of SNOMED-CT and UMLS Kimikazu Kashiwagi National College of Nursing Patient Records Numerical Data Narrative Text International Classification of Diseases (ICD) Adverse Reaction terminology WHO Adverse Reaction Terminology J-ART:Japanese Adverse Drug Reaction Terminology COSTART:Coding Symbol for Thesaurus of Adverse Reaction Terms (FDA) MedDRA: Medical Dictionary for drug regulatory affairs (ICH) Case: Organ Plant Center Organ Plant Center Renal Transplant Database Dialysis Center Dialysis Database Same Patient - Different Terminology From. “Ontology in Medicine” Question: To find the patients who have a heart disease from both database, in order to evaluate the correlation between heart diseases and the renal transplant result. Renal transplant recipient To check if they have heart diseases, renal diseases, lung diseases, and liver diseases for evaluation study. Problem If disease doesn’t have a link to body site, we can’t find “Lung Disease.” Relationship between Disease and Site Disease Has_site Site もし、すべての疾患 が左のモデルに準 じていれば・・・・ 「肺」の部位に関連 する疾患を探すこと ができる Simple Ontology Diesease 疾患 Has_Lesion Lesion 病因 Has_site Has_finding Site 部位 Finding 所見 Narrative Text 「トレッドミルではST変化がみられたが、24時間 ホルターでは不整脈はみられない」 Natural Language Processing Dictionary トレッドミル負荷試験:心電図ーST変化 24時間ホルター心電図検査:不整脈なし SNOMED-CT SNOMED-CTとは Systematized Nomenclature of Medicine 米国臨床病理医協会(CAP:The College of American Pathologists)が作成 当初は病理の用語集だったが、現在ではもっと も大きな医療用語集の1つ 概念数:34万 SNOMEDの歴史(1) 1965年の病理学構造化用語集 (SNOP:Systematized Nomenclature of Pathology) 1974年 SNOMED 2000年5月 SNOMED-RT (Reference Terminology) SNOMEDの歴史(2) 2002年1月 イギリスの国民保健サービス (NHS:National Health Service)が作成した Clinical Terms Version 3(ReadCode)を統合し たものがSNOMED-CT (Clinical Terms) 半年に1回のペースで改訂され、最新版は 2003July版 SNOMEDのライセンス SNOMEDは無料で利用できず、年間ライセンス 契約を結ぶ必要がある。 料金は、使用目的によって異なり、詳細は公開さ れていない。 ライセンス契約を結べば、年2回ほど最新版の CD-ROMが郵送されてくる 内容はテキストデータと、簡単な検索ツール(CL UE)のみ SNOMED-CTのライセンス 2003年7月 NLM(米国医学図書館)と3240万ドル(38億 8800万円:1$=\120)で5年間のライセンス契約 を結び、SNOMED-CTのCore Content(付属 ツールやUS Drug Extensionなどを除いたもの) は、NLMが作成しているUMLSに含まれることに なっている。 最初のバージョンは2004年第一四半期に UMLS2004AA版として公開 今後のSNOMED-CTのライセンス UMLSに含まれたSNOMED-CTは米国内および 米国政府施設では、無料で使用できる UMLSの利用ライセンスを取得するには、ホーム ページ上で申し込めばよい。 Object, Concept, Description Object Concept Description いす Chair 椅子 概念と記述子の関係(1) 概念 記述子 いす 椅子 Chair 概念と記述子の関係(2) 概念 記述子 Gold Friday Money 金 同義語(Synonym)について SNOMED-CTでは、1つの概念に対して、複数 の記述子が登録されているため、それぞれが同 義語となる SNOMED-CTの同義語には3種類の区別があ る。 1)完全修飾語 (Fully Specified Name) 2)優先語(Preferred) 3)同義語(Synonym) 同義語の例 概念 「便失禁」 kind(種) 完全修飾語 incontinence of feces (finding) 優先語 incontinence of feces 同義語 bowel incontinence 同義語 involuntary stool 同義語 bowels: incontinent Strict HierarchyとPolyhierarchy 疾患 感染症 コレラ 髄膜炎 肺疾患 肺結核 J.J.Cimino.Practical Considerations for Choosing Terminologies in Health Care Applications. AMIA 2003 Symposium Tutorial 顔(Entire face)はどこに? SNOMED CT Concept body structure anatomical concepts physical anatomical entity anatomical structure body region structure surface region body part structure body surface region upper body structure upper body part structure head and neck structure head structure head part face and neck structure region of head face structure surface region of head entire face 関連の種類 インフルエンザ ウィルス性肺炎 is-a is-a インフルエンザ 肺炎 肺組織 Associatedmorphology 炎 症 インフルエンザ ウィルス カテゴリと関連 疾患 インフルエンザ ウィルス性肺炎 インフルエンザ肺炎 生物 部位 心臓 肺 インフルエンザ 結核菌 ウィルス SNOMED-CTの構成 すべての概念は「SNOMED CT Concept」という最 上位概念の下位概念になっている SNOMED CT Concept 所見 Finding 疾患 Disease 処置 Procedure ・・・・・ 19のカテゴリー 「所見」「疾患」「処置」などの最上位概念のすぐ下の概念を、 「カテゴリー」と呼び、全部で19種類ある。 すべての概念はいずれかのカテゴリーに属する SNOMED-CT:19カテゴリー 所見 (Finding) 疾患 (Disease) 処置 (Procedure) 観察項目 (Observable entity) 人体構造 (Body structure) 生物 (Organism) 物質 (Substance) 薬剤 (Pharmaceutical / biologic product) 検体 (Specimen) 物 (Physical object) 物理力 (Physical force) 出来事 (Events) 地域・場所 (Environments and geographical locations) 社会的内容 (Social context) 状況依存カテゴリー (Contextdependent categories) 尺度 (Staging and scales) 属性 (Attribute) 修飾語句 (Qualifier value) 特殊概念 (Special concept) 1.所見 (Finding) 39,138概念 所見は、主に症状が入るカテゴリーである。 例: 「62315008 下痢 diarrhea (finding) 」 「48694002 不安 anxiety (finding) 」 2.疾患 (Disease) 70,832概念 疾患カテゴリーは、いわゆる病名 例: 「74400008 虫垂炎 appendicitis (disorder)」 「127013003 糖尿病性腎症 diabetic renal disease (disorder)」 所見との違いは、医学的な判断が含まれているかどうか である。 「248255005 まったく眠れない cannot sleep at all (finding)」は所見 「193462001 不眠症 insomnia (disorder)」は疾患 3.処置 (Procedure) 50,319概念 処置には、検査や治療などの医療行為が入る。 例: 「6143009 糖尿病患者教育 diabetic patient education (regime/therapy)」 「10870009 総肺静脈結合異常の完全修復における心房 中隔欠損修復術 Repair of atrial septal defect in total repair of total anomalous pulmonary venous connection (procedure)」 「371754007 退院計画 discharge planning (procedure) 」 「2475000 24時間蓄尿 urine specimen collection、 24 hours (procedure) 」 UMLS UMLSとは Unified Medical Language System 統一化医療言語体系 米国国立医学図書館(NLM)が作成 さまざまな用語集の用語を登録し、管理されてい る用語集 無償で公開されている 年に3~4回更新される UMLSの利用 ホームページに必要事項を入力すると72時間 以内に確認電子メールが届く ホームページを開き確認すると、ライセンス番号 を5日以内に発行してくれる UMLSの成果物 1. Metathesaurus さまざまな用語集の用語を含む用語集 2. Semantic Network 医学用語体系 3. SPECIALIST Lexicon and Lexical Programs 自然言語処理のツールプログラム 1.Metathesaurus 143の用語集の用語を登録した用語集 約100万概念、約430万名称 登録されている各用語集ごとにライセンス形態 が異なる UMLSに含まれる主要な用語集 ICD-10 ICPC :The International Classification of Primary Care SNOMED Clinical Terms MedDRA :Medical Dictionary for Regulatory Activities Terminology DSM-IV :Diagnostic and Statistical Manual of Mental Disorders HL7 :Health Level Seven Vocabulary MeSH :Medical Subject Headings RxNorm Gene Ontology UMLSに含まれる用語集 看護用語 NANDA nursing diagnoses Home Health Care Classification of Nursing Diagnoses and Interventions Patient Data Care Set (PCDS) 米国支払いコード Current Procedural Terminology (CPT) Healthcare Common Procedure Coding System (HCPCS). 日本語シソーラス(医学中央雑誌) JAMAS Japanese Medical Thesaurus (JJMT) UMLSに含まれる翻訳版の例 Basque Translation. Danish Translation. Dutch Translation. Finnish Translation. French Translation. German Translation. Hebrew Translation, Denmark Hungarian Translation. Italian Translation. Norwegian Translation. Australian Modification. Portuguese Translation. Spanish Translation. Swedish Translation. 14カ国語に翻訳 されたものが 登録されている The International Classification of Primary Care (ICPC). メタシソーラス ダウンロードしたファイルは圧縮されており、 どの用語集の用語を取り出すかを指定する ツールが添付されている ツール:MetamorphoSys Metathesaurusに含まれている 各用語集のライセンス カテゴリ1 別の成果物を作成したり、翻訳してはいけない カテゴリ2 カテゴリ1の制限に加え、実用システムで用いてはいけない。 研究、開発のために用いてもよい カテゴリ3 同一組織内の研究、開発、統計処理のためにだけに用いて もよい(インターネット上に公開してはいけない) カテゴリ4(SNOMED-CTのみ) 米国内、および米国政府関連施設でのみ使用可 MetamorphoSysツール 用語集の選択(1) 用語集の選択(2) MetamorphoSysのその他の機能 出力形式の選択 データベース取り込みのためのスクリプト Oracle MySQL ASCII以外の文字の出力の制御(UTF-8) UMLSの構造 Concept (CUI) Terms (LUIs) C000000 肝臓癌 肝臓がん 肝癌 肝がん L0000001 肝臓癌 肝臓がん L0000002 肝癌 肝がん Strings (SUIs) S0000001 肝臓癌 Atoms (AUIs) A0000001 肝臓癌(from ---) A0000002 肝臓癌(from ---) S0000002 肝臓がん A0000003 肝臓がん(from-) S0000003 肝癌 A0000004 肝癌 (from -) S0000004 肝がん A0000005 肝がん(from ---) UMLSの構造 ○○病名集 Concept Term String 肝癌 肝癌 肝がん String 肝ガン 肝癌 2.Semantic Network 医学用語の概念関連図 概念のグループ:Semantic Type 135種類 概念間の関連:Semantic Relation 54種類 Metathesaurusのすべての概念は、どれかの Semantic Typeに含まれている 1つの概念が複数のSemantic Typeに登録され ていることもある Semantic TypeとSemantic Relationの例 Physical Object IS_A Clinical Drug Group 使う 生成する Occupation 成分 Antibiotic 引き起こす Disease Semantic Typeの概要 Semantic Type Event Entity Physical Object Conceptual Entity Activity Phenomenon or Process Semantic Relationの概要 Semantic Relation isa associated_with physically_related_to spatially_related_to functionally_related_to temporally_related_to conceptually_related_to Semantic Group (Semantic Typeのシンプル版) 1. Activities & Behaviors 9. Living Beings 2. Anatomy 10. Objects 3. Chemicals & Drugs 11. Occupations 4. Concepts & Ideas 5. Devices 6. Disorders 12. Organizations 13. Phenomena 7. Genes & Molecular 14. Physiology Sequences 8. Geographic Areas 15. Procedures 3.SPECIALIST Lexicon 原文を処理するツール 1. Remove Genitive 2. Replace Punctuation With Space 3. Strip Stop Words 4. Strip Diacritics 5. Split Ligatures 6. Lowercase Words 7. Uninflect Words 8. Citation 9. Sort Words By ASCII Order 10. Symbol Name Synonmy 句読点を除く 対象外の語を除く メタシソーラスへのマッピングツール MetaMap Transfer (MMTx) 例)閉塞性睡眠時無呼吸 「Obstructive Sleep Apnea」 Meta Candidates (7) 1000 Sleep Apnea, Obstructive 901 Apnea, Sleep (Sleep Apnea Syndromes) 827 Apnea 827 Obstructive (Obstructed) 827 Sleep Meta Mapping (1000) 1000 Sleep Apnea, Obstructive [Disease or Syndrome] Knowledge Source Server Metathesaurus、Semantic Network、 SPECIALISTそれぞれについてホームページで 簡単な検索システムが公開されている。 プログラムからアクセスするためのインター フェースも公開されている 例文データ(WSD Test Collection) I am taking aspirin for my cold. Let's go inside, I'm cold. 英語のColdには、慢性閉塞性肺疾患(COLD)、 風邪、寒いの意味があり、それは文脈によって 変わる。 このような例文を集め、それぞれどの意味に解 釈すべきかの正解を作成したコレクション 用語モデル研究会ホームページへ
