スライド 1 - LUULULU

電子化により外来カルテ文章の
情報量は増加する傾向がある
荒牧 英治 * ***
増川 佐知子 *
山田 恵美子 **
脇 嘉代 **
大江 和彦 **
* 東京大学 知の構造化センター
** 東京大学 医学部附属病院
*** JSTさきがけ
背景と目的
• 利点
– (手書きカルテに比べ)診療情報の保存・管理が容易
– (臨床研究を行う際にも)診療情報を効率よく利用可能
• 欠点
– 記述量が減るのではないかという危惧
• 患者と対面しつつ入力する負担
– コピー・ペーストによる転用
• 記載量は増えたが真の情報の質・量に変化はないのでは?
• これまで電子カルテと手書きカルテを比較しそれらの記載
内容について量的,質的に検討した研究は少ない
• 電子カルテテキスト固有の特性があるのかも不明
電子カルテと手書きカルテのテキストに含まれる情報の
質的,量的な差異を検討
概要
• 背景
• 材料
• 方法
• 結果
• 結論
材料 (1/2)
• 東京大学医学部附属病院 糖尿病・代謝内科の外
来受診中の患者85名(44名の医師が記載)のカル
テ (倫理委員会の承認済)
– 2003年6月-2009年5月 (5年)手書きカルテ
– 2009年6月-2010年2月 (6カ月)電子カルテ
手書きカルテ 電子カルテ
1841
484
文書数(受診回数)
4103
1658
文数
46756
31899
文字数
材料 (2/2)
• Subjective(患者の主観的情報)を抽出
– 自然文の性質の変化を調べるため,自然文が多いと
考えられる患者の訴えの部分に注目
• 抽出方法
– 明示的に「S」と記述されている場合:該当箇所抽出
S) 夏で子供とcake・ジュース多かった。
– 「S」と記述されていない場合: 記述内容から糖尿病
専門医が判断して抽出
昨晩はフライドチキンを食べたと。
概要
• 背景
• 材料
• 方法
• 結果
• 結論
本発表で紹介する指標
STR
POSR
CaseR
FLUr
FLUc
FLUα
MR
Script type Ratio
文字種の割合
Part Of Speech Ratio
品詞の割合
Case Ratio
格助詞の割合
Fluency (R Value)
流暢さ [guiraud1954]
Fluency (C Value)
流暢さ [Herdan1960]
Fluency (α2Value)
流暢さ[Maas1972]
Machine Readability
機械処理可能な医療表現数
SynComp Syntactic Complexity
統語的複雑さ
DisComp DisComp
談話的複雑さ
#Chars Discourse Complexity
受診毎の文字数
#MWs Number of Medical Words 受診毎の医学用語数
SimSR Similar Sentence Ratio
SameSR Same Sentence Ratio
前回受診時と類似した文の割合
前回受診時と同じ文の割合
質を測るか(質)/ 量を測るか(量)
一般的指標か(汎)/医学的指標か(医)
質
質
質
質
質
質
量
量
量
量
質
質
質
汎
汎
汎
汎
汎
汎
医
汎
汎
汎
医
医
医
概要
•
•
•
•
背景
材料
方法
結果
– (1) 質的検討
– (2) 記載量は増えたか?
– (3) コピー・ペーストは?
• 結論
一般的統計量
句読点↑
文字種の割合
品詞割合
英字↓ 漢字↑
格助詞の割合
手書き(左)と電子カルテ(右)
夕食前にhypoglycemic
昼食が少し遅れるとhypoになりやすい
exerciseの多少により変動多い
盆の間,両親が2weeksいたので
healthy弁当とっていた
アルコール飲む量がふえた
食事はかわっていない
general condition まあまあ
昼夜逆転
アサ食 12°頃
ヒル食 16°~17°頃
夕食
間食(+) スルメp.o
coffee jelly 40/回p.oしたり
疲れると食べてしまう.(買いおき)
ex. 買物 駅~家10分/day
低血糖 午後何回か --> 昼前低く
朝下げることも御話したが、昼前の90台
は
ちょうどよく現状維持希望
まだまだアルコールの量が多い。せいぜ
い一本にするよう指導するも、
一本では飲んだ気がしないとのこと。減
酒の意義を説明した。こんご少しづつで
も飲酒量
を減らすように指導続ける。
(遅刻)。体重が減らない。スポーツクラ
ブも月の4~5回。
食事も良く食べている。夜の間食が多い。
統語構造の複雑さと
談話構造の複雑さ
多くの命題(動詞)があれば
より複雑
統語構造
多くの接続詞があればより複雑
(論旨を展開するには接続詞
「ので」「から」等が必要)
談話構造
概要
•
•
•
•
背景
材料
方法
結果
– (1) 質的検討
→ より複雑な構造に(文らしく)
– (2) 記載量は増えたか?
– (3) コピー・ペーストは?
• 結論
医療情報量は増えたか?
受診毎の文字数と医療表現数
医療表現 = 医学辞書(医学書院,南
山堂医学大辞典)の見出し語
文字数
医療表現数
医師ごとの変化
医療表現数
文字数
r 2=0.254
r 2=0.322
(p=0.05)
(p=0.01)
手書きカルテと電子カルテの記載量は相関する傾向
→ 手書きカルテで記載量が多かった医師は電子カルテになる
と更に記述量が増加する傾向が認められる
概要
•
•
•
•
背景
材料
方法
結果
– (1) 質的検討
– (2) 記載量は増えたか?
→ 2〜2.5倍の増加
– (3) コピー・ペーストは?
• 結論
コピー・ペーストは増えたか?
• 前回受診時と同一または類似文の割合を計算
– 類似度SIM=編集距離[Levenshtein1965]類似度>0.8
夏で子供とcake ジュース多かった
SIM
0.94
SIM
1.00
夏で子供とcake・ジュース多かった。
子供とcake・ジュース多かった。
SIM 0.73
夏で子供と
ジュース多かった。
前回受診時と同一/類似の文の割合
同一
類似
同一 or 類似の文は5倍(10〜12ポイント)増加
概要
•
•
•
•
背景
材料
方法
結果
– (1) 質的検討
– (2) 記載量は増えたか?
→ 2〜2.5倍の増加
– (3) コピー・ペーストは?
→ コピー・ペースト可能である
記述が5倍の増加 (15%)
• 結論
15%ディスカントしても
まだ増えている
概要
• 背景
• 材料
• 方法
• 結果
• 結論
結論
• さまざな観点から電子カルテテキストの量的/質的な
検討を行った
– 量:コピー・ペースト可能な量も増えているが,それだけで
は説明できない
電子カルテ化により記述が減るとは言えない
むしろ増える傾向がある
– 質:動詞・接続詞頻度が増え,より複雑な文構造
→ 今後の詳細な検討が求められる(診療行為や診療内
容にどの程度影響しているか等)
• 今回は糖尿病・代謝内科の半年間のカルテを集計
→ 今後: より大規模な調査が必要
手書きカルテ書き起こし調査協力者
川村美雪
山田(篠原)恵美子
増川佐知子
新田見有紀
脇嘉代(糖尿病専門医)
連絡先
東京大学 知の構造化センター/JSTさきがけ
荒牧英治 Ph.D. [email protected]