新冠病毒的诊疗,假如我们有一个全国统一的电子病历大数据,也就是说所有病人的治疗过程即时登记在全国计算云里,那么一个跟踪各个地区各种疾病即时发生率的计算软件就能够自动发现不同寻常的高峰,发出流行预警,从而避免地方可能的拖延、为全国的决策争取到最多的时间,把危害降到最小。
一个全国统一的电子病历大数据更是数据挖掘的金库。例如根据新冠病人的症状、用药的记录,可以用统计、深度学习的方法研究各种药的效果、付作用、以及可能的新用途。也可以利用数据库,分析各种疾病的地区差别和环境的可能关联、疾病治疗价格的差别、以及医疗事故的原因。更重要的是可以通过就诊病人和已知病例的比较,发展帮助医生诊断、找出最佳治疗方案的智能助手,从而打破地区、城乡在诊断和治疗能力上的差别。
电子病历的重要性可以从这方面科研文章发表的数量上看出来。在PubMed上收集的论文数从2008年的100篇井喷到2014年3000篇左右,而从2018年又开始快速增长起来,去年有3500多篇。其中深度学习在这方面的应用也从2015年的两篇快速增长到去年的99篇,今年到现在也已经有了92篇。我国在电子病历科研上的工作总体还很少,2020年的最新100篇里只有2篇是中国的。不过今年92篇电子病历深度学习的工作里面有13篇是国内的,反映出我国在深度学习上的实力。但国内的一些朋友告诉我获取数据的过程困难重重,有时甚至同一个医院里不同科的数据都有不同的障碍。
既然电子病历大数据有这么重要,为什么还没有实行电子病历的统一呢?事实上国家已经推动10多年了,但进展甚慢,规模小、层级低、不同地区数据割裂。原因是多方面的:执行需要的费用、医生花费的时间、病人隐私的保护、当然还有数据拥有者的利益。要解决这些问题,我个人认为由国家统一招标、统一实行就可以极大地降低费用、打破数据垄断,而快速语音输入是减少医生工作量、普及电子病历的必由之路。目前杭州走在了全国的前面:从去年8月在全市6千多家定点医药机构开始全面推行电子病历,但只仅仅是开始,而且不知道所有电子病历是否在一个全市统一的数据库里。