- 2015-03-02 15:43
- 作者:郑少丽
- 来源:中国数字医疗网
你以为“大数据”离你很远吗?你以为“大数据”的应用都是在炒概念吗?其实不然,传统的医疗行业正在迈入“大数据”时代,面对海量的医疗数据,你知道怎么用吗?你准备好如何应对它带来的挑战吗?笔者带着这些问题采访了南京军区南京总医院CIO马锡坤,请他结合医院实际情况谈谈他对大数据的理解及医疗机构是如何应对大数据带来的挑战。
南京军区南京总医院CIO马锡坤
医疗大数据应用的五大领域
医疗行业很早就遇到了海量结构化和非结构化数据的挑战 ,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。
总的来说,医疗大数据应用主要体现在临床操作、研发、新的商业模式、付款/定价、公众健康五大领域,在这些场景中,大数据的分析和应用都将发挥巨大的作用。
马锡坤强调,医疗大数据的应用对于临床医学研究、科学管理和医疗服务模式转型发展都具有重要意义,而且他坚信大数据技术的运用前景是十分光明的。
现身说法:大数据来了,医院面临哪些挑战?
HC3i:请您介绍一下医院现有的数据量及增长情况?
马锡坤:目前我院有5台存储设备,2台专用于PACS,其中HIS、LIS、EMR等数据3T,病案缩微数据12T,PACS数据120T左右,每个月的数据增长为2T左右。
HC3i:医院数据快速增长,而且结构类型复杂多变,如何存储、备份,如何进行快速查询及统计?
马锡坤: 医院和医疗行业面临的大数据主要有医学影像、视频(教学、监控)及文献等非结构化数据。由于这些数据增长很快且结构复杂,给数据管理和利用带来较大的压力,存储与管理成本不断提高,数据利用困难、利用率低。除了数据数量和形态的迅速增加,医疗数据还需要越来越长的保留期。一旦存储系统的安全性出现问题,导致医疗数据丢失,医院会面临严重不良局面。医疗大数据的应用要保证数据的全面性、准确性、实时性和使用的便捷性,要能快速运算和快速展现,要与日常工作平台紧密结合。
国人已经把健康大数据上升为国家战略,而面对“大数据”的挑战,医院必须考虑三大主要问题。
(1) 数据存储是否安全可靠?因为系统一旦出现故障,首先考验的就是数据的存储、灾备和恢复能力。如果数据不能迅速恢复,而且恢复不能到断点,则将对医院的业务、患者满意度构成直接损害。
(2) 如何提高医院运行和服务的效率?提高效率就是节省医生的时间,从而缓解医疗资源的紧张状况,在一定程度上可以帮助解决“看病难”的问题。
(3) 如何控制大数据的成本?存储架构是否合理,不仅影响医院IT系统的成本,而且关乎医院的运营成本,医疗数据激增,使医院普遍存在着较大的存储扩容压力。如今,医院的存储设备大多是由不同厂商构成的完全异构的存储系统。这些不同的存储设备利用各自不同的软件工具来进行控制和管理,这样就增加了整个系统的复杂性,使管理成本非常高。
HC3i:网络/数据中心如何“解压”?
马锡坤:经过多年的建设,我们利用高性能运算的计算机、高数据处理的存储设备、高带宽传输的网络,构建了优质高效的信息网络平台,建立了较为完整的医院管理和临床信息系统,积累了大量的医疗数据。但面对大数据的应用,对网络性能的要求较高,要提升数据交换能力及接入能力,要针对不同类型的数据采用不同的存储系统,而分布式文件系统存储较适用于医院PACS、电子病历等文档管理需求。数据中心面临的压力是数据量大,增长迅猛,数据类型复杂多样,而科学合理的存储架构有助于提高容量利用和资源配置水平,全面优化存储资源的成本效率。
HC3i:数据存储面临的挑战有哪些?
马锡坤:随着医疗信息数据的几何倍数增长,医院信息存储将越来越受到重视,医疗信息中心的关注点也将由传统“计算”领域转移到“存储”领域上来。医院在应用大数据技术方面还存在的挑战有:一是数据存储,数据的存储备份和动态扩容;二是数据共享访问,海量数据的快速访问和检索,以及实时共享交换;三是数据分析和挖掘,数据的快速统计,疾病分类、趋势分析、药物分析等;四是数据整合,建立主数据和主索引;对于区域医疗,要统一各医院间的病患数据,建立区域医疗系统中的病患主数据,这里既有技术难题,又有医院间的合作问题。
大数据来了,医院如何应对?
HC3i:上述诸多问题是否都可以借助大数据的力量予以解决?
马锡坤:答案是肯定的。
HC3i:Hadoop是所有大数据解决方案中最具成长性的平台,它通过集群搭建起的高性能计算和存储平台,利用分布式架构对海量数据进行分析和处理。请您谈谈对Hadoop的认识?
马锡坤:由于大数据时代的来临,国家会逐渐加大对电子病历的投入,各级医院也将加大在数据中心、IT外包领域的投入。我认为,医疗行业需要充分考虑健康云服务的特点和充分利用现有技术框架的灵活性,以达到最好的大数据分析性能。
Hadoop可以说是最常见的分布式计算,是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。Hadoop是一个能够对大量数据进行分布式处理的软件框架,可以实现平滑的横向扩展,对于应用程序透明,实现IT的基础设施与上层隔离;以一种可靠、高效、可伸缩的方式进行数据处理,能够提供对计算、存储和网络资源的统一调度和维护,提高服务器利用率,减少应用部署及运营成本。
存储和网络是Hadoop集群性能的重要保证。在Hadoop集群中,万兆位以太网带来带宽增长是导入和复制大型数据集的关键,英特尔的融合网络适配器提供了高吞吐量连接,同时英特尔SATA固态硬盘为原始存储提供了高性能,高吞吐量存储选择。
展望:更广阔的应用空间
HC3i:您认为目前的大数据在医疗行业的应用处于哪一阶段?
马锡坤:医疗行业相比其他行业更加严谨,因为“人命关天”,因此,其在IT创新上进度进对较慢,我认为,医疗行业大数据应用还处在起步阶段,但大部分医疗机构已经开始意识到大数据对于他们的重要性。目前很多大医院都在建立自己的CDR,大数据在CDR中有较为广泛的应用。对于大多数成功的医疗机构来说,利用大数据已经成为提高生产力、改进医护水平、增强竞争力、加快增长和创新的关键策略。
HC3i:电子病历是医院信息系统的基础,大数据如何服务电子病历?
马锡坤:一是数据挖掘。在全面建设的同时,我们更加注重信息系统的整合集成,数据信息的挖掘利用,充分发挥信息化建设的支撑作用,促进医院内涵发展。为实现医院综合管理的信息化、自动化、智能化、精细化,提高医院管理水平,我们利用数据仓库技术构建数据仓库和医院管理知识库;利用商业智能,对数据资源进行充分分析挖掘后进行多维度展示,实现了对医院海量信息数据的知识化转换和智能化应用,构建医院运营状况的指标考核、绩效管理、精细化分析、预判预警的精细化管理平台,为辅助决策服务。通过商业智能技术应用到医院数据挖掘和医院管理信息化中,可以提高管理效率和科学化,提升医院管理信息化水平。
二是质量控制。电子病历质量控制系统是进行电子病历环节质量控制和终末质量控制的必要工具。医院质量管理部门采用通过电子病历质量控制系统对各科室的患者诊治情况进行全程实时质量检查控制的质控模式。我们首先构建完整的电子病历质量控制标准规范,通过提取与此标准规范不相符合的存储内容,达到事前、事中、事后全流程的电子病历质量监管。对于数据挖掘的关键问题是要了解和满足临床和管理的需求,对于质量控制的关键问题是要制定详细的标准规范。
HC3i:未来医疗行业的大数据将会具体应用在哪些环节?
马锡坤:未来,大数据必将影响医疗行业,未来医疗行业的大数据将会具体应用在:临床辅助决策,医疗质量监管,疾病预测模型,临床实验分析。其发展空间有:个人健康门户,慢病管理和健康管理,电子病历和临床质量监控,医学知识管理,临床路径和循证医学,远程医疗和移动医疗,医学研究数据仓库和共享平台,跨医疗机构协作平台。
同时,随着民营医院、医疗机构的介入,医疗行业的商业竞争越来越大。