1. 新雨淘中医-让老百姓都看上好中医首页
  2. 纯医案

刘保延:大数据绘制当代中医航海图

刘保延:大数据绘制当代中医航海图

刘保延,中国中医科学院常务副院长,首席研究员、主任医师。长期以来致力于“中医和针灸临床疗效评价方法”的研究工作,借鉴临床流行病学、循证医学的理念和方法,遵循中医自身发展规律,充分利用数字信息技术等,牵头开展了20多项国家重大科研项目。近年来,在国内外期刊发表论文200多篇,出版著作10余部。

●利用大数据的继承创新过程,不同于靠抽取小样本产生的精确数据,通过因果关系的分析来回答“为什么”,但可以靠多源混杂全样本,通过相关关系来较好地回答“是什么”,通过数据发声,来帮助人们做出更加准确的决策和对未来的预测。在大数据背景下的继承创新之路,将会使人们从因果思维的束缚中得以解放,通过相关思维的世界观,把更多的精力放在提高服务质量和能力上,放在解决发展中的具体问题上。

●如果能够抢抓机遇,绘制出当代全新概念的中医航海图,将会使有蕴含了数千年丰富实践经验中的继承创新成果得以激活,使辨证论治个体化诊疗能力、对人体健康状态的预测能力以及防病治病、促进人体健康的服务能力大大提升。大数据支撑下的中医药也必将在当代航海图的指引下,从传统的经验医学转化为循证医学,产生一场脱胎换骨性的变革。

●中医学理论体系是一种“关系本体”,强调了主客体的一致、互动和相互影响。她尽管还不能很好地从生物学的角度解释“为什么”,但却可以很好地告诉你“是什么”,而正是这些“是什么”已经给人类健康保障做出了巨大贡献,同时也使其流传数千年而不衰。而大数据时代关注相关关系的强劲东风,无疑可以吹散当代科学长期以来追求“因果关系”而笼罩在中医头上的阴影,使中医可以理直气壮地沿着自身规律发展,更加道路自信、理论自信、方法自信。

大数据时代已经到来

2008年9月,《Nature》出版了一个专刊,讨论大数据存储、管理和分析等问题,昭示着大数据时代的到来。之后麦肯锡公司、《Science》先后出版大数据报告和专刊。大数据的讨论在中国也风起云涌,中国计算机学会于2012年10月在大连成立了以中国工程院院士李国杰为首的大数据专家委员会,国家自然科学基金委于2013年3月在上海举办了第89期双清论坛“大数据技术与应用中的挑战性科学问题”。

2009年,在甲型H1N1流感爆发的几周前,互联网巨头谷歌公司的工程师在《Nature》杂志发表一篇令人震惊的论文,该文根据互联网上5000万条美国人最频繁检索的词条如“哪些是治疗咳嗽和发热的药物”等,与美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行比较,发现了45条检索词条的组合,再将它们用于一个特定的数学模型所预测的流感发病趋势与CDC曾经预测的相关性高达97%。该论文不仅预测了流感在美国全境的发生,还预测了在不同州或地方的传播趋势,而这样的预测不像疾控中心只能在流感爆发一两周之后才可以做到。大量类似的例子告诉人们,大数据已经在你身边。大数据的运用已经悄然启动了一次重大的时代转型!

什么是大数据,其概念定义至今莫衷一是。2012年8月份国际数据挖掘会议SIG KDD的大数据论坛,从数据存储角度认为大数据应该是10台服务器也无法存储的数据,这样的数据必须进行在线分析,否则计算机存储无法支持;有专家从数据分析角度认为,数据结构很复杂,现有方法无法处理,必须采用类似谷歌的Hadoop平台进行处理的就是大数据。而在2013年维克托·迈尔·舍恩伯格和肯尼斯·库克耶出版的《大数据时代》,则从数据利用价值的角度认为“大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上是无法完成的。大数据是人们获得新的认知,创造新价值的源泉,还是改变市场、组织机构、以及政府与公民关系的方法”。

总之,笔者体会“大数据”不仅是数据量大,数据结构复杂,而且应该是动态变化、蕴含着丰富使用价值的数据。如今在我们身边具有大数据潜质的信息资源随处可见,目前大多以纸张或模拟信息媒介的形式存放,但随着数字信息技术、网络技术以及物联网技术的出现和应用,他们大都可以被数据化后而激活,成为拥有巨大创新价值的宝库。而中医药领域浩瀚的古代医籍、大量病历资料与现代科学研究文献,以及随着物联网的广泛应用,人们衣食住行过程以及健康信息监测所产生的数字信息,也都将成为可以有力促进中医药和人类健康事业发展的大数据。

大数据是继承创新的源泉和利器

远在1855年,时任美国海军的马修·方丹·莫里利用前人遗留的具有大数据潜质的航海日志,绘制出给航海业带来巨大变化的航海图。航海日志是船长个人的航海经历的记录,但这些经验信息并没有得到应用。而莫里在发现库房中存留的大量航海日志后,他与20位从事数据处理的人,一起把破损的航海日志记录的有用信息,通过数据提取,制成表格,整合数据之后,把整个大西洋按经纬度划分成了5块,并按月份标出了温度、风速和风向等。于是,这些来自破旧脏乱航海日志的信息,变成了有效的航海路线图。为了不断地提高航海线路的精度,莫里要求航海图的使用者都要将航行经历,使用事先特定的表格继续记录成航海日志,他们再根据航海日志产生的数据不断地修订和完善航海图。航海图使用后使原航行路程缩短了三分之一,并大大减少了航行的危险,此后不仅得到美国海军的使用,而且也被商船大量使用。

尽管谷歌公司预测流感发病趋势与莫里绘制航海图相差了100多年,如今存储、管理和利用数据的方式与速度已经发生了革命性的变化,但二者都是在“继承”已经存在的“检索词条”或“航海日志”的基础上,将这些信息数据化,而后利用这些数据创造出了那些记录“航海日志”或在互联网检索的人们不可想象的创新成果。

所以我们可以看到,大数据是继承创新的源泉,也是继承创新的有力工具。利用大数据的继承创新过程,不同于靠抽取小样本产生的精确数据,通过因果关系的分析来回答“为什么”,但可以靠多源混杂全样本,通过相关关系来较好地回答“是什么”,通过数据发声,来帮助人们做出更加准确的决策和对未来的预测。在大数据背景下的继承创新之路,将会使人们从因果思维的束缚中得以解放,通过相关思维的世界观,把更多的精力放在提高服务质量和能力上,放在解决发展中的具体问题上,他必将大大推进社会发展的进程和速度。

用大数据绘制中医药的航海图

作为持续发展了数千年的中医药学,以人为中心,以显著的临床效果为基础,将人体状态变化与干预方法相关联,构建了其系统的理论体系,形成了其自身发展道路。继承创新是其发展的主要模式,从临床中来、到临床中去是其发展的主要途径;“名医”是其发展的重要载体和代表,而浩瀚的医籍著作则是中医丰富经验和体悟的真实记载,是中医药理论与新方法、新技术的重要源泉,也是真实记载中医发展历程的“航海日志”。

历代不断有人对这些“航海日志”进行着整理总结和提炼,并已经绘制出了不同层次的“航海图”,指引着中医航行的方向。如目前可见的最早系统阐述中医理论的《黄帝内经》、辨证论治鼻祖《伤寒杂病论》都是先贤们在“勤求古训、博采众方”,结合临床经验对大量已有中医“航海日志”的梳理中,所绘制的中医“航海图”。这些“航海图”,在数千年发展历程中,指引着中医药的发展方向,指导广大中医药“航海者”,拯救了无数人的生命,为人类健康做出了巨大贡献。

“航海图”的绘制,关键是靠有效的数据,而从浩瀚医籍提取出特征数据并将其整合升华,变成新的知识,则靠创新思维以及相应的方法和技术。以往中医航海图的绘制,是将大量医籍或临证记录通过摘抄等方法提取特征数据,而后主要是靠“悟性”与渊博的知识来提炼升华而成。但受到古医籍存在方式和个人占有量和可阅读量的限制,以及有效数据提取和融合加工能力的制约,绝大多数中医的航海日志的有效信息并没有得到系统提取利用,而对于隐藏在大量混杂数据中的知识,也没能被很好的挖掘出来,中医宝库中大多数的精华并未得到激活和利用。

当代,中医药的数据资源已经有了极大的丰富,除了浩瀚的古代医籍外,现代大量的研究文献(包括现代医学与生物学研究文献)以及动态更新的、多媒体的临床病历资料等,已经形成了真正意义上的“大数据”。而已经被广泛使用的数字信息技术、网络通讯技术、物联网、数据挖掘利用与数据存储与传输技术等,则为绘制当代中医药航海图提供了有力的技术支撑。如果能够抢抓机遇,通过多学科人员的密切合作,组织起中医药大数据产生、管理与利用的专业化队伍,搭建起相应的技术平台,以丰富的文献和临床资源为基础,整合现代医学和生物学等研究的成果,以临床问题为驱动,以数据为导向,借助数据模型,绘制出当代全新概念的中医航海图,将会使有蕴含了数千年丰富实践经验中的继承创新成果得以激活,使辨证论治个体化诊疗能力、对人体健康状态的预测能力以及防病治病、促进人体健康的服务能力大大提升。大数据支撑下的中医药也必将在当代航海图的指引下,从传统的经验医学转化为循证医学,产生一场脱胎换骨性的变革。

当代中医航海图的绘制已起步

近些年,随着信息技术的不断发展和应用,作为国家队的中国中医科学院,已经从古代医籍、现代文献与临床病历数据化入手,为绘制当代中医的航海图奠定了丰厚基础。

中医古代医籍数字化、数据化与知识库建设工程已经初具规模

由柳长华研究员牵头的中国中医科学院中医古籍数字化研究团队,整合全国百余位专家组成的专业化古籍整理、校勘、数字化、数据化的研究队伍,形成了“国家中医古籍整理与数字化研究中心”。截至目前,在国家中医药管理局、国家科技部基础条件平台建设等项目支持下,累计完成1690种中医古籍的图像扫描,约139万余页。完成了其中613种古籍(约6957万字)的文本识别工作,部分古籍资源实现了图文对照和全文检索功能。建设了800种中医古籍的影像数据库和全文数据库。完成了350种中医古籍(约4500万字)的深度加工标引工作。此项工作从2000年开始首先形成了“基于知识元的中医古籍计算机知识表示方法”,解决中医古籍数据化的问题,在此基础上研究团队又制定了《中医古籍数字化文本校勘整理规范》《中医古籍疑难字处理规范》《中医古籍图像采集管理规范》《中医古籍图像处理技术标准》《中医古籍元数据规范》《中医古籍知识元标引流程规范》等一系列指导古籍数字化建设的技术标准及系列古籍知识标引手册等,研发了“中医古籍知识加工平台”、“中医古籍叙词表加工系统”、“中医古籍知识库”、“中医古籍阅览系统”等,为中医古籍大规模数字化、数据化建设以及面向临床的知识服务提供了技术保障。解决了中医古籍数字化以及数据化的技术难题。目前,利用古籍数据资源进行数据挖掘的方法正在研究之中。中医古籍数字化、数据化工作以及中医古籍知识库的构建,已经为利用古代医籍绘制当代中医航海图,提供了有力的工具,奠定了雄厚的基础。

中医现代科技数据共享平台,已经成为国家人口健康科学数据共享平台的重要组成部分

由崔蒙研究员牵头的中国中医科学院中医药信息研究所的研究团队,自1984年开始进行中医药学大型数据库的建设,制定了中医药元数据标准、中医药一体化语言系统等,基于WEB技术等建立以中国中医科学院为中心的中医科技文献共建平台,形成了全国35家单位300多位研究人员组成的中医科技文献数据化建设队伍,创建了中医、中药、针灸、古籍文献类数据库100余个,包括1984年以来的中医药期刊文献数据库、疾病诊疗数据库、各类中药数据库、方剂数据库、民族医药数据库、药品企业数据库、各类国家标准数据库(中医证候、治则、疾病、药物、方剂)等相关数据库。所有的数据库都可以通过中医药数据库检索系统提供中文(简体、繁体)版联网使用;部分数据提供英文版;所有数据库还可以获取光盘版。中医药数据库检索系统可以实现单库与多库选择查询。单表数据库检索可选择最专指的一个数据库进行相应字段的检索。多库可以进行跨库、多类检索。为了充分利用这些科学数据资源,研究团队还建立了数据挖掘方法的整合平台与高性能运算的技术平台。目前,作为国家人口与健康科学数据共享平台的重要组成部分,为全社会国内外用户提供着科学数据的服务。成为利用现代科技文献绘制当代中医航海图的有力工具。

中医临床科研信息共享系统已经初具规模,临床数据采集与海量数据分析利用的技术平台已经在20多家医院搭建

中国中医科学院临床评价方法的研究团队,从2001年开始在北京市科委重大项目的支持下,就着手建立中医临床科研信息共享的技术体系,解决将临床实际诊疗信息实时数据化以及对复杂海量临床数据的分析利用的问题。到目前为止,“共享系统”已经建立了“数字化中医临床术语应用体系”、“结构化的临床科研一体化数据采集系统”、“临床数据前处理系统”、“中医临床数据仓库系统”、“中医临床数据多维检索查询与展示系统”与“中医临床数据挖掘系统”。“共享系统”已经在国家临床研究基地等20余家医院进行了搭建并投入使用。中医临床数据仓库已经有了10余万数据化的病历资源,并以此为基础开展各种研究超百项。以“中医临床科研信息共享系统”为技术支撑,以“真实世界临床研究范式”为指引,将临床实际诊疗信息数据化并开展研究的工作已经开始起步。符合中医自身发展规律的中医临床研究方法与技术体系已经初步形成。

利用古代文献、现代科技文献以及临床实际诊疗信息等中医数据资源,绘制当代中医航海图的时代工程已经有了坚实基础。时不我待,拥抱大数据,实现中医腾飞的中医梦,必将成为现实。

绘制当代中医航海图的当务之急

要转变观念,尽快从因果关系的渴求中解脱出来,高度关注相关关系,找到不断提高中医疗效、提升服务质量和能力的根本途径

观念的转变是根本的转变。“大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系……这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。”

中医学理论体系是一种“关系本体”,强调了主客体的一致、互动和相互影响。它以“效”—“阴平阳秘”为尺度,建立了医者主体以及干预措施与患者客体功能状态间直接的、复杂的相关关系,成为一个独特的、系统的、可以有效指导临床实践的理论体系。这一理论体系是一个复杂的巨系统,她尽管还不能很好地从生物学的角度解释“为什么”,但却可以很好地告诉你“是什么”,而正是这些“是什么”已经给人类健康保障做出了巨大贡献,同时也使其流传数千年而不衰。而大数据时代关注相关关系的强劲东风,无疑可以吹散当代科学长期以来追求“因果关系”而笼罩在中医头上的阴影,使中医可以理直气壮地沿着自身规律发展,更加道路自信、理论自信、方法自信。大张旗鼓地全力以赴通过相关关系,去寻找更加有效的方法、方药,提高解决临床难题的能力和水平,而不急于投入巨大的精力和资源,利用精确的“小数据”去回答“为什么”。当然如果中医学既能告诉“是什么”,同时又能很好的回答“为什么”,中医药学将会成为人们渴望的新医学!

搭建平台,激活周围潜在的大数据,加大中医数据资源的建设,使蕴藏在临床实践中的创新能量最大限度的释放出来

如果要将具有继承创新特点的古今“航海日志”,转变成能够有效服务于中医临床实践的“当代中医航海图”,除了要改变观念以外,还要通过数字信息技术,激活我们周围具有潜在价值的信息,快速扩充中医药数据资源,并在人工智能、数据挖掘等方法的支持下,人机结合,借助“悟性”使中医药大数据变成预测健康状态发展趋势、辅助诊疗决策的有力工具,提升中医服务能力和水平。

加快建设国家中医药数据中心,建立数据共享机制,围绕重大疾病采集大数据,尝试整合临床诊疗与医学研究数据。

丰富的中医、中西医结合临床资源是我国独有的宝库,也是许多人梦寐以求的资源。如果能发挥“举国体制”的优势,将有一定实力的中医医院的临床信息数据化并汇集起来,形成可以共享的临床数据资源,将会大大加快中医利用大数据发展的速度。可以借鉴国家临床研究基地临床科研信息共享系统建设的经验,按照临床科研一体化研究范式,围绕重大疾病建立数据分中心与国家临床数据中心。可以组织通过国家临床研究基地、重点专科等带动相应的科室或医院,在统一的标准规范下,进行数据的采集、汇聚与共享、分析等。国家数据中心不只是数据的汇聚地,也是数据化技术、数据分析利用技术的提供地,大数据项目的研究中心与多学科人才的培训基地。不久前,李嘉诚基金会与政府共同支持的英国首个综合运用大数据技术的医药卫生科研中心在牛津大学成立。英国首相卡梅伦在揭牌仪式上说,这一中心的成立有望给英国医学研究和医疗服务带来革命性变化,它将促进医疗数据分析方面的新进展,帮助科学家更好地理解人类疾病及其治疗方法。这是一个很值得关注的案例。

在目前的中医临床研究中,临床诊疗数据只是其中重要的一部分。为了更全面地从基础医学、临床医学和预防医学角度进行研究,要整合临床病历和相关医学研究数据,为中医辨证论治个体化诊疗体系提供基础原理支持和更深入的科学认识。要建立医学健康信息数据库,整合并融合古代文献数据、现代科技文献数据以及HIS、RIS、PACS、病理、用药等临床理化检测数据和基因表达、SNP、蛋白质组学、代谢组学以及新药临床试验等医学生物学研究数据,这样利用大数据所开展的研究,不但能回答“是什么”,同时也可以回答“为什么”了。

大力发展物联网技术,提高中医大数据采集的便捷性和准确性。

大力发展物联网技术,提高数据采集、存储、传输的规范性、正确性和广泛性。随着物联网技术的广泛应用,可以实时自动采集人们衣食住行过程的各种信息,同时可以通过穿戴式采集系统实时收集大量的人体健康状态的变化信息,提高信息采集的完整性、便利性、正确性,同时降低成本。物联网技术不仅在信息采集,而且在临床干预方面也很重要,比如可以提醒病人按个性化时间进行用药,提高药物疗效等。

充分利用数字信息技术,大力发展中医诊疗仪器设备,使其成为中医临床信息的重要组成部分,如果这些信息能够与临床诊疗信息融合,必将为提升中医诊疗水平提供有力的支撑。目前在模拟航天训练项目中中医四诊仪的应用,通过远程采集症状、脉诊、舌诊等信息的综合分析,为航天员远程健康状态的自动检测与干预提供了新的经验和数据。

深入推进研究大数据分析处理技术,建立适合中医数据复杂特点的挖掘框架。

抽提中医数据分析中的需求,发展智能信息处理技术,有针对性地提高中医信息处理的效果。从数据分析角度看,中医数据存在多维、非线性、动态等特点,针对中医特点研究开发智能信息处理技术,如数据预处理、数据挖掘、模式分析、分类、聚类等技术,从大量临床数据中发掘隐藏在现象背后的知识,可以发掘以往靠人无法找出的规律。而且专家经验也在与时俱进,通过计算机可以自动、实时跟踪医生的思路变化,总结最新的辨证思路和用药经验,提高青年名中医的培养效率。利用智能信息处理技术,才能挖掘出中医辨证论治个体化诊疗规律,才能结合互联网技术,实时采集人和外界环境的信息,实现个体化医学。

创建体制和机制,为数据化和海量数据资源管理利用的系统工程保驾护航,才可能源源不断地从那些最不可能的地方提取出有价值的数据并形成大数据

要形成中医药大数据,要使浩瀚的中医药古籍数据化、使数十万现代研究报告数据化、使每天就诊患者病历数据化,变成用之不竭的数据资源,有以下4个方面的问题需要解决:第一,需要投入资金、投入大量的人力、物力;第二,只有将大家的数据资源汇集起来,建立国家、地区层次的中医药数据中心、分中心,中医药的大数据才可能很快地产生,而且可以有序地管理和高效合理地利用;第三,既然数据变成为有巨大价值的资源,资源利用的权限、使用的方法、资源相关的伦理问题、隐私保护、知识产权保护问题等均会很快成为发展的拦路虎;第四,数据资源的建设和利用,是一个在高技术支撑下的系统工程,如何建立工程实施的流程、保障工程顺畅运行、保质保量完成工程目标等等,这些均需要相应的法律、法规或管理的办法与运行的机制。其中,专业化的机构是一个核心,而产、学、研紧密结合的运行机制也是成功与否的关键。

在中医药领域开展大数据研究,要特别重视多学科人才的培养,要构建中医药大数据研究人员的知识体系,要能清晰认识中医药创新发展面临的关键问题,要有临床经验,还要了解甚至掌握计算机、数据结构、数据分析挖掘模型等知识和技术。要勇于吸纳跨学科人才,促进企业和研究机构的结合,为中医数据分析、挖掘提供充足的技术工具。具体来说可以考虑尽快设立大数据研究生班,吸收中医和数据科学领域的专业研究人员,培养既懂中医,熟悉临床,也擅长数据采集、分析的复合型人才。

来源:中国中医药报

刘保延:大数据绘制当代中医航海图

特别声明:本文取材于网络公开信息,如有错失或侵权,请即告知我们。欢迎携手进步,谢绝无理求删。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

15380042975

在线咨询:点击这里给我发消息

邮件:724648565@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code