诌议中医药多源异构大数据融合方法的重要性
时间:2019-06-05 来源:中华名医传承网 点击率:333
诌议中医药多源异构大数据融合方法的重要性
中国中医科学院 赵汉青 王志国
多源异构是大数据的基本特征之一,由于数据来源不同、数据结构不同、数据标准不同, 多源异构数据在类型、性质、形式、内容和时空关系上均存在极大的差异,容易导致数据信息共享和互联互通障碍。近年来,在医学、工业、农业、气象、海洋、地质等多个领域均对其相关的多源异构大数据的融合分析问题进行了研究,而在中医领域针对此问题的研究略显不足。
1. 中医数理化研究已陷入瓶颈
自 20 世纪 80 年代以来,国内开始对中医辨证论治信息化等数理问题进行研究,并从模糊数学、自动向量机、人工神经网络、概率论等数理角度解析中医理论,开始尝试对中医要素进行量化分析,产生了阴阳五行数学、中医专家系统及各类中医辩证思想的数学模型。
进入 90 年代后,由于信息技术的发展,国内外运用包括聚类分析、关联分析、贝叶斯网络、回归和判别分析、文本挖掘、因子分析和主成分分析、隐结构模型、马尔科夫模型、主题模型、信息熵等多种数据挖掘技术对中医辨证论治规律的发现和应用开展了广泛的研究, 发现或验证了许多理论规律,至今仍为研究热点。
迈入 21 世纪时,正逢互联网技术快速发展,卫生信息化工作迅速开展,大型医院均装备有医院信息系统,中医临床诊疗数据基本上实现了信息化存储,同时国内学者建设了多个大型中医药数据库、中医临床科研共享系统等中医药网络数据平台,集合了中医电子病历、中医药文献或其他专题数据,使中医药数据资源得到极大丰富,并在此基础之上探索中医证、治、法、药或其他中医理论规律,提出了多种中医诊断模型,设计了多种中医辩证人工智能算法,在中医信息化、数字化、智能化研究特别是中医临床辅助支持研究方面取得了许多有重要意义的成果。
然而,由于近几年云计算、大数据技术的高速发展以及精准医学概念的提出,大规模的数据显然不适合采用人工方法处理,传统数理分析和数据挖掘方法在中医诊疗模型的研究中表现出的局限性越来越大,已不能适应当前大数据背景下中医方剂规律的研究工作。
2. 未来中医信息主要由病证结合诊疗数据构成
近年来,病证结合的诊疗模式研究再次成为业内讨论和关注的热点[,现代中医已不太可能逃避学习现代医学知识。有学者认为,随着医学对疾病认识的不断深入,现代医学辨病不断细化,病证结合中的辨病也应相应细化,让病证结合成为中医临床的诊疗模式,有助于清楚认识疾病的本源和特点,利于中医处方规律的研究。
中医学内容博大精深,病证结合的临床诊疗模式需要医生积累大量的中西医知识,而中医临床实际中面临的庞大疾病谱却又与西医不同,如何让中医在临床处方过程中得到正确的辅助诊疗信息是当前中医药信息化研究需要解决的重要问题。而在未来大数据收集处理过程中,医院信息系统中存储的诊疗数据占据了相当一部分,这部分数据不可避免会混入相当的现代医学信息,这就造成未来中医药大数据将会包含大量病证结合诊疗数据。
3. 数据融合方法是中医药大数据应用研究的基础
2016 年 12 月 6 日,中国国务院发表《中国的中医药》白皮书,白皮书指出,中医药发展上升为国家战略,中医药事业进入新的历史发展时期。随着云计算、大数据、物联网等现代信息科学技术的不断进步,如何将中医药与信息技术相结合、总结发现中医诊疗规律的信息学原理和应用方法是目前尚未完全解决的理论难题。《中医药信息化发展“十三五”规划》指出,中医药信息化将进入实现“融入、整合、跨越”的关键时期,以国家级、省级数据中心为核心的中医药数据平台将不断收集并提供中医药大数据资源,如何将大规模病证结合中医药多源异构数据进行有效融合,是未来进行中医药大数据深层分析应用研究的关键基础问题之一。
4. 中医药多源异构大数据融合方法具有重要的应用价值
笔者认为,以多源异构中医药数据融合及其支持下的中医处方的数据融合方法为研究对象,采用定量研究方法,设计一种泛化的中医处方大数据模型,使语义丰富的中医数据可以在一定标准下得到存储和识别,揭示大数据和“互联网+”背景下中医病证结合诊疗规律的新特性,是当前急需进行的研究课题。
目前中医处方规律的研究多集中在一类病或一类证上,某些特定的数据可能只适合使用某种特定的方法进行分析,而大数据具有未分类、高维度的特性,发现并描述科学合理的中医诊疗规律是当前行业内需要解决的重要科学问题。该问题的成功解决可以为中医药理论和临床的信息学提供一种新的方法,能为中医“互联网+”服务和中医临床辅助医疗提供理论支撑,具有重要的理论意义和工程应用价值。
参考文献略