中医药数据挖掘系统与算法

中医药技术研究 no finished
8 552
医学分享
医学分享 2023-05-30 08:04
数据挖掘软件与平台是中医药数据挖掘研究的一大利器。随着中医药数据挖掘类研究的兴起,各种中医药数据挖掘平台与软件随之出现。经典的数据挖掘过程一般包含数据准备、数据变换、建模、结果解释和展示 4 个步骤。数据准备与变换是由于每种模型要求输入变量的类型与属性不同,且有特定格式,所以需要进行数据准备、转换。而数据挖掘建模得到的结果如何与中医药专业知识结合进行解释与展示,对操作者的统计知识有一定要求,经典数据挖掘对中医药研究者过于抽象。早期进行中医药数据挖掘,统计软件是主要工具,但统计软件存在专业性太强、数据处理难度大等缺点,所以,专业的中医药数据挖掘软件应运而生。 专业的中医药数据挖掘软件,输入数据均为中医药研究者熟悉的病历数据、处方数据,不需要进行数据的准备与类型转换,对结果的展示也进行了注释,便于理解。专业的中医药数据挖掘软件背后依托专业 团队,版本更新快速且专业,不少中医药研究者为此 取得良好研究成果。现有的主流中医药数据挖掘软件 有:中国中医科学院中药研究所推出的“中医传承辅 助平台”与“古今医案云平台”,以及许多文本挖掘平台与软件,如沈阳教授的ROST RM系统、Weka 软件等。 中医药数据挖掘工具: 文献中出现最多的 3 种数据挖掘工具是 SPSS、 中医传承辅助平台、古今医案云平台。SPSS Modeler将数据挖掘过程简化为节点,相对于 SPSS Statistics 的数据界面更易操作。以用药规律分析为例,数据准备时需自己根据药典或其他标准进行药品名称标准化,繁琐且易出错。标准化后的数据需添加类型节点,转化为名义变量,才能进行网络图分析与关联规则分析。中医传承辅助平台的数据录入只能采用人工录入医案。古今医案云平台可按照相应格式导入数据,提高效率,扩大数据量,该平台包含数据标准化模块,自动进行标准化,只需人工审核纠错即可。 药品属性分析方面,若不采用专业数据挖掘软件,需 对照药典进行药物四性、五味、十二经及功效的对应关系分析,上述两平台在此方面比较便捷,可自动得到相应的雷达图。 中医药数据挖掘平台进行用药分析时,药物频次、属性、配伍、新方发现比较便捷,是用药规律文献较多的原因之一,也是内容模式化的原因。中医传承辅助平台与古今医案云平台均有症候分析与方证分析功能,但使用者较少,将数据挖掘更多地应用于方证分析是创新的方向之一。数据挖掘工具也越来越多样,不仅仅指中医药数据挖掘的平台与软件,随着 HIS 系统普及,数据挖掘系统与工具正与 HIS 系统整合,可在临床工作时进行科研分析。 中医药数据挖掘算法: 目前用药规律和辨证规律常用的数据挖掘算法为关联规则、聚类分析,主成分分析、因子分析,复杂网络分析并非经典数据挖掘方法,但应用广泛。关联规则即2个及以上变量的取值之间存在某种规律,如同时发生,或从一个对象可以推出另一个对象就称为关联。用药规律通过同时出现判断角药和对药,辨证规律确定证型对应症候,在文献计量学中的应用为共词分析,中药研究通过多个对象推出另一对象,将多药物之间关联展现。聚类分析将研究对象相似或相近的加以归类,将一组数据按照本身的内在规律分为几类。分类原则为组间差距大,组内差距小,把相似 的事物聚集在一起,进而尝试发现核心要素如核心处方、辨证核心要素,以及固定搭配如药症关系、新处方的发掘等。主成分分析与因子分析均为通过降维技术把多个变量化为少数主成分或因子的统计分析方法,这些主成分或主因子能反映原始变量的绝大部分信息,通常被用于症候与证型对应分析。复杂网络指通过将复杂系统内部元素抽象为节点,元素间关系抽象为边,从而构建具有复杂关联关系的网络。通过这种抽象,复杂网络仅保留系统内部组织结构及关联关系,过滤了其他复杂信息,从而使研究者可专注复杂系统内部特征及性质。复杂网络被用于建立中药药性、功效、方剂网络,也用于发现穴位或药物配伍规律。 算法应用方面,如果只是生硬采用经典数据挖掘方法进行中医药数据挖掘而不作相应改进,那么得到的仅为相关性的大小,而非症候-证型-方剂蕴含的因果关系,其结论仅是中医基础理论的验证,或无法解释被认为规避的异常结论。 中医药数据现存问题与解决方法。不同医院的诊断代码标准不同,中医医院采用中医证编码(TCD)而西医医院采用国际疾病分类(ICD)、医保诊断代码与院内代码不同、药品名称存在地域性差异等。解决此类问题,需标准化处理,中医药数据挖掘软件已对此开发了标准化模块。 中医药数据特性及模型适用性。中医病历数据的主观性较强,导致中医药数据整合与平台建立难度较大。在商业数据挖掘与互联网数据挖掘方向,数据来源为真实产生的记录,收集方向不受人工干预,分析一般以全面为主。中医数据,如证型、四诊症候、方剂药品属性、功效、药品组合等维度较广, 但由于样本数量太少,采用经典的数据挖掘算法所得 到的结论不如大样本数据有价值。因此,建立中医药结构化数据库,广泛收集有效病历数据,提取处理为目标数据,累积到一定数据量后再进行分析为解决方法。此思路与从CNKI、万方等数据库收集数据的文献综述类文章想法不谋而合。 中医处方疗效评价。目前中药处方有效性的疗效评价方法难以确定,缺乏权威系统的评价方法。如果无效的方剂数据较多,则挖掘结果的质量存在瑕疵。处方有效性判断是中医药数据挖掘问题的立题之本。中医疗效通常通过口碑传播。若有检查、检验指标可验证疗效的疾病,则可通过指标值对比进行疗效判定。不能通过指标值进行疗效评价的疾病,还需学者在疗效评价方面进行探索,如评价量表及完整的患者疗效评价体系。 随着人工智能技术不断应用,中医药数据挖掘乃至整个中医药临床与科研的发展方向均为信息化、智能化,中医药数据挖掘与HIS深度融合是大势所趋。中医药数据挖掘文献发表量逐年增加,临床工作者对其应用程度也不断加深,并更加贴近临床工作。在系统中嵌入中医药数据挖掘平台,通过将HIS数据进行抽取并进行标准化处理,解决了中医药数据挖掘中的 数据处理难题。在日常开具处方过程中,出现类似知识库的提示,将名老中医的经验直接展示推荐,将有益于日常临床处方、学习及病历书写标准化。可穿戴设备技术越来越成熟,中医症候与四诊信息的自动化 采集越来越可行。舌诊与面诊数据通过分析,可以得到标准化高质量的四诊数据与症候数据。可见主观化的问诊数据通过变成可量化的机器采集,能保证症候数据的客观性与标准化,推动数据挖掘在辨证规律上的应用。 中医药数据的结构化整合与展现越来越普遍。医院大量临床数据及管理数据的出现,刺激着数据挖掘 技术的深层次开发应用,并反向作用于医院的进一步发展。知识本体能更好传播中医治疗方法与名家经验,并与数据挖掘研究相互验证。 临床科研一体化与多维度数据整合也是发展中医药数据挖掘的方法。针对中医疗效无法判断的问题,可建立疗效评价与量表系统。整合的数据不仅包含辨证论治过程,还包含疗效评价与患者个人信息。疗效评价系统是针对疾病开发疗效评价方法,即将指标、量表、短信微信回访相结合,患者达到特定病程后自动评价疗效。
reply
  • 2023-05-31 22:16:00
    有一些医院在患者就诊后根据诊断特性进行短信或微信回访的
    0 reply
  • 2023-06-01 23:37:00
    目前对名老中医经验探究与数据挖掘研究,都是预设名老中医治疗某方面疾病的经验是有效的,但无客观指标哦
    0 reply
  • 2023-06-02 15:21:21
    近年出现的知识图谱与可视化软件有Gephi、 Bibexcel、 NetDraw、 CiteSpace 及 VOSviewer可快速全面从公开文献中挖掘中医隐性知识
    0 reply
  • 2023-06-02 21:33:00
    门诊病历的质量则难以保证,医院会硬性规定病历规范, 但门诊病历内容有可能缺失,用词不规范等等。 为求速度医生会以最简单方式完成门诊病历,就会使中医宝贵的四诊数据、既往史据不详细,可挖掘内容就少。
    0 reply
  • 2023-06-03 11:07:00
    数据的标准化程度不一致,会导致数据质量偏低、 处理费时又费力。。face[汗]
    0 reply
  • 2023-06-04 07:57:00
    现有中医药数据挖掘多源自经过人工挑选的数据,中医对症候的描述多为主观感受记录
    0 reply
  • 2023-06-04 09:54:00
    来源于结构化数据库的中医药数据挖掘研究可克服主观化小样本问题
    0 reply
  • 2023-06-05 05:57:48
    近年来,关于中医临床知识的本体构建逐渐增多了
    0 reply
Hot post list