手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

中医证候的数据挖掘

王彦

  中医对中华民族的繁衍昌盛发挥了不可磨灭的作用,其独特的整体观和辨证论治的治疗模式在一些慢性疾病如肝硬化的治疗中显示出特有的优势,中医越来越受到各国人民的重视和欢迎。辨证论治是中医理论和临床的重要支撑,其目的是提供给患者最为合理的个性化治疗方案。辨证论治的前提是辨证,但证候决策方式的经验性、模糊性、随意性和不确定性左右着整个辨识证候的过程,严重制约中医理论的推广和应用。如何从已有的病例数据集中构建辨证模型,将辨证过程规范化和客观化是中医发展需要面对的一个问题。 本文旨在运用数据挖掘技术从收集到的病例中发现中医辨证的规律,为中医临床实践提供现代化的技术手段。但由于中医证候信息不同于其他领域数据的多模式特征,决定了中医辨证研究不能是简单的因果推断。为此,本文在系统分析中医辨证的研究现状和数据挖掘相关算法的基础上,提出适合于中医辨证的理论方法和系统实施方案。 1.基于中西医双视图的属性选择 中医数据集包含从主、客观手段获取的数据,属性种类繁多,但病例样本却非常有限,正确有效的属性选择是构建中医辨证模型的重要基础。本论文提出了基于中西医双视图的多分类器属性选择方法BVFS (Bi-View Feature Selection)。该方法利用领域知识,将属性空间分割成中、西医视图,并在两视图中分别训练多个分类器,以分类精度作为属性子集选择的评价标准,以提取和证候最相关的中医症状和西医指标。该方法从中西医两个侧面提取判断证候的关键属性,为后续证候分类模型的构建奠定基础。 2.针对欠规则中医数据集的属性层次辨证模型 目前中医症状数据化表示的量化标准不够规范,导致某些中医数据集的辨证规则欠缺。针对这类欠规则数据集,本论文在多分类器属性选择方法的基础上,定义了联合属性测度、离散属性测度和合成权值等新概念,基于这些概念提出一种属性层次辨证模型AHSDM (attribute hierarchy syndrome differentiation model)。该模型在辨证时将中医医生积累的临床经验介入到样本病例的学习过程,以建立更合理的辨证规则,避免了完全依赖数据学习忽略中医个性化诊断的特色,从而更符合中医临床辨证的过程。辨证的合理结果作为新样本添加到满规则数据集中,为后续分类模型的构建奠定充足典型的数据。 3.针对满规则中医数据集的集成辨证模型 满规则数据集可以从数据中学习辨证分类规则,但中医症状和证候之间的关系比较复杂,用单一分类器很难提高其分类精度。本论文提出了辨证矩阵的概念和多视图集成辨证方法MVESD(multi-view ensemble syndrome differentiation)。在多分类器属性选择法得到的属性子集基础上,该方法利用领域知识将属性空间分为若干部分,在各局部空间以及整个属性空间分别训练中医辨证领域常用的多种分类器,选择分类精度好的部分分类器构成集成系统,以辨证矩阵确定样本的证候,通过对比实验,显示MVESD方法在中医辨证领域具有较好的分类性能。 4.辨证软件系统的构建 在研究中医辨证方法的基础上,论文研发了针对肝硬化病例的中医辨证软件系统原型,该系统利用所提出的属性选择算法,可获得与证候最相关的属性子集;系统的分类辨证模型可以判别新样本的证候;并在新样本的增加过程中,系统的辨证规则将得到不断完善。……   
[关键词]:中医辨证;数据挖掘;视图;规则
[文献类型]:博士论文
[文献出处]:上海交通大学2009年