手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

支持向量机方法在医学和环境化学中的应用研究

阮晓芳

   由Vapnik及其合作者提出的支持向量机(Support Vector Machine,SVM)是一种新型机器学习方法,因其出色的学习能力,已成为当前国际机器学习界的研究热点。近年来,对SVM的研究主要集中在对SVM本身性质的研究和完善以及加大SVM应用研究的深度和广度两方面。目前为止,支持向量机已应用于模式分类、回归分析、函数估计等方面。本文将支持向量机引入到环境化学和医学等领域,拓宽了支持向量机的应用范围,促进了学科间的交叉。 本论文第一章简述了定量结构-性质关系(Quantitative Structure-Property Relationship,QSPR)的基本原理,实现步骤及研究进展。同时详细描述了SVM的基本原理并综述了其在QSPR中的应用。这些理论和现状分析为我们开展本论文的研究工作提供了理论基础和依据。 在第二章中,应用QSPR方法研究了烷基苯酚类化合物气相色谱保留值与其结构参数之间的定量关系。运用启发式回归方法和支持向量机方法分别建立了44个烷基苯酚类化合物的结构与其色谱保留值之间的线性和非线性模型。两种方法的相关系数(R~2)分别为0.98和0.92,相应的均方根误差(RMS)分别是0.99和2.77。通过对两种模型的稳定性和预测能力的比较,发现线性模型能够更好地反映烷基苯酚的气相色谱保留值与其结构参数之间的定量关系。在已知烷基苯酚类化合物结构参数的情况下,线性回归模型更有助于它们的色谱分析。 在第三章中,应用启发式回归方法和SVM方法分别建立了55个药物分子与其血脑屏障通透性(logBB)之间的定量结构-性质关系模型,并探讨影响药物血脑屏障通透性的结构因素。预测结果表明,支持向量机回归模型性能(相关系数R~2=0.89,均方误差MSE=0.06)要优于启发式回归模型的性能(相关系数R~2=0.82,均方误差MSE=0.11)。描述符HASA2,No,FPSA3和E_(nn)(CH)都是影响logBB的主要结构因素。支持向量机模型简单快速,在药物设计中可以用来预测候选药物的logBB值。 在第四章中,使用线性判别分析(Linear Discriminant Analysis,LDA)方法和多类支持向量机(Multi-class Support Vector Machine,MSVM)分别建立了线性和非线性的三类分类模型来辅助诊断甲状腺疾病。分类结果显示MSVM模型具有很高的预测能力,它代表着一种有效、可靠的诊断甲状腺疾病的方法,而且可以被用于诊断其它的疾病。……   
[关键词]:化学信息学;定量结构-性质关系;启发式方法;线性判别分析;支持向量机
[文献类型]:硕士论文
[文献出处]:兰州大学2007年