手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

化学计量学在中药复杂体系研究中的应用

魏玉辉

   20世纪是化学合成药物的大发展时期,随着时间的推移,从合成的化合物中筛选药物的命准率越来越低,而成本愈来愈高。人们不得不重新回到从天然产物中寻找新药的老路上来。因而,21世纪对中药/天然药物来说充满了机遇与挑战,伴随科学技术与先进仪器设备的不断出现,中药研究将迎来一个全新的大发展时期。我国有丰富的中药资源、有悠久的中药使用历史,在中药的临床应用和研究方面积累了非常丰富的经验。随着人们对中药不断的深入研究,一系列复杂的问题摆在了研究者的面前,诸如:中药发挥作用的主要药效物质是什么?中药药效发挥的作用机理是什么?如何有效的控制包含有几十种甚至几百种化合物的中药质量?这些问题的出现成了制约中药现代化发展的瓶颈问题,也成了研究者面临的重要科研任务。中药是包含了众多化学物质的有机复杂体系,其药效的发挥是该体系中所有物质的共同贡献,因此,中药的研究必须遵循“整体”的思想。脱离了中药的“整体”去研究,就背离了中医药博大的理论体系,形成的研究结论就会带有很大的局限性和片面性。 近年来,研究者提出了中药的“大质量观”、“药效质量观”等一些符合中药理论体系的研究思路和方法,对于中药的进一步研究具有重要的指导意义。复杂问题的解决离不开先进的仪器设备和处理复杂数据的手段,现代色谱、光谱技术的发展和化学计量学方法的介入为中药复杂体系的研究带来了有效的手段。本论文主要针对中药产地、质量控制、药效物质研究以及植物中挥发油提取、鉴别等的研究中存在的问题,结合现代色谱、光谱技术和化学计量学中相关算法对这些问题进行初步探讨,以期为中药的深入研究提供一些有意义的研究思路和值得借鉴的方法。 第一章对本文研究中涉及的支持向量机(support vector machine, SVM)、最小二乘-支持向量机(least square support vector machine, LS-SVM)、多元线性回归(multiple linear regression, MLR)、遗传算法(genetic algorithm, GA)、随机森林(random forests, RF)、k邻近算法(k-nearest neighbor, kNN)的理论原理进行了简单介绍,并对这些方法在中药研究中的应用进行了综述。 第二章采用近红外光谱技术(near infrared spectroscopy, NIR)获取不同产地当归药材粉末的光谱图,原始光谱数据经标准化处理后求一阶导数后分别采用随机森林(RF)和k邻近算法(kNN)构建当归产地分类模型。RF模型训练集和测试集的分类准确率分别为92.21%和94.74%,kNN模型训练集和测试集的分类准确率分别为94.81%和94.74%,3倍交互检验值为94.81%。此外,RF选择出的9个变量(波数)与样品中化合物组成信息高度相关,在一定程度上可以反映模型与当归中化学组成的相关性。此外,所建RF和kNN模型用于30个不同产地、产期当归的产地判别,RF模型的判别准确率为80.00%,而kNN模型的判别准确率为86.67%。以上结果表明RF和kNN结合近红外光谱可以对当归产地进行判别,且kNN模型具有更好的应用能力。 采用HPLC法测定当归样品中阿魏酸的含量、以中国药典法测定当归醇提物的含量,分别采用遗传算法-最小二乘支持向量机(GA-LSSVM)和遗传算法-多元线性回归(GA-MLR)结合当归近红外光谱建立当归中指标成分的定量模型。阿魏酸的定量模型GA-MLR (R2=0.719、Q2LOO=0.684、RMSEP=0.010)、GA-LSSVM (R2=0.649. Q2LOO=0.646、RMSEP=0.014);醇提物定量模型GA-MLR (R2=0.704、Q2LOO=0.664、RMSEP=0.027). LS-SVM (R2=0.990、Q2LOO=0.574、RMSEP=0.045)。结果表明两种定量指标的GA-MLR模型结果均好于GA-LSSVM的结果,说明当归中阿魏酸和醇提物的含量与近红外光谱之间的定量关系更符合线性体系。 建立HPLC-DAD-ELSD色谱联用方法对复方丹参片中11个活性成分进行含量测定,以活性成分含量为变量采用特征递归消除-支持向量机(RFE-SVM)对变量的重要性进行排序,采用最小二乘支持向量机(LS-SVM)建立分类模型,对影响模型的重要核函数参数进行优化。LS-SVM模型的准确率为96.67%,交互检验的准确率为90.00%,选出的两个重要变量为人参皂苷Rb1和Rd,说明这两个化合物在复方丹参片质量方面有重要影响,可以认为它们是复方丹参片潜在的质量控制指标。 第三章采用氧自由基清除法(DPPH)对56个当归样本的醇提物的抗氧化活性进行评价,以抗氧化能力为指标结合醇提物紫外光谱构建GA-MLR定量模型,从推荐的100个模型中最终筛选出1个最佳模型,训练集的模型参数为R2=0.721、Q2LOO=0.623. RMSE=0.085;测试集参数R2test=0.711、RMSEP=0.080,结果表明GA-MLR模型具有一定的可靠性和预测能力,可以实现以当归醇提物的紫外光谱对其抗氧化能力进行预测,从而达到以药效控制当归药材质量的目的。 采用近红外光谱(NIR)获取27个复方丹参片粉末样本的近红外光谱,以各样本对大鼠的活血化瘀(出血时间)药效为指标,采用GA-MLR方法构建定量谱-效关系(quantitative spectrum-activity relationship, QSAR)模型,并将模型初步应用于外部样本的药效预测。最佳GA-MLR模型参数为R2=0.888、Q2Loo=0.832、R2-scrambling=0.102、RMSE=0.085,模型的外部检验参数r2和:RMSEEXT分别为0.825和0.112,该结果表明所建GA-MLR模型具有较好的预测和应用能力,可以通过近红外光谱对复方丹参片的质量进行有效控制。 第四章平胃散为传统中药芳香剂典范,具有调节胃肠动力的作用,因而挥发性成分可能在其药理作用中具有重要贡献。本节对平胃散挥发油的组成及其成分来源进行了分析,并对挥发油及其组方药材挥发油促进大鼠胃排空作用进行研究,采用GA-MLR和GA-SVM建立了平胃散挥发油促进大鼠胃排空作用的定量组-效关系(quantitative composition-activity relationship, QCAR)模型,对平胃散挥发油中促进大鼠胃排空作用的药效物质进行筛选。平胃散挥发油中主要含有β-桉叶醇、茅术醇、D-柠檬烯和沉香螺醇;研究结果表明平胃散、厚朴、陈皮挥发油具有较强的促进大鼠胃排空的作用,但苍术挥发油对大鼠胃排空无明显促进作用。GA-MLR模型的R2(0.826)和RMSE (4.297)值略好于GA-SVM模型(R2=0.804,RMSE=4.666),但GA-SVM模型的Q2LOO(0.783)和RMSECV(4.861)优于GA-MLR模型(Q2LOO=0.697,RMSEcv=5.664)。该结果初步表明,挥发油化学组成与促进胃排空作用之间可能存在非线性关系,GA-SVM模型能够较好的反映挥发油组成与药效之间的QCAR关系,GA所选出的模型变量D-柠檬烯和β-桉叶醇可以认为是挥发油促进大鼠胃排空作用的主要药效物质,同时Cyclohexanemethanol可能具有抑制大鼠胃排空的作用。 第五章针对目前水蒸气蒸馏装置的缺点,自行设计了一套同时水蒸气蒸馏萃取装置用于植物中挥发油的提取;采用该装置对薄荷、陈皮、当归、辛夷四种中药材中挥发油进行提取并采用气质联用技术(gas chromatography-mass spectroscopy, GC-MS)对其化学组成进行分析,结果表明采用新型装置四种植物中挥发油产率分别增加了25%、39%、50%和42%,所鉴定出来的化合物个数也有不同的增加,同时,新型装置的提取时间仅为传统装置的一半,研究结果表明,设计的新型挥发油提取装置可作为一种高效的挥发油提取器用于植物中挥发油的提取。 挥发油GC/GC-MS分析过程中化学成分的鉴别是一个难题,尤其对于具有相似结构的化合物来说。研究中以本章研究中四种植物的挥发油中化合物的结构与GC保留时间建立定量结构-色谱保留时间模型(quantitative structure-retention relationship, QSRR),并对模型进行内部和外部验证,同时将模型应用到挥发油中化合物色谱保留时间的预测及以保留时间为指标的化合物辅助鉴别中。所建最佳GA-MLR模型具有良好的内部预测能力(R2=0.974, Q2LOO=0.910, RMSETrain=0.489)和外部预测能力(Q2EXT=0.984,r2=0.960和RMSEEXT=0.361).对相同色谱保留时间推荐的化合物的色谱保留时间进行预测用于辅助化合物鉴别,结果表明该模型具有较好的应用能力。……