手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

基于图的半监督学习和维数约简方法及其应用研究

桂杰

   半监督学习和维数约简已经成为当前机器学习领域的研究热点。半监督学习研究的目的是在整个数据集中只有一部分样本有标记的情况下,如何对数据进行分类。本文主要研究的是基于图的半监督学习方法与应用。维数约简是在尽可能多地保持数据集结构的前提下,将数据集转换成一个新的数据集,新数据集的维数是原始数据集的本征维数。本文对基于图的半监督学习和维数约简方法与应用进行了系统的研究,具体来说,全文的主要工作概括如下: (1)提出了一种新的多步骤降维方法对基因表达谱数据进行降维。首先采用秩和检验方法来进行差异表达的基因选择,然后将排在前面的一定数量的基因再进行离散余弦变换,并采用主成分分析对变换后的系数进行主成分提取。我们首先将基于图的半监督方法引入到肿瘤分类中,采用基于图的半监督学习算法对抽取的主成分特征进行分类性能评估。 (2)针对基于图的半监督学习方法提出了一种新的自适应权值学习方法。传统的基于图的半监督学习算法大都采用高斯函数来计算图的边权。我们提出一种新颖的针对基于图的半监督学习方法的边权设计方法。该方法添加了标签信息,并且采用测地距离而不是欧氏距离来计算两个样本点之间的距离。此外,我们还添加了类的先验信息,并针对基于局部和全局一致性的学习方法来改进边权。实验结果表明,我们所提出的方法要优于原算法。 (3)提出了一种基于局部保持投影的监督特征提取方法,即局部保持判别投影算法。局部保持投影(LPP)没有加入判别信息,仅仅考虑局部信息。我们将类内散度矩阵和类间散度矩阵加入到LPP的目标函数中,从而提出局部保持判别投影(LPDP)方法。该方法的优点是能够最大化类间距离和最小化类内距离,同时保持LPP的局部保持特性。LPDP可被看作是一种组合了流形准则和Fisher准则的新方法。因此,与LPP相比,LPDP能够成功地找到具有更好判别性能的子空间,因而更适合于做分类,从而能有效地提高识别率。 (4)提出了基于谱回归的判别分析(Spectral Regression Discriminant Analysis, SRDA)和基于谱回归的核化判别分析(Spectral Regression Kernel DiscriminantAnalysis, SRXDA)的正则化参数估计方法。SRDA的正则化参数的估计在以往的研究中没有得到很好的解决。我们基于扰动的线性判别分析(Perturbation Linear Discriminant Analysis, PLDA)准则提出一种新的方法,来估计SRDA的正则化参数。在另一方面,SRKDA的正则化参数估计在以前的研究中也没有解决。我们提出两种方法来估计SRKDA的正则化参数,在不同数据集上的实验结果显示我们的方法是有效可行的。……   
[关键词]:基于图的半监督学习;维数约简;多步骤降维;局部保持投影;基于谱回归的判别分析
[文献类型]:博士论文
[文献出处]:中国科学技术大学2010年