手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

论文投稿系统评审专家自动推荐模型研究

刘一星

   文本自动分类是指在给定的分类体系下,根据文本内容自动确定文本所属类别。文本分类技术的出现,使文档可以自动地按照类别组织和处理,符合人类组织和处理信息的方式。同时,作为信息过滤、信息检索、搜索引擎等领域的技术基础,文本分类技术有着广泛的应用前景。 学报和学术会议所使用的论文投稿系统,涉及上千篇投稿论文要分配给上百位评审专家去审阅,在很短的时间内人工分配这些投稿论文给相关学科领域的专家们去评审往往匹配的不好。特别是评审专家的研究领域不清楚,人工无法及时、准确的收集到评审专家所属的学科领域信息,影响到论文分配任务的正常进行。选择合适的评审专家是正确评价投稿论文质量和提升学报、期刊学术层次的关键,如何用计算机来实现自动分配投稿论文给匹配领域的评审专家去审阅?文本自动分类可以很好的解决这个问题。 论文针对上述问题,提出一种基于文本分类技术的评审专家自动推荐模型,通过文本分类技术对投稿论文和对评审专家所发表的论文进行所属学科领域的分类,进而判断出评审专家的主要研究领域和投稿论文的学科领域。然后将投稿论文的学科领域与评审专家的研究领域自动匹配,建立自动推荐评审专家模型。论文的主要研究内容如下: ①在特征筛选中,引入最大频率的概念和特征项与类别的相关系数D ( m_(ik)),提出了改进的χ~2算法,实验结果表明,在特征项筛选中表现出了良好的筛选效果。 ②针对评审专家自动推荐模型选取的特征项为论文的关键词,在文本向量表示方法的基础上作了简化,提出了基于TF/IDF特征权重阈值的向量空间模型算法,并选用SVM分类方法对特征矩阵分类。实验结果表明,该算法可以有效的滤除不相关的噪声特征,产生更为准确的分类模型。 ③针对主动学习SVM分类算法在多类别的分类问题上存在分类器的速度随数目增加而变慢的问题,引入有向无环图SVM,改进了主动学习SVM分类算法,实验结果表明,改进后主动学习SVM分类算法可以增加交互的过程使训练得到的分类器具备自学习的能力,改进后主动学习SVM分类器在多类别的分类上能够精确分类并且提高分类速度。……   
[关键词]:文本自动分类;最大频率;向量空间模型;主动学习SVM
[文献类型]:硕士论文
[文献出处]:重庆大学2009年