手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

邮件语料库的语料添加算法研究与实现

李军辉;朱巧明;钱培德

  本文介绍了在构建动态邮件语料库时所必须解决的问题-邮件语料的添加。由于待添加的邮件预先都已标好类别,根据其类别是否属于原有的类别体系,分两种情况进行处理:1)属于原有类别的新邮件, 将这类邮件细分为Ⅰ、Ⅱ和Ⅲ类,最后只将属于Ⅲ类的新邮件添加到原语料库中;2)不属于原有类别的新邮件,将此类邮件进行去重后全部添加到语料库中。模拟的邮件语料添加实验表明了待添加语料裁剪的必要性及添加算法的有效性。……   
App内打开