手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

基于双语平行语料的中文缩略语提取方法

刘友强;李斌;奚宁;陈家骏

  汉语缩略语在现代汉语中被广泛使用,其相关研究对于中文信息处理有着重要的意义。本文提出了一种从英汉平行语料库中自动提取汉语缩略语的方法。我们首先对双语语料进行词对齐训练,利用训练得到的词对齐信息抽取出候选中英文短语对。然后用SVM分类器提取出质量高的短语对。最后再从质量高的短语对集合中利用英文翻译及一些汉语缩略-全称对应规则提取出汉语缩略语及全称语对。实验结果表明,该方法提取出的缩略语具有较高的准确率,可以作为一种自动提取缩略语词典的有效方法。……   
[关键词]:缩略语;平行语料库;短语抽取;分类
[文献类型]:会议论文
[文献出处]: 《中国计算语言学研究前沿进展(2009-2011)2011年