手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

基于关联度的汉藏多词单元等价对抽取方法

诺明花;刘汇丹;吴健;丁治明

  针对为汉藏辅助翻译系统建立汉藏多词单元翻译词典这一任务,本文提出了CMWEPM模型。该模型首先依据关联度和结合度来确定汉语语料中多词单元的边界,然后根据词对齐信息分别抽取严格和约束汉藏多词单元等价对。CMWEPM模型根据不同长度和频次对多词单元进行分类,并为不同类型设定不同阈值,最终提高了汉藏多词单元等价对的召回率,从而能够间接地提高汉藏辅助翻译系统的翻译质量。……   
[关键词]:藏文信息处理;多词单元;关联度
[文献类型]:会议论文
[文献出处]: 《中国计算语言学研究前沿进展(2009-2011)2011年