手机知网 App
24小时专家级知识服务
打 开
计算机软件及计算机应用
基于平行语料库和网络的未登录词译文挖掘
分别通过搜索引擎和本地的双语语料库挖掘OOV译文。首先,提出一种利用词汇重叠特征、词对齐特征和位置特征建立最大熵分类器的方法,借以自动从网页信息中抽取和构建双语平行语料库。其次,提出一种结合互信息的频率变化方法生成多词单元,并采用频度-距离模型和音译模型进行正确译文的选择。对这两种挖掘方法的性能进行对比,实验表明基于网络的Top10的包含率达到94.6%,而基于平行语料库的Top10的包含率为37.5%。
2 170
手机阅读本文
下载APP 手机查看本文
江南大学学报(自然科学版)
2010年01期

搜 索