手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

一种利用注疏的《左传》分词新方法

徐润华;陈小荷

  先秦文献的注疏文献中包含有大量词汇语义知识,是先秦文献自动分词的重要依据。本文以篇幅最大的先秦文献《左传》为研究对象,在对《左传》及其注疏文献进行自动对齐的基础上,提出了一种利用注疏的《左传》分词新方法。分词实验的F值达到89.0%,较之baseline有明显提升。该方法无需训练语料,利用注疏文献辅助分词的思想也适合推广到其他先秦文献的自动分词任务中去。……   
[关键词]:先秦文献;注疏文献;自动对齐;自动分词
[文献类型]:会议论文
[文献出处]: 《中国计算语言学研究前沿进展(2009-2011)2011年