手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

《万历野获编》分词理论与实践

冯海瑛

  明代是汉语发展史中的一个重要时期,近代汉语发展到了这个阶段已进入成熟期,构成近代汉语的诸多要素已经稳定下来,这也意味着近代汉语向现代汉语的演变由此发端,因此这个时期的词汇呈现出承上启下的交汇特点。而对明代汉语语料进行分词及词频统计的研究,可以更全面地了解这个时期的词汇使用概貌。一方面可用作现代汉语中文信息处理研究的补充;另一方面也是为研究近代汉语分词标准及开发自动分词软件提供参考。 本文以明代笔记《万历野获编》中的词为考察对象。首先建立了一个约五十万字的封闭语料库,然后对语料进行分词和词频统计。所完成的研究工作包括:(1)制定分词规范;(2)进行分词实践和词语统计得出《万历野获编》的词频统计表;(3)对词频统计结果进行研究分析,从共时的角度对《万历野获编》的词语基本特征进行描写;(4)将《万历野获编》词频表与《朱子语类》、《现代汉语频率词典》中的常用词频率表作历时比较,以寻找汉语词汇从宋代、明代到现代的基本发展变化及规律。 本文共分为六章,其中“分词标准”、“分词实践”、“词频分析”、“构词特点”、“词频表对比”等问题为各章研究的重点。我们的研究以描写语言学、历史语言学、比较语言学和语法理论为指导,力求在前人研究成果的基础上能有一些突破,为近代汉语断代词汇研究以及近代汉语信息处理研究提供更丰富的资料。……   
[关键词]:《万历野获编》;分词;词频统计;词表;共时;历时
[文献类型]:硕士论文
[文献出处]:广西师范学院2010年
App内打开