手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

词频统计的新概念和新方法

尹斌庸;方世增

  一词频统计工程中的难题抽样一定数量的语料,计算其中各个不同词语的出现次数,这就是词频统计工程最主要的方法,或称频度(或频率)的方法。每个词语的出现次数,叫做这个词语的频度。每个词语的频度与总频度和之比,叫做频率。例如:在1300000词次的语料中,“社会”这个词出现1840次,则“社会”这个词的频度是1840,而频率则为1840/13000000=0.001415。因为频度和频率成正比,所以在同一语料中,采用频度或频率去进行比较,结果都一样。……   
[关键词]:分布率;四个时期;取舍标准;公式计算
[文献类型]:会议论文
[文献出处]: 《语言文字应用研究论文集(Ⅱ)2004年
App内打开