手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

基于百科词典的知识获取系统的研究与实现

许勇

  从各种自然语言文本中获取知识是自然语言处理技术的重要应用,能有效地帮助人们搜索、获取知识,具有较大的应用前景。从文本中获取知识必须限制文本的范围。词典文本具有知识密集、较有规律性的特点,因此把机器获取知识的范围限制在词典文本是比较自然、有效的方式。国内外这方面的研究都有所开展,但整体上处于探索性阶段。本文描述了从百科辞典中获取知识的探索性的研究工作。本文首先介绍了与文本知识获取关系密切的、较活跃的文本信息提取技术的研究情况,以及它和文本知识提取的关系。本文从信息提取的角度出发研究知识获取任务,实现了基于《中国大百科全书》的、限定范围内的试验性百科词典知识获取系统。具体工作包括:利用分词工具进行了初步的词条分类;在词条分类的基础上,对处理范围内的词条文本进行观察,以人工方式获取其中目标知识的基于语义特征的模式规则;利用YACC具对模式规则进行语法分析,进而抽取目标知识。目前,知识获取的词条范围包括《中国地理》卷目中行政地名词条和《美术》卷目中西方美术家词条。文中给出了试验结果及分析。试验表明,在处理范围不大,目标知识项目不多且不太复杂的情况下这种方法能取得比较好的性能。但文本知识获取总的来说是一项比较困难的研究,本研究中实现的系统还有待进一步提高改善。……   
[关键词]:文本知识获取;自然语言处理;信息提取
[文献类型]:硕士论文
[文献出处]:北京工业大学2001年