手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

粗糙集数据分析方法研究

庞天杰

  知识发现是一种从数据中挖掘知识的工具,它是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可以理解的模式的非平凡过程。1982年,波兰科学家Z. Pawlak提出了粗糙集理论,在这个理论下,无法确认的个体归属与边界区域,而这个边界区域被定义为上、下近似集的差集,并基于此提出了信息表和决策表的约简算法。但是,传统的粗糙集理论仍有几个问题需要解决。例如,要找出所有的约简仍是一个NP-hand问题。粗糙集理论作为一种不确定性数据处理方法,已在人工智能和认知领域得到了成功应用。本文介绍了知识发现的意义和基本过程,同时介绍了粗糙集的基本理论和基本方法,然后作了两方面的探讨:首先在粗糙集具体计算方法方面作了探讨。J. W. Guan, D. A. Bell和Z. Guan提出了信息系统下的矩阵算法,它将信息系统下的等价关系用矩阵的形式进行了重新描述,并基于此提出了新的约简算法。本文在此基础上,提出了正域向量集的概念,并利用在相对约简过程中正域向量集的变化来衡量属性集中每个属性的重要性,进而在决策系统中对属性集进行约简,并提出了约简算法。另外,用矩阵描述了相容关系,并将完备信息表的矩阵约简算法推广到了不完备的信息表中,使得矩阵约简算法有了更广泛的应用。另一方面,在粗糙集的应用中发现,在某些情况下,决策系统的论域中某些对象属性无法得到确定的值,但可用一个区间或几个可能的值来描述其大概范围,传统的粗糙集理论无法解决这类问题,因此,粗糙集的应用受到了限制。本文提出了一种基于论域中对象之间贴近度的模型,在这个模型下,论域中的对象构成了相容关系,在这个意义下提出了上下近似的表示,并提出了新的规则提取算法,最后,针对如何运用已提取出的规则对待识别对象进行决策的问题,提出了一种置信度的度量方法,通过待识别对象与每一条规则计算置信度并比较其大小,来决定做出何种决策。贴近度算法的提出,较好的解决属性值不确定的问题,扩大了粗糙集的应用范围。……   
[关键词]:知识发现;粗糙集;约简算法;矩阵;贴近度
[文献类型]:硕士论文
[文献出处]:山西大学2005年