手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

基于DMX语言的数据挖掘算法包原型系统的设计与实现

李由

  随着近年来计算机信息技术的飞速发展,数据挖掘技术在企业管理决策等活动中扮演着越来越重要的作用。相当多的大型企业其内部或者与其他商业伙伴间海量的数据需要在数据挖掘技术与平台下成为有意义有价值的知识信息。20世纪80年代数据挖掘技术开始萌芽,经过了90年代的高速发展,现在各种数据挖掘平台技术、商用软件以及数据挖掘算法已经层出不穷,特别是数据挖掘商用软件的出现和不断完善,使得大型企业在企业管理和决策活动中有着更为有利的依据。在对海量的业务数据进行不断的挖掘并发现内在的模式、规律和趋势后,企业在市场上的决策也有了更加明确的方向,也极大的降低了不必要的战略风险。 但是,目前存在着大型企业能够享用计算机信息技术和数据挖掘技术飞速发展的最新研究和应用成果,而中小企业普遍不能够获得满足其自身业务需求的相关系统与软件技术,如Warehouse Mine、Enterpris Miner这种业界领先的集成度相当高的数据挖掘软件的价格和适用程度对它们而言都不合适,同时中小企业随着其企业战略的发展与变化,对自身适用的这类软件的结构灵活性、功能开放性和操作独立性的需求也十分迫切。因此,如何在开源平台下设计并实现一种具有功能开放性、操作独立性和结构灵活性等特点的数据挖掘软件来满足中小企业对其内部大量业务数据进行数据挖掘以期发现有用的知识的需求,正是文中所研究的课题的目标和意义所在。 诚然,近年来Teradata、SAS、IBM和Oracle等公司都推出并不断完善了自己的商用数据挖掘软件,这些软件在功能和性能上已经接近完美,从数据仓库的构建到前端数据挖掘工具的应用,已经能够很好地满足用户的实际需求。但是如何能统一并规范一种数据挖掘语言仍然是目前业界普遍关注的难点/热点课题。其中,微软公司所提出的OLE DB for Data Mining规范和DMX数据挖掘语言已成为该课题的具有代表性的解决方案之一,它代表着数据挖掘技术沿着标准化的进程正日趋成熟。 文中从相关理论基础着手,从基于数据仓库的数据挖掘理论、方法与技术引出OLE DB for Data Mining规范和DMX语言的发展历程,阐述了当下热门的数据挖掘技术研究课题。然后从中小企业对数据挖掘软件的实际需求出发,叙述了文中对设计与实现基于DMX语言的数据挖掘算法包原型系统所采用的技术手段和框架的特点与优势。接着文中从软件设计方法的角度详细叙述了基于DMX语言的数据挖掘算法包原型系统的设计与实现过程。最后,文中把该原型系统与当下主流的微软SSAS中的数据挖掘工具平台的结构特性上作了优劣分析并比较,并对进一步的工作目标和深入研究的内容进行了展望,以期对数据挖掘平台与技术的各方面的工作做一个抛砖引玉的作用。……   
[关键词]:数据挖掘;OLEDB for Data Mining规范;DMX语言
[文献类型]:硕士论文
[文献出处]:华东师范大学2011年