手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

分布式环境下Skyline计算算法研究

朱琳

   一个多维数据库上的skyline,是此数据库上不被其它任何数据点支配的点所组成的集合。skyline计算以其在多目标决策、数据挖掘、数据库可视化等方面的广阔应用获得了越来越多研究者的关注。本文以普通分布式数据库和结构化对等网络为目标,对分布式环境下的skyline计算算法展开了深入的研究。 当前,分布式数据库上的skyline计算研究已经取得了初步进展,但已有的算法还远不能满足分布式环境下skyline计算的要求,因为它们至少受限于以下三种情况中的一种:(1)假设数据是被垂直划分的;(2)仅支持满足某种特殊网络要求的水平划分的数据库;(3)专为具有较低计算能力的轻量移动设备设计。因此,本文提出了一种全新的基于反馈的分布式skyline计算算法,它以一种崭新的反馈机制为核心,采多轮计算模式,支持任意水平划分的数据库上的skyline计算。算法中传递的反馈信息能大量剪除非skyline的本地数据点,避免无用信息在网络中的传输,因而很大程度减少了网络带宽的消耗量。算法能快速地响应用户,并按用户规定的顺序逐渐返回计算结果,具有很好的用户可适应性和渐进性。本文以在真实数据库和合成数据库上的大量实验衡量了算法的性能,证实了它是一个高效的分布式skyline计算算法。 在此基础上,本文还对对等网络(P2P)上的skyline计算进行了研究。对等网络是分布式信息共享与搜索的一种重要平台,Chord作为对等网络的代表性协议以其简单灵巧的设计和良好的性能备受关注。已有的对等网络上的skyline计算算法或是专为子空间的skyline计算而设计,或是针对某种特殊的对等网络协议,不能应用于其它协议上。本文提出了一种新的基于Chord的skyline计算算法,它将多维数据映射为一维标识符,在沿Chord环传递信息的过程中,剪除大量非skyline的本地数据点,渐进地处理数据并输出skyline。该算法减小了网络带宽的消耗量和需要访问的节点的个数,具有很好的渐进性和可扩展性。理论分析和实验结果均证明这是一种符合对等网络特点的准确高效的skyline计算算法。……   
[关键词]:分布式系统;对等网络;数据库;信息提取;Skyline
[文献类型]:硕士论文
[文献出处]:复旦大学2008年
App内打开