手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

多数据流处理的关键技术研究

陈安龙

   随着信息技术的迅速发展,滋生了大量的数据流,数据流处理技术的研究成为了数据挖掘领域的热点问题。数据流具有动态易变性、数据的无限性和连续出现等特征。在多数据流的应用环境中,各数据流之间存在某种程度的偶合关系,发现数据流之间的偶合关系具有重要意义。本文围绕多数据流的偶合特征、压缩存储以及预测等关键技术,进行了深入研究。主要成果包括: (1)引入了全序概念对数据流进行形式化描述,证明了数据流在时间语义约束下服从全序关系。 (2)提出了挖掘数据流之间的同步偶合模式和异步偶合模式的抗噪声算法,主要要点是:合理地度量了数据流间的局域偶合度,给出流数据间的同步局域偶合度和异步局域偶合度的数学定义;探索了Haar小波技术消除数据流中噪声的方法;证明了流序列的局域中心距定理、偶合等价定理、距离等价定理、偶合度距离化定理和强偶合判定定理,并导出了相关推论,为直接从经Haar小波压缩的流信息中发现偶合规律提供了理论依据,保证了用小波系数度量数据流偶合度的合理性,避免了重构数据流原始信息的时间开销。在嵌套环形滑动窗口的数据结构上,设计了挖掘数据流偶合规则的增量式的抗噪声算法。在真实数据集上对算法进行模拟实验,表明抗噪声增量式算法的正确性和有效性,提高了效率200~300%。相关成果发表在LNCS3818和软件学报,被SCI引用。 (3)提出了使用极大团的方法挖掘数据流序列的近似频繁偶合集的算法。主要研究成果包括:定义了数据流的二元偶合关系、k元偶合关系、数据流的偶合频度以及极大频繁偶合集等一系列相关概念,证明了k元偶合成立的必要……   
[关键词]:数据流;同步偶合;异步偶合;Haar;小波;多数据流压缩;多数据流预测
[文献类型]:博士论文
[文献出处]:四川大学2006年
App内打开