论文摘要
流数据查询是流数据处理中一个非常重要的研究领域,由于流数据到来的快速性和大量性等特点,必须及时地对流数据进行处理,流数据的输入速率突然剧增会使查询系统发生过载,将严重影响查询系统的响应速度和查询质量,查询系统有效的过载控制已成为一个研究的热点;同时查询处理产生的结果数据流往往有很重要的参考价值,这样就产生了流数据查询中对已产生的结果流再利用的问题。如何充分利用已得到查询结果流也成为当前研究的一个重要课题。目前查询系统的过载控制仍未达到理想效果,对查询结果流的利用也很少。因此本文构建了基于反馈机制的流数据查询模型,并对该模型中的过载控制、查询处理和反馈生成等问题进行了深入的研究,主要工作和创新成果体现在以下几个方面。首先,构造了基于反馈机制的流数据查询模型,通过对连续查询的结果流进行反馈树分类从而发现输出结果流的主要特征,并以此来对输入数据流进行评估,指导流数据处理系统中过载控制的丢弃元组操作,最大可能的提高输出结果的准确度,在查询时以反馈参数为指导还可以加快查询速度。其次,在对Aurora系统过载卸载的分析基础上,提出了改进的完备负载卸载路径映射的重构方法和自适应的负载卸载路径映射的重构方法,从理论上的有效性进行了分析,并对其算法进行了设计。再次,设计了基于时间粒度的多层次滑动窗口的划分和动态维护方案和部分算法,使的流数据查询可以在多个不同的层次进行,能进一步提高查询的准确度。最后,采用了反馈树的方法生成反馈度参数,并对带有反馈度参数的反馈树的生长和剪枝算法进行了设计。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景1.2 研究内容1.3 本文组织结构第二章 流数据查询的相关理论与技术2.1 数据流2.2 滑动窗口技术2.3 AURORA系统2.3.1 Aurora系统概述2.3.2 Aurora系统的负载卸载2.4 决策树分类算法2.5 过载卸载技术概念第三章 基于反馈机制的流数据查询模型的构建3.1 基于反馈机制的数据流查询模型3.2 过载控制3.2.1 循环缓存数据流3.2.2 过载卸载3.3 基于时间粒度分层滑动窗口的查询处理概述3.4 基于反馈树的反馈生成概述3.5 小结第四章 过载控制4.1 过载卸载的基本模型结构4.2 负载降载路径映射4.2.1 LSRM的构造4.2.2 LSRM的使用4.3 改进的负载卸载4.3.1 完备的LSRM的构建的负载卸载4.3.2 自适应SLRM构建的负载卸载4.4 结论与分析第五章 基于时间粒度多层次滑动窗口的查询处理5.1 滑动窗口管理5.1.1 多层次滑动窗口的概念5.1.2 多层次滑动窗口的动态维护5.1.3 窗口维护的算法设计5.2 查询处理5.2.1 连续查询使用的基本数据结构5.2.2 查询处理机制5.2.3 连续查询的执行5.3 结论与分析第六章 反馈机制中的反馈树6.1 反馈树的概念6.2 反馈树的生长6.2.1 反馈树生长机制6.2.2 反馈树生长算法GTree的设计6.3 反馈树的剪枝6.3.1 反馈树剪枝机制6.3.2 反馈树剪枝算法PTree的详细设计6.4 结论与分析第七章 结束语7.1 总结7.2 进一步的工作参考文献在研期间科研情况致谢
相关论文文献
标签:流数据论文; 负载卸载论文; 时间粒度论文; 反馈树论文;