论文摘要
RFID数据具有流式、海量、时态、语义丰富、不可靠的特点,随着RFID技术的广泛应用,如何实时高效地清洗RFID系统产生的不可靠海量数据是一个亟需解决的问题。传统的数据清洗技术无法完全胜任RFID数据流的清洗要求。现今标准的RFID数据清洗系统大都提供各种平滑过滤器,通过滑动窗口为漏读数据插值,过滤集成数据。在各种场景下它们表现良好,但是其主要关注于单个读写器,而忽略了有成千上万的读写器及标签的实际应用会带来很高的清洗成本。鉴于标签信息量庞大,误差来源多样化,窗口需具备快速反应的能力,设置滑动窗口大小成为具有挑战性的任务。本文在分析现有技术的基础上,讨论最小成本的自适应数据清洗问题,提出近邻组的概念,使用读写器近邻组扩展SMURF多标签数据清洗算法。之后我们设计并实现了一个基于规则的数据清洗系统,该系统由读写器硬件配置、数据缓冲区管理、规则系统管理、数据清洗等功能模块组成。为支持RFID数据清洗,该系统综合了说明性的清洗操作,如平滑处理、仲裁处理、校正处理和合并处理等。最后为验证清洗方法的有效性,本文在模拟数据和真实RFID数据的基础上完成了各种实验,实验结果表明提出的自适应的成组清洗在漏读和多读等方面都是有效的。
论文目录
摘要ABSTRACT第1章 绪论1.1 研究背景1.1.1 RFID系统1.1.2 RFID数据特性1.2 研究内容1.3 论文结构第2章 RFID数据清洗技术2.1 传统数据清洗技术2.2 RFID数据清洗技术概述2.3 基于固定时间窗口的数据清洗方法2.4 在线可扩展的数据流清洗框架ESP2.5 基于动态Bayesian网络的RFID数据清洗2.6 本章小结第3章 基于读写器近邻组的RFID数据清洗3.1 引言3.2 RFID数据模型3.3 RFID数据二项式抽样模型3.4 基于近邻组的多标签随机抽样模型3.5 基于读写器近邻组的多标签清洗算法3.6 本章小结第4章 RFID数据清洗规则系统4.1 规则系统4.2 规则解析工具4.3 平滑处理4.4 仲裁处理4.5 校正处理4.6 合并处理4.7 本章小结第5章 RFID数据清洗系统实现5.1 系统实现5.2 模块实现5.2.1 读写器硬件控制组件Control Component(CC)5.2.2 数据缓冲区组件Data Buffer Component(BC)5.2.3 规则系统组件Rule Component(RC)5.2.4 数据清洗核心组件Data Cleaning Component(DCC)5.2.5 外部接口组件Interface Component(IC)5.2.6 用户管理组件User Management Component(UMC)5.3 系统运行效果5.4 本章小结第6章 实验对比分析6.1 实验环境6.2 实验方案以及结果分析6.2.1 真实标签数据6.2.2 数据产生器模型6.2.3 实验一:标签移动速度对算法的影响6.2.4 实验二:标签数量对算法的性能影响6.2.5 实验三:对比基于近邻组的多标签清洗与SMRUF算法6.2.6 实验四:基于近邻组的多标签清洗算法适用性6.3 本章小结第7章 总结与展望7.1 总结7.2 展望参考文献攻读学位期间研究成果其它成果致谢
相关论文文献
标签:数据清洗论文; 滑动窗口论文; 规则系统论文; 概率模型论文; 近邻组论文;