论文摘要
随着数据库技术的成熟,数据应用的普及,以及互联网的高速发展,人类积累的数据量正在以指数级速度迅速增长。传统的数据分析和查询方法己不能满足人们对隐藏在数据背后的知识的迫切需要,在这种社会需求的强劲推动下,知识发现和数据挖掘应运而生,而粗糙集理论作为一门新的数学工具,凭借它不需要附加任何外界信息或先验知识这一特点,突破了其它数据分析工具的局限,避免了人的主观因素对数据挖掘结果的影响,逐渐成为了研究知识发现的重要的数学工具之一。由于数据预处理是KDD处理步骤中非常重要的一环,其结果将直接影响到KDD的效率、准确度以及最终模式的有效性。而经典的粗糙集理论不能处理原始数据资料中的遗漏信息以及值域为实数的数据,需要经过数据预处理,包括数据补齐和离散化处理后才能进行知识获取,因此如何有效地进行数据预处理具有非常重要的现实意义。本文主要围绕基于粗糙集的数据预处理中数据补齐和连续属性离散化展开讨论。首先,综述了粗糙集理论的研究现状,分析和归纳了与数据不完备性相关的重要问题以及处理缺失值的各种方法;在此基础上,分析了当前主要的数据补齐算法的特点和不足,指出了数据补齐的原则和目标,并针对己有的基于粗糙集不完备信息系统补齐算法的缺陷,提出了基于量化相似关系模型,以使更多的缺损数据得到科学的填补,尽量避免因采用其它方法可能导致的决策规则矛盾的问题。然后,对目前流行的离散化算法进行了详细的分析和评价,指出了离散化的方向和目标,并提出了基于粗糙信息熵的离散化算法,以便在保证划分后决策表相容性的前提下,获得比较合理的划分点。最后,指出本文创新之处以及存在的问题和努力的方向。
论文目录
相关论文文献
- [1].计算机中数据预处理技术的研究与应用[J]. 电脑编程技巧与维护 2019(08)
- [2].基于云计算技术的电力大数据预处理属性简约方法[J]. 科技创新导报 2017(12)
- [3].中医临床数据预处理与中医临床信息规范化[J]. 中医药管理杂志 2018(17)
- [4].大数据预处理中属性约简的特性保持分析[J]. 计算机测量与控制 2015(12)
- [5].简析计算机数据预处理技术在劳动保障信息系统中的应用[J]. 信息与电脑(理论版) 2015(14)
- [6].生产测井数据预处理的数学原理及应用[J]. 石油仪器 2010(01)
- [7].浅谈数据预处理理论[J]. 中国证券期货 2010(09)
- [8].论数据挖掘中的数据预处理技术[J]. 煤炭技术 2013(05)
- [9].基于变分率时域技术的光通信数据预处理研究[J]. 激光杂志 2020(01)
- [10].三维空间中目标跟踪测量数据预处理仿真[J]. 计算机仿真 2018(05)
- [11].FY-3A紫外臭氧垂直探测仪数据预处理及验证[J]. 光学精密工程 2010(05)
- [12].挖掘数据中实时数据预处理技术的应用[J]. 微型电脑应用 2010(09)
- [13].基于云计算技术的电力大数据预处理属性约简方法[J]. 电子技术与软件工程 2017(02)
- [14].浅谈档案信息的数据预处理[J]. 兰台世界 2008(07)
- [15].线激光在机测量建模与数据预处理研究[J]. 组合机床与自动化加工技术 2018(03)
- [16].基于机器学习算法的建筑能耗监测数据预处理技术研究[J]. 建筑科学 2018(02)
- [17].一种飞行试验数据预处理软件设计方法[J]. 信息系统工程 2018(09)
- [18].移动通信数据挖掘的数据预处理研究[J]. 通讯世界 2016(09)
- [19].混凝沉淀过程机理分析与数据预处理研究[J]. 长春理工大学学报(自然科学版) 2010(01)
- [20].逆向工程中数据预处理技术[J]. 制造业自动化 2016(01)
- [21].网络社区用户兴趣挖掘的数据预处理研究[J]. 情报理论与实践 2010(09)
- [22].数据挖掘中数据预处理技术在教育研究中的应用[J]. 伊犁师范学院学报(自然科学版) 2008(03)
- [23].反恐情报分析中的数据预处理研究[J]. 情报科学 2017(11)
- [24].复杂设备维修保障数据预处理技术研究[J]. 计算机与数字工程 2016(04)
- [25].月球数据预处理工作流模型的构建及应用[J]. 吉林大学学报(工学版) 2015(06)
- [26].飞参过载数据预处理及其步骤优化[J]. 计算机工程 2011(11)
- [27].基于Spark的飞机试验数据预处理技术研究[J]. 计算机测量与控制 2018(12)
- [28].测井数据预处理与成图软件的设计[J]. 硅谷 2013(15)
- [29].数据预处理技术和机器学习方法在质子转移反应质谱中的应用[J]. 质谱学报 2018(05)
- [30].Leica TM50观测数据预处理程序设计与开发[J]. 人民长江 2016(S1)