基于粗糙集理论的数据挖掘技术及其在私家车潜在消费群体研究中的应用

基于粗糙集理论的数据挖掘技术及其在私家车潜在消费群体研究中的应用

论文摘要

随着数据库技术的逐渐成熟,数据库应用的迅速普及,以及互联网的飞速发展,人类所积累的数据量正以指数级的速度增长。基于数据库的知识发现是最近几年发展起来的一门新兴技术,它处理数据库中大量的数据,挖掘出更深层次的知识、更具决策力的信息。数据挖掘是从大量的、不完全的、有噪声的、随机的、模糊的数据中,提取出隐含在其中的、人们事先不知道的、有价值的知识。其中数据预处理是整个数据挖掘的关键步骤,是数据挖掘工作进行之前的必备工作,在这个阶段之后再进行属性的约简和数据的规范化处理。粗糙集理论是上世纪八十年代初由波兰数学家Pawlak首先提出的,它是一种处理模糊和不确定性知识的数学工具。其中属性约简是粗糙集理论的核心内容,属性约简是保持分类能力不变的前提下,删除冗余的属性。传统的属性约简算法是基于主存的算法。基于关系数据库操作的属性约简算法利用关系数据库本身的操作算子和SQL操作,能够比传统算法更加高效地进行数据挖掘。在关系数据库中如何进行属性约简,以获得最高效的数据挖掘,是本文研究的重点。本文根据一种基于粗糙集理论的数据挖掘方法,以市场调查数据为研究对象,通过适当的约简算法,得出简化的决策集,分析私家车潜在消费者群体特征。提出了一种启发式的约简算法,在属性约简之前,首先定义了一种条件属性分类能力强度,根据各属性分类能力强度对决策表进行排序,然后采用逐行扫描的方法逐条判断属性是否为不必要属性,解决了属性约简可能出现多个约简结果需要靠人为选取满意结果的问题。本人根据论文设计过程的需要,利用Delphi进行程序设计加上利用SQL Sever2000存储数据,最终完成了属性约简、值约简模块的编程实现,这样更直观的展示了实践的过程及研究的结果。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 数据挖掘概述
  • 1.2 粗糙集数据分析概述
  • 第二章 粗糙集的基本理论
  • 2.1 知识的形式化定义
  • 2.2 等价关系
  • 2.3 知识的粒度
  • 2.4 粗糙集合
  • 2.5 约简与核值属性
  • 2.6 相对约简与相对核
  • 2.7 知识表达系统
  • 第三章 数据预处理
  • 3.1 数据预处理的意义
  • 3.2 离散化
  • 3.3 连续属性离散化的方法
  • 第四章 约简及相关算法
  • 4.1 基于数据分析的属性约简算法
  • 4.1.1 基本定义
  • 4.1.2 算法描述
  • 4.2 基于逻辑判断的属性值约减方法
  • 4.2.1 决策逻辑语言
  • 4.2.2 一种属性值约简算法
  • 4.2.3 算例
  • 第五章 粗糙集数据挖掘应用案例及编程实现
  • 5.1 案例背景
  • 5.2 编程工具选择
  • 5.2.1 操作系统Windows XP的特点
  • 5.2.2 程序设计工具Delphi7的特点
  • 5.2.3 数据库SQL Sever 2000的特点
  • 5.3 数据表格建立及存储
  • 5.3.1 属性约简需要的数据
  • 5.3.2 值约简需要的数据
  • 5.4 属性约简模块
  • 5.4.1 属性排序
  • 5.4.2 属性约简算法概述
  • 5.4.3 属性约简程序流程图
  • 5.4.4 属性约简模块界面简介
  • 5.4.5 属性约简关键代码说明
  • 5.4.6 属性约简结果
  • 5.5 值约简模块
  • 5.5.1 值约简算法概述
  • 5.5.2 值约简模块程序流程图
  • 5.5.3 值约简模块界面简介
  • 5.5.4 值约简模块关键代码
  • 5.5.5 值约简结果
  • 5.5.6 约简结果分析
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 附录A(攻读硕士学位期间发表的论文)
  • 相关论文文献

    • [1].三支决策-基于粗糙集与粒计算研究视角[J]. 智能系统学报 2019(06)
    • [2].多粒度粗糙集近似集的增量方法[J]. 山东大学学报(理学版) 2020(01)
    • [3].《粗糙集理论及其应用》研究生课程教学改革与实践[J]. 闽南师范大学学报(自然科学版) 2020(01)
    • [4].基于粗糙集理论的水利工程现代化管理评价[J]. 黑龙江水利科技 2020(01)
    • [5].基于代数角度的变精度多粒度粗糙集的约简[J]. 咸阳师范学院学报 2020(02)
    • [6].局部广义多粒度粗糙集[J]. 计算机工程与科学 2020(08)
    • [7].可变多粒度粗糙集粒度约简研究[J]. 哈尔滨师范大学自然科学学报 2019(01)
    • [8].基于覆盖粗糙集的超图连通性[J]. 数码设计 2016(02)
    • [9].关系粗糙集的邻域拟阵结构研究[J]. 数码设计 2016(02)
    • [10].基于粒度矩阵的程度多粒度粗糙集粒度约简[J]. 系统工程与电子技术 2016(12)
    • [11].基于最小/最大描述的多粒度覆盖粗糙直觉模糊集模型[J]. 计算机科学 2017(01)
    • [12].优势关系下多粒度粗糙集排序方法及其应用[J]. 计算机工程与应用 2017(01)
    • [13].优势关系多粒度粗糙集中近似集动态更新方法[J]. 中国科学技术大学学报 2017(01)
    • [14].基于加权粒度和优势关系的程度多粒度粗糙集[J]. 山东大学学报(理学版) 2017(03)
    • [15].组合多粒度粗糙集及其在教学评价中的应用[J]. 数码设计 2017(01)
    • [16].基于粗糙集的大学生学习与就业关系分析[J]. 计算机技术与发展 2017(05)
    • [17].粗糙集理论及其应用综述[J]. 物联网技术 2017(06)
    • [18].不完备信息系统中的广义多粒度双相对定量决策粗糙集[J]. 南京大学学报(自然科学) 2017(04)
    • [19].基于可变多粒度概率粗糙集的分类模型[J]. 模式识别与人工智能 2017(08)
    • [20].基于下近似分布粒度熵的变精度悲观多粒度粗糙集粒度约简[J]. 计算机科学 2016(02)
    • [21].可变程度多粒度粗糙集[J]. 小型微型计算机系统 2016(05)
    • [22].粗糙集理论在国内旅游研究中的应用[J]. 旅游纵览(下半月) 2014(07)
    • [23].基于信息量的悲观多粒度粗糙集粒度约简[J]. 南京大学学报(自然科学) 2015(02)
    • [24].粗糙集理论在故障诊断中的应用研究[J]. 科技视界 2015(16)
    • [25].粗糙集理论在输变电工程造价风险评价指标体系优化中的应用[J]. 土木工程与管理学报 2015(04)
    • [26].基于粗糙集理论的多标度层次分析教师教学评价模型[J]. 数学学习与研究 2017(11)
    • [27].基于粗糙集理论和因果图的故障诊断[J]. 重庆师范大学学报(自然科学版) 2020(02)
    • [28].基于粗糙集的高校学生实践能力因素研究[J]. 计算机技术与发展 2020(04)
    • [29].邻域粗糙集属性约简在民族团结进步创建评价中的应用[J]. 信息与电脑(理论版) 2020(12)
    • [30].新型灰狼算法的粗糙集属性约简及应用[J]. 计算机工程与应用 2017(24)

    标签:;  ;  ;  ;  ;  

    基于粗糙集理论的数据挖掘技术及其在私家车潜在消费群体研究中的应用
    下载Doc文档

    猜你喜欢