连续属性离散化相关研究及应用

连续属性离散化相关研究及应用

论文摘要

信息时代的来临,带来大量的数据。这些数据中隐藏着许多重要的信息和知识。如何从表面数据中提取到深层次的、表现了事物内在规律的规则来进行预测或指导决策,是迫切需要解决的问题。数据挖掘正是在这样的背景下产生的新的研究领域,是统计学、计算机科学、模式识别、人工智能、机器学习、数据库等多领域的交叉学科。连续属性离散化在机器学习和数据挖掘领域中有着重要的作用。本文就数据挖掘中的连续属性离散化问题进行了相关的研究。首先,讨论了连续属性离散化问题。连续属性离散化是否合理决定着表达和提取相关信息的准确性。CHI2系列算法关联着统计学理论方法,有着重要的研究价值。利用Bayseian模型允许一定程度错误分类存在的性质,对Chi2算法进行了改进。提出的Bayseian-Chi2算法不仅更适合不协调和不完全的数据,还使得区间的合并更加合理。其次,依据属性重要性程度对属性离散化的顺序进行了合理的调整,又提出一种新的基于属性重要性的连续属性离散化方法——属性重要度-Chi2算法,能够更准确的对连续属性进行离散化。最后,本文从应用的角度,将研究的成果应用在基于数据挖掘中的决策树技术得到的个人住房贷款信用风险评估模型之中,具有较高的准确率,能够满足实际应用的需要。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 数据挖掘的研究现状
  • 1.3 论文组织结构
  • 第二章 数据挖掘技术概述
  • 2.1 数据挖掘的产生及其意义
  • 2.2 数据挖掘的定义及其基本功能
  • 2.3 数据挖掘的典型过程
  • 第三章 连续属性离散化的Bayesian-Chi2 方法研究
  • 3.1 引言
  • 3.2 数理统计基本理论和离散化过程中的基本概念
  • 3.2.1 数理统计基本理论
  • 3.2.2 离散化过程中的基本概念
  • 3.3 连续属性离散化的CH12 系列算法
  • 3.4 Bayesian 粗糙集模型及Bayesian-Chi2 算法
  • 3.5 实验与讨论
  • 第四章 连续属性离散化的属性重要性方法研究
  • 4.1 引言
  • 4.2 Chi2 系列算法基本概念
  • 4.3 粗糙集
  • 4.4 属性重要性-Chi2 算法
  • 4.5 训练集决策类比例抽取方法
  • 4.6 实验与结果
  • 第五章 个人住房贷款信用风险评估模型
  • 5.1 模型建立意义
  • 5.2 数据采集
  • 5.2.1 数据采集方法
  • 5.2.2 数据采集结果
  • 5.2.3 数据的预处理
  • 5.3 个人住房贷款信用风险评估模型的建立
  • 5.3.1 决策属性信息增益率的计算
  • 5.3.2 依据C4.5 算法构造决策树
  • 5.3.3 基于决策树构建风险评估模型
  • 第六章 结论与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间撰写和发表的学术论文
  • 相关论文文献

    • [1].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [2].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [3].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [4].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [5].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [6].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [7].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [8].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [9].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [10].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [11].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [12].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [13].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [14].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [15].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [16].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [17].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [18].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [19].浅析数据挖掘[J]. 内江科技 2020(06)
    • [20].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [21].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [22].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [23].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [24].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [25].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [26].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [27].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [28].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [29].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)
    • [30].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(10)

    标签:;  ;  ;  ;  ;  ;  

    连续属性离散化相关研究及应用
    下载Doc文档

    猜你喜欢