数据挖掘中规则提取相关问题研究

数据挖掘中规则提取相关问题研究

论文摘要

信息时代的来临,带来大量的数据。这些数据中隐藏着许多重要的信息和知识。如何从表面数据中提取到深层次的、表现了事物内在规律的规则来进行预测或指导决策,是迫切需要解决的问题。数据挖掘正是在这样的背景下产生的新的研究领域,是统计学、计算机科学、模式识别、人工智能、机器学习、数据库等多领域的交叉学科。规则提取是数据挖掘领域的一个重要课题。本文就数据挖掘中的规则提取问题进行了相关的研究。首先,讨论了连续属性离散化问题。连续属性离散化是否合理决定着表达和提取相关信息的准确性。CHI2系列算法关联着统计学理论方法,有着重要的研究价值。在对CHI2系列算法中统计量x 2应用意义讨论的基础上,提出了一种新的Intelgal-CHI2算法,能够更合理更准确的对连续属性进行离散化。其次,研究以免疫算法为工具对信息系统进行规则提取。在免疫算法中结合了小生境技术的共享机制,利用了共享机制中对资源的共享和竞争原理,体现了规则之间竞争与互补的关系。针对普通可信度度量方法的不足,提出了柔性可信度的概念和度量方法,能够获得更好的规则。最后,本文研究了从神经网络中进行规则提取的问题。神经网络是一种非常好的数据挖掘工具,具有良好的非线性处理能力。但神经网络学习到的信息是蕴涵在大量的连接权中,很难被理解。本文提出了一种基于神经网络的、对信息系统进行规则提取的新方法。该方法是多项式级的,并且可以处理离散型变量。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 数据挖掘的研究现状
  • 1.3 论文组织结构
  • 第二章 数据挖掘中规则提取问题相关技术与理论
  • 2.1 数据挖掘
  • 2.1.1 数据挖掘的定义
  • 2.1.2 数据挖掘的功能
  • 2.1.3 数据挖掘常用方法
  • 2.2 数据挖掘中的规则提取问题
  • 2.2.1 连续属性离散化
  • 2.2.2 基于免疫算法的规则提取
  • 2.2.3 基于神经网络的规则提取
  • 第三章 连续属性离散化 CH12 方法研究
  • 3.1 引言
  • 3.2 数理统计基本理论和离散化过程中的基本概念
  • 3.2.1 数理统计基本理论
  • 3.2.2 离散化过程中的基本概念
  • 3.3 连续属性离散化的CH12 系列算法
  • 3.4 Integral-CH12 算法
  • 3.5 实验与讨论
  • 3.6 小结
  • 第四章 基于小生境免疫算法的柔性可信度规则提取方法研究..
  • 4.1 引言
  • 4.2 基本理论
  • 4.2.1 免疫算法
  • 4.2.2 小生境理论
  • 4.3 规则的表示方法和重要性的度量
  • 4.3.1 规则的表示方法
  • 4.3.2 规则的重要性度量
  • 4.4 小生境共享机制的实现方法
  • 4.5 基于免疫算法的规则提取
  • 4.6 实验与结论
  • 4.7 小结
  • 第五章 基于 BP 神经网络的规则提取方法研究
  • 5.1 引言
  • 5.2 BP 神经网络的基本理论
  • 5.2.1 神经元
  • 5.2.2 神经网络
  • 5.2.3 误差反传(BP)算法
  • 5.3 神经网络中规则提取相关研究进展
  • 5.4 基于BP 神经网络的规则提取
  • 5.4.1 规则表示方法
  • 5.4.2 相邻两层间的规则提取
  • 5.4.3 规则空间启发式的搜索
  • 5.4.4 具体算法步骤
  • 5.5 算例与实验
  • 5.5.1 算例
  • 5.5.2 实验结果
  • 5.6 小结
  • 第六章 结论与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间撰写和发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    数据挖掘中规则提取相关问题研究
    下载Doc文档

    猜你喜欢