基于粗糙集与神经网络的数据分类研究及应用

基于粗糙集与神经网络的数据分类研究及应用

论文摘要

在信息技术和数据库技术高速发展的今天,数据成了人们工作和生活中必不可少的一部分,然而要从海量数据中提取出有用信息却很困难。数据分类作为一种重要的数据分析技术,可以用于提取描述重要数据类的模型和预测未来的数据趋势,帮助人们总结出数据中隐含的规律,为业务决策和战略发展服务。论文首先介绍了粗糙集理论,并引入了一种基于属性重要度的粗糙集属性约简算法,它能有效地消除冗余信息,达到为输入变量降维的目的。其次,针对多分类问题设计了一个基于动态阈值的神经网络分类器,此分类模型采用了与传统模型不同的动态阈值函数,可以有效提高分类器的泛化能力。另外,还结合理论指导和实际的试验仿真对神经网络的隐层数及其节点数进行了优化设计,采用具有双隐层的BP神经网络作为分类器模型的核心。最后,通过分析粗糙集和神经网络的特点,取长补短,把二者有机地结合在了一起,使用粗糙集作为分类器模型的前端处理器,约简输入变量,达到了科学选择变量的目的,提高了模型的分类性能。电影票房预测是一个典型的非线性问题,通过将其转化成一个分类问题,可以使问题简化,即把影片根据其票房收入的高低划分成了6个档次,预测的目的就是把影片分到相应的类别里面。在成功建模的基础上,确定了影响影片票房高低的因素作为输入变量,然后通过统计的方法确定了其初始值。最后运用所设计的分类器模型解决了该票房预测问题。通过与决策树、支持向量机、RBF网络等方法的比较结果表明,基于动态阈值的神经网络分类器具有更好的预测精度、稳定性以及泛化能力。基于粗糙集的属性约简对分类器的输入变量进行了科学合理的降维,其与神经网络分类器的有机结合取得了良好的效果,预测性能明显优于其它分类模型。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题的研究背景
  • 1.2 数据分类技术研究现状
  • 1.2.1 常见的数据分类技术
  • 1.2.2 数据分类技术存在的问题及未来的发展方向
  • 1.3 课题的主要研究内容
  • 1.3.1 研究的目的及意义
  • 1.3.2 作者的主要工作
  • 2 基于属性重要度的粗糙集属性约简方法
  • 2.1 常见的属性约简算法
  • 2.2 粗糙集理论概述
  • 2.2.1 粗糙集的基本概念
  • 2.2.2 基于粗糙集的知识表达系统
  • 2.3 基于属性重要度的粗糙集属性约简算法
  • 2.3.1 属性重要度的计算
  • 2.3.2 连续属性值的离散化
  • 2.3.3 改进的广义特征表求核算法
  • 2.3.4 基于属性重要度的改进启发式约简算法
  • 2.4 小结
  • 3 基于粗糙集与神经网络的分类器设计
  • 3.1 BP神经网络
  • 3.1.1 BP神经网络模型
  • 3.1.2 误差反向传播学习算法
  • 3.2 神经网络分类器原理
  • 3.2.1 神经网络分类器概述
  • 3.2.2 BP神经网络的分类能力
  • 3.3 基于动态阈值的神经网络分类器设计
  • 3.3.1 神经网络输入输出参数的确定
  • 3.3.2 神经网络结构参数的确定
  • 3.3.3 分类器的训练及校验方法
  • 3.3.4 基于动态阈值函数的输出规范化
  • 3.3.5 基于动态阈值的神经网络分类器模型
  • 3.4 粗糙集与神经网络分类器的结合
  • 3.4.1 粗糙集与神经网络的特点
  • 3.4.2 粗糙集与神经网络的结合
  • 3.5 小结
  • 4 基于粗糙集和神经网络分类器的电影票房预测
  • 4.1 电影票房预测研究综述
  • 4.1.1 预测方法研究现状
  • 4.1.2 电影票房收入的影响因素
  • 4.2 数据预处理
  • 4.2.1 输入/输出数据规范化
  • 4.2.2 变量选择及其初始值的确定
  • 4.3 基于动态阈值神经网络分类器的票房预测
  • 4.3.1 票房预测的性能指标
  • 4.3.2 隐层数及其节点数的选择
  • 4.3.3 交叉验证策略
  • 4.3.4 票房预测结果
  • 4.3.5 模型的推广性能分析
  • 4.4 基于粗糙集和神经网络分类器的票房预测
  • 4.4.1 基于粗糙集的输入变量约简
  • 4.4.2 票房预测结果及性能分析
  • 4.5 小结
  • 结论
  • 参考文献
  • 附录 部分电影票房数据
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于粗糙集与神经网络的数据分类研究及应用
    下载Doc文档

    猜你喜欢