论文摘要
在信息技术和数据库技术高速发展的今天,数据成了人们工作和生活中必不可少的一部分,然而要从海量数据中提取出有用信息却很困难。数据分类作为一种重要的数据分析技术,可以用于提取描述重要数据类的模型和预测未来的数据趋势,帮助人们总结出数据中隐含的规律,为业务决策和战略发展服务。论文首先介绍了粗糙集理论,并引入了一种基于属性重要度的粗糙集属性约简算法,它能有效地消除冗余信息,达到为输入变量降维的目的。其次,针对多分类问题设计了一个基于动态阈值的神经网络分类器,此分类模型采用了与传统模型不同的动态阈值函数,可以有效提高分类器的泛化能力。另外,还结合理论指导和实际的试验仿真对神经网络的隐层数及其节点数进行了优化设计,采用具有双隐层的BP神经网络作为分类器模型的核心。最后,通过分析粗糙集和神经网络的特点,取长补短,把二者有机地结合在了一起,使用粗糙集作为分类器模型的前端处理器,约简输入变量,达到了科学选择变量的目的,提高了模型的分类性能。电影票房预测是一个典型的非线性问题,通过将其转化成一个分类问题,可以使问题简化,即把影片根据其票房收入的高低划分成了6个档次,预测的目的就是把影片分到相应的类别里面。在成功建模的基础上,确定了影响影片票房高低的因素作为输入变量,然后通过统计的方法确定了其初始值。最后运用所设计的分类器模型解决了该票房预测问题。通过与决策树、支持向量机、RBF网络等方法的比较结果表明,基于动态阈值的神经网络分类器具有更好的预测精度、稳定性以及泛化能力。基于粗糙集的属性约简对分类器的输入变量进行了科学合理的降维,其与神经网络分类器的有机结合取得了良好的效果,预测性能明显优于其它分类模型。
论文目录
摘要Abstract1 绪论1.1 课题的研究背景1.2 数据分类技术研究现状1.2.1 常见的数据分类技术1.2.2 数据分类技术存在的问题及未来的发展方向1.3 课题的主要研究内容1.3.1 研究的目的及意义1.3.2 作者的主要工作2 基于属性重要度的粗糙集属性约简方法2.1 常见的属性约简算法2.2 粗糙集理论概述2.2.1 粗糙集的基本概念2.2.2 基于粗糙集的知识表达系统2.3 基于属性重要度的粗糙集属性约简算法2.3.1 属性重要度的计算2.3.2 连续属性值的离散化2.3.3 改进的广义特征表求核算法2.3.4 基于属性重要度的改进启发式约简算法2.4 小结3 基于粗糙集与神经网络的分类器设计3.1 BP神经网络3.1.1 BP神经网络模型3.1.2 误差反向传播学习算法3.2 神经网络分类器原理3.2.1 神经网络分类器概述3.2.2 BP神经网络的分类能力3.3 基于动态阈值的神经网络分类器设计3.3.1 神经网络输入输出参数的确定3.3.2 神经网络结构参数的确定3.3.3 分类器的训练及校验方法3.3.4 基于动态阈值函数的输出规范化3.3.5 基于动态阈值的神经网络分类器模型3.4 粗糙集与神经网络分类器的结合3.4.1 粗糙集与神经网络的特点3.4.2 粗糙集与神经网络的结合3.5 小结4 基于粗糙集和神经网络分类器的电影票房预测4.1 电影票房预测研究综述4.1.1 预测方法研究现状4.1.2 电影票房收入的影响因素4.2 数据预处理4.2.1 输入/输出数据规范化4.2.2 变量选择及其初始值的确定4.3 基于动态阈值神经网络分类器的票房预测4.3.1 票房预测的性能指标4.3.2 隐层数及其节点数的选择4.3.3 交叉验证策略4.3.4 票房预测结果4.3.5 模型的推广性能分析4.4 基于粗糙集和神经网络分类器的票房预测4.4.1 基于粗糙集的输入变量约简4.4.2 票房预测结果及性能分析4.5 小结结论参考文献附录 部分电影票房数据攻读硕士学位期间发表学术论文情况致谢
相关论文文献
标签:数据分类论文; 粗糙集论文; 神经网络论文; 动态阈值论文; 票房预测论文;