论文摘要
数据挖掘是当今国际上人工智能和数据库研究方面最富活力的新兴领域,从大型数据库中挖掘关联规则的问题已经成为近年来数据挖掘研究领域中的一个新热点。股票投资风险与机遇并存。如何把握风险,投资回报最大化?是投资者追求的目标。而股票行情受经济、政治等因素的作用,其走势变化莫测,难以把握。现有的股票分析软件其可靠性有待验证。在股票行情数据库中积累了大量历史交易数据,如何充分利用这些历史数据,从关联规则挖掘领域进行新的研究和探索变得很有意义。本文基于国内外研究成果,首先介绍了数据挖掘的理论,引入关联规则挖掘技术,对频繁项集生成算法Apriori进行了分析。针对股票数据的特点和关联规则算法Apriori存在的不足,提出一种基于比特向量和hash技术的频繁项集生成优化算法,并将其嵌入开源数据挖掘工具Weka中。同时对股票行情数据库的原数据文件进行分析,结合Weka数据格式的特点设计了预处理模块。最后使用改进后Weka挖掘工具对预处理后股票数据进行挖掘。对挖掘出的股票规则进行了分析,为股票投资者预测股票未来的走势提供了有价值的参考。
论文目录
摘要ABSTRACT第1章 绪论1.1 选题意义1.2 国内外的研究动态1.3 本文的研究内容1.4 本文组织结构第2章 数据挖掘理论2.1 数据挖掘基本概念2.2 数据挖掘功能2.3 数据挖掘的步骤第3章 关联规则挖掘技术3.1 关联规则挖掘3.2 关联规则挖掘基本概念3.3 关联规则的分类3.4 关联规则挖掘算法3.4.1 候选项集找频繁项的算法-Apriori算法3.4.2 Apriori算法性能分析3.4.3 由频繁项集产生关联规则第4章 股票预测知识4.1 股市影响因素分析4.2 股票预测基础4.3 股票预测理论4.4 股市预测中常用的术语第5章 基于股票预测的频繁项集优化算法5.1 用于股票预测的事务数据库特点5.2 应用比特向量算法减少数据库扫描次数5.2.1 事务数据库的比特向量表示和支持度计算5.2.2 应用hash算法减少生成的候选2-项集个数5.3 算法描述5.4 优化算法性能分析第6章 基于股票预测的关联规则挖掘算法6.1 Weka平台下的关联规则挖掘6.1.1 数据格式6.1.2 数据预处理6.1.3 关联规则挖掘6.1.4 Weka源码分析6.2 基于股票预测的关联规则挖掘算法实现6.2.1 开发环境介绍6.2.2 预处理模块设计和实现6.2.3 频繁项集优化算法嵌入Weka第7章 应用实例分析7.1 数据预处理7.2 股票规则挖掘7.3 规则分析第8章 总结与展望8.1 本文总结8.2 对以后工作的展望参考文献致谢攻读学位期间的研究成果
相关论文文献
标签:频繁项集论文; 股票预测论文; 数据预处理论文;