基于关联规则的股票时间序列趋势预测研究

基于关联规则的股票时间序列趋势预测研究

论文摘要

中国股市从2006年1月份的1100多点升至2007年10月份的6000多点,升幅巨大,在世界也是罕见的。虽然蕴涵着巨大的投资机会,但却也使部分投资者亏损累累。随着经济的发展,股票市场越来越受到人们的重视,其在经济体系中也发挥着越来越重要的作用。而股市的健康发展和繁荣也成为管理者和投资者关心和研究的重点。股票投资的收益与风险往往是成正比的,即投资收益越高,可能冒的风险越大。因此,股市预测方法的研究具有极其重要的应用价值和理论意义。传统的技术分析和基本面分析也各有各自优缺点,而我国的股市正日益成熟和规范,投资者在进行投资决策时也愈加趋于理性化。本文试图应用数据挖掘的办法来在股票分析中,帮助投资者获取更多的股市关联信息以加强对某些个股的分析和判断。因为目前世界上尚无很好的预测股市方法,目前可以运用许多统计分析方法来发现一些隐藏在股票信息中的规律,本文的工作也就立足在关联原则基础上进行分析,以帮助投资者对股票进行预测。在整个数据挖掘的研究中,算法的研究占有特别重要的地位。数据挖掘面对的是大量数据集,算法的效率起到决定性的作用,因此,研究和改进现有的算法,有着十分重要的意义。鉴于此,本文对关联规则挖掘算法进行了研究。首先对股票的基础知识作了简单地概括,对数据挖掘作了一般性介绍,包括数据挖掘的概念、模式、挖掘的主要问题、数据挖掘系统的分类以及应用和发展趋势。然后,对数据挖掘中重要的关联规则挖掘算法做了深入的研究,分析了关联规则中经典的Apriori算法、AprioriTid算法和Apriori算法的在股票数据的改进算法,总结了算法中存在的问题;接着,详细介绍了本文内容的重点之一,基于成交量和二维时间模式下的双事务股票时间序列关联的研究的一种OptimizedApriori算法的改进算法。为了更好地挖掘股市信息,就必须结合股市的特点,特别是股票自身的运作规律,股票的走势包含了数以万计人的思维和智慧,必须通过详细和耐心的观察才能学之一二。经过长期学习、跟踪股市及模拟演练,挖掘出在股市中存在的这样一些带有时间约束的规律——在某个时间段w(如一天)内,如果股票A的收盘价上涨超过2%,成交量大于volmin(某个设定的阈值),那么间隔DAY个时间段(如两天)后的那个时间段(即第三天)内股票B和股票C会以80%的可能性也上涨(或下跌)。最后在Microsoft Visual C++6.0环境下完成了对股票数据的处理、算法的改进及挖掘工作。实验验证了改进的OptimizedApriori算法的效率在一定程度上优于Apriori算法;同时挖掘出了大量关联规则,其中一些颇具指导意义。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 课题研究的背景及意义
  • 1.2 股票的背景知识
  • 1.3 中国股市简介
  • 1.3.1 股票分析预测方法综述
  • 1.3.2 一些常用的股市预测变量
  • 1.3.3 股价(股指)预测存在的问题
  • 1.4 数据挖掘、关联规则简介
  • 1.4.1 数据挖掘的概念
  • 1.4.2 数据挖掘的国内外现状
  • 1.4.3 数据挖掘分类
  • 1.5 本文主要研究内容及论文的组织
  • 第二章 关联规则的数据挖掘及相关算法分析
  • 2.1 数据预处理
  • 2.1.1 数据清理
  • 2.1.2 数据集成
  • 2.1.3 数据归约
  • 2.2 其它应用于股票数据的数据预处理方法
  • 2.2.1 小波分析用于股市行情数据预处理
  • 2.2.2 移动均线处理
  • 2.3 关联规则挖掘
  • 2.3.1 关联规则简介
  • 2.3.2 时间序列的关联规则分析
  • 2.3.2.1 时间序列概念
  • 2.3.2.2 时间序列关联分析
  • 2.3.2.3 股票数据的时间序列参数设置
  • 2.3.3 关联规则的基本算法及相关改进
  • 2.3.3.1 关联规则的基本概念
  • 2.3.3.2 经典Apriori算法分析
  • 2.4 Apriori改进算法:AprioriTid算法的分析
  • 2.5 其他几种改进算法简介
  • 2.6 本章小结
  • 第三章 股票的时间序列分析
  • 3.1 对股票数据作关联分析
  • 3.1.1 股票数据的数据结构
  • 3.2 算法过程描述
  • 3.2.1 数据来源和预处理
  • n'>3.2.2 产生N-项频繁项集Ln
  • 3.2.3 实验结果分析
  • 3.3 本章总结
  • 第四章 基于成交量和二维时间模式下的双事务股票时间序列关联的研究
  • 4.1 一些股票的参数简介
  • 4.2 股价与成交量交易的研究
  • 4.3 股票成交量的数据预处理
  • 4.3.1 概念的定义
  • 4.3.2 定量分析成交量
  • 4.3.3 基于二维时间模式的股票数据分析
  • 4.3.4 序列规则的模型及概念定义
  • 4.4 双事务模式的数据预处理算法
  • 4.5 基于成交量的具有时间约束的双事务股票序列规则挖掘算法的实现
  • 4.5.1 OptimizedApriori算法分析
  • 4.5.2 算法的过程示例
  • 4.5.3 挖掘规则结果分析
  • 4.5.4 测试结果分析
  • 4.6 小结
  • 第五章 总结与展望
  • 5.1 本文工作的总结
  • 5.2 算法存在的问题及可能的改进方向
  • 参考文献
  • 致谢
  • 攻读硕士学位期间参与的科研项目及发表的论文
  • 一、发表的论文
  • 二、参与的科研项目
  • 相关论文文献

    • [1].改进的关联规则挖掘算法在个性化推荐系统中应用[J]. 数码世界 2017(08)
    • [2].关于关联规则在高校教务管理系统中的应用研究[J]. 考试周刊 2018(79)
    • [3].姜良铎治疗慢性阻塞性肺疾病组方规律探讨[J]. 中国中医基础医学杂志 2019(09)
    • [4].基于Can树的关联规则增量更新算法改进[J]. 重庆邮电大学学报(自然科学版) 2018(04)
    • [5].关联规则方法在智能交通管理系统中的应用[J]. 警察技术 2018(03)
    • [6].基于关联规则数据挖掘的广州市男性吸烟者戒烟行为分析[J]. 现代医药卫生 2018(14)
    • [7].基于关联规则的乌鲁木齐道路交通事故分析[J]. 交通节能与环保 2019(03)
    • [8].关联规则在股票分析及预测中的应用[J]. 新经济 2016(05)
    • [9].基于关联规则挖掘痤疮针灸配穴规律[J]. 福建中医药 2018(03)
    • [10].教育大数据环境下基于关联规则的答卷分析模型研究[J]. 现代计算机(专业版) 2017(29)
    • [11].关联规则的Apriori算法改进[J]. 信息与电脑(理论版) 2015(09)
    • [12].关联规则在计算机等级考试中的应用研究[J]. 电脑迷 2018(08)
    • [13].基于相关系数的隐私保护关联规则挖掘[J]. 计算机工程 2010(05)
    • [14].基于信息表和差集的关联规则挖掘[J]. 计算机应用与软件 2010(12)
    • [15].基于关联规则挖掘的朴素贝叶斯分类算法[J]. 数码世界 2019(01)
    • [16].基于关联规则的馆员动态智能培训系统[J]. 中国管理信息化 2012(10)
    • [17].北京市企业标准化评审结果分析方法[J]. 清华大学学报(自然科学版) 2018(08)
    • [18].基于粗糙集的多维关联规则挖掘方法[J]. 计算机应用 2009(05)
    • [19].多因素兴趣度建模与度量研究[J]. 陕西师范大学学报(自然科学版) 2008(03)
    • [20].Apriori算法改进及其在校园舆情焦点问题的应用[J]. 数字通信世界 2019(08)
    • [21].基于数据挖掘的焊接方法提取(英文)[J]. 机床与液压 2016(06)
    • [22].基于数据流的频繁闭项集挖掘[J]. 电子商务 2014(11)
    • [23].基于数据挖掘的高校学生成绩预警系统设计[J]. 科技资讯 2013(06)
    • [24].关联规则挖掘在药物治疗肝硬化中的应用研究[J]. 激光杂志 2010(05)
    • [25].基于关联规则的我国股市行业轮动现象研究[J]. 中国市场 2020(26)
    • [26].基于关联分类方法的web用户兴趣预测的研究[J]. 制造业自动化 2011(02)
    • [27].关联规则方法分析病毒性肺炎热与郁相关病机[J]. 南京中医药大学学报 2011(06)
    • [28].频繁项集挖掘算法的研究[J]. 电脑知识与技术 2010(24)
    • [29].Apriori算法的优化方法[J]. 计算机技术与发展 2009(06)
    • [30].基于改进的Apriori算法的教学质量分析[J]. 吉林师范大学学报(自然科学版) 2009(04)

    标签:;  ;  ;  ;  

    基于关联规则的股票时间序列趋势预测研究
    下载Doc文档

    猜你喜欢