不确定时态数据挖掘方法及其在证券行情预测中的应用

不确定时态数据挖掘方法及其在证券行情预测中的应用

论文摘要

随着金融全球化与自由化的推进,金融行业的运行效率与水平在很大程度上决定了一个国家的经济竞争力,而信息化技术越来越成为影响金融行业创新能力与发展水平的重要因素。近年来,许多金融机构开始运用先进的信息技术与智能决策支持技术对业务系统中积累的海量数据进行深入分析,以发现各种有价值的规律。数据挖掘技术作为一种新兴的智能决策支持技术,已经开始在金融行业的部分领域得到应用。在此背景下,研究如何从金融数据中挖掘出各种信息,更好地认识、掌握并利用其规律,无疑具有重要意义。与此同时,金融市场的信息具有不确定性众多、非线性和信息数据的模糊性及非结构性等特点。金融市场中的不确定性包含时间的不确定。这些问题都值得研究者们进行深入研究。不确定性方法与数据挖掘技术有一定的重叠性,两者在单独使用时都具有一定局限性。数据挖掘中存在不确定性问题,金融时间序列分析中也存在不确定性问题,并且传统数理统计方法不适用于从大量的数据中主动发现各种潜在规则,而不确定性方法在单独进行预测时会遇到小数据量等问题。本文根据具体选定的证券市场行情预测对象,将不确定性方法和数据挖掘技术的各自优势结合起来,得到一种基于不确定性方法和数据挖掘技术的不确定时态数据挖掘方法(UTDM)。该方法能更好地发挥不确定性方法和数据挖掘技术的优势,为证券市场的预测提供更好的技术分析方法,从而为投资决策者提供更为精确的定量分析结果。在对不确定性方法和数据挖掘技术的相关理论、研究发展现状及不足进行深入讨论的基础上,选取不确定性方法和数据挖掘技术中几种具有代表性的方法:在不确定性方法中选取模糊集方法、模糊相似关系下的模糊粗糙集及灰色理论;在数据挖掘中选取关联规则、神经网络等方法,用于构建证券市场的有效分析方法。在此基础上分别得到模糊相似关系下的模糊粗糙集挖掘预测方法、趋势特征挖掘预测方法、时间序列模糊关联规则挖掘预测方法及多灰色神经网络预测方法,用这些方法分别解决证券市场中短期的个股及股指的预测问题。论文后续部分则以此为基础进行展开。本文通过模糊相似关系下的模糊粗糙集和数据挖掘技术对股票价格进行预测研究,从证券市场的大量数据中得到强规则。利用模糊集和粗糙集方法将股票价格进行预分类,并按时间属性进行分组,通过给出的模糊相似关系下的模糊粗糙集计算每组的真值,利用数据挖掘技术获得候选属性,最终得到相应时间段内的有用规则,根据所得规则预测某一具体时间段内股票价格的变化趋势。将模糊粗糙集扩展到模糊相似关系下的模糊粗糙集,并应用到对股票价格的预测中,能较原模糊粗糙集方法得到更多的有用规则,准确率更高。将股票中的时间序列转换为以价格变动率为变量的时间序列进行分析,并对趋势特征提取、聚类算法进行改进,将时间序列的预测问题转化为频繁和有效特征集来发现问题,进而对趋势特征模式进行挖掘预测,根据连续一段时间内的涨跌情况判断市场的发展趋势。将时间序列模糊关联规则应用于证券市场的交易规则抽取。选用聚类方法对模糊集属性进行离散化,构造模糊集和隶属函数,引入时间维度,提出适合股票交易规则抽取的时间序列模糊关联规则算法,对一定时间段内股票间及行业间的关联关系进行最大限度的挖掘预测。提出将3种灰色预测模型,即残差GM(1, 1),无偏GM(1, 1)和pGM(1, 1)与神经网络预测模型有机组合起来,建立一种新的多灰色神经网络组合预测方法,并通过对中国证券市场综合指数进行模拟预测进行验证,对证券市场综合指数的预测及比较说明了该组合预测精度的有效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 选题背景及课题来源
  • 1.1.1 选题背景
  • 1.1.2 课题来源
  • 1.2 研究意义
  • 1.3 本文主要工作及创新点
  • 1.4 研究思路与内容
  • 第2章 相关研究基础与文献综述
  • 2.1 数据挖掘技术
  • 2.1.1 数据挖掘模型的分类
  • 2.1.2 数据挖掘的主要方法和算法
  • 2.1.3 时态数据挖掘
  • 2.2 金融时间序列分析方法研究
  • 2.2.1 金融时间序列的传统分析方法
  • 2.2.2 混合方法
  • 2.2.3 传统时间序列挖掘方法的不足
  • 2.3 不确定性及其方法
  • 2.3.1 不确定性的定义
  • 2.3.2 造成不确定性的原因
  • 2.3.3 不确定性方法
  • 2.5 本章小结
  • 第3章 证券市场预测需求下新型数据挖掘方法的构建
  • 3.1 金融市场可预测性
  • 3.2 证券市场行情预测总体分析
  • 3.2.1 证券市场预测的分类
  • 3.2.2 本文研究对象的选择
  • 3.2.3 证券市场科学预测的研究方法
  • 3.3 不确定时态数据挖掘方法的构建
  • 3.3.1 数据挖掘技术的应用领域
  • 3.3.2 时间序列挖掘的研究领域
  • 3.3.3 不确定时态数据挖掘方法的基本思路
  • 3.4 证券市场行情预测研究方案的确定
  • 3.5 本章小结
  • 第4章 模糊相似关系下模糊粗糙集对股价的预测
  • 4.1 模糊粗糙集理论基础
  • 4.1.1 粗糙集理论的基本概念
  • 4.1.2 模糊相似关系
  • 4.2 模糊相似关系下的模糊粗糙集
  • 4.3 利用模糊粗糙集对证券市场进行预测
  • 4.3.1 股票价格序列预定义
  • 4.3.2 利用模糊粗糙集方法挖掘规则过程
  • 4.3.3 模糊粗糙集规则挖掘
  • 4.3.4 测试结果
  • 4.4 本章小结
  • 第5章 趋势特征挖掘对股价突变的预测
  • 5.1 时间序列相似性模式挖掘研究
  • 5.1.1 相似性度量
  • 5.1.2 欧氏距离的定义
  • 5.2 趋势特征挖掘预测方法构造过程
  • 5.2.1 特征提取平滑处理
  • 5.2.2 趋势特征抽取算法
  • 5.2.3 趋势特征聚类算法选择
  • 5.2.4 特征模式预测方法发现过程
  • 5.3 趋势特征挖掘方法在证券市场中的应用
  • 5.4 测试结果
  • 5.5 本章小结
  • 第6章 股票间时间序列模糊关联规则挖掘预测
  • 6.1 模糊数据挖掘技术
  • 6.2 时间序列关联规则挖掘方法
  • 6.2.1 Apriori 算法
  • 6.2.2 时间序列关联规则挖掘基本步骤
  • 6.3 证券市场中时间序列模糊预处理过程
  • 6.3.1 模糊集核与支集的定义
  • 6.3.2 模糊集的隶属函数构造
  • 6.3.3 聚类方法的选择
  • 6.3.4 时间序列的模糊离散化
  • 6.4 时间序列模糊关联规则挖掘算法构造
  • 6.5 时间序列模糊关联规则在证券市场中的应用
  • 6.5.1 时间序列数据预处理
  • 6.5.2 规则抽取结果分析
  • 6.6 本章小结
  • 第7章 多灰色神经网络组合方法对股指的预测
  • 7.1 灰色系统理论及其技术
  • 7.1.1 灰色预测分类
  • 7.1.2 灰色理论在证券市场分析中的应用
  • 7.1.3 灰色理论在证券市场分析应用中的不足
  • 7.2 神经网络模型
  • 7.2.1 基本人工神经元及其网络
  • 7.2.2 神经网络的学习与训练
  • 7.3 多灰色神经网络组合预测模型建模过程
  • 7.3.1 带残差修正的灰色GM(1, 1)模型
  • 7.3.2 无偏GM(1, 1)模型
  • 7.3.3 pGM(1, 1)模型
  • 7.3.4 BP 神经网络
  • 7.3.5 多灰色神经网络组合预测模型
  • 7.4 组合预测方法实证分析
  • 7.4.1 灰色模型进行预测
  • 7.4.2 BP 神经网络模型进行预测
  • 7.4.3 多灰色神经网络模型预测结果分析
  • 7.5 本章小结
  • 结论
  • 参考文献
  • 附录A 攻读学位期间发表的学术论文目录
  • 致谢
  • 相关论文文献

    • [1].浅谈时态数据挖掘的相似性发现技术[J]. 电脑迷 2016(09)
    • [2].主从结构的双时态数据模型的设计应用[J]. 智能计算机与应用 2015(02)
    • [3].一种改进的时态数据模型的设计与应用[J]. 计算机时代 2014(07)
    • [4].相似发现技术在时态数据挖掘中的应用[J]. 硅谷 2012(10)
    • [5].基于时态数据挖掘的图书馆建设与服务发展[J]. 科技情报开发与经济 2011(26)
    • [6].时态数据挖掘在图书馆参考咨询工作中的应用[J]. 科技情报开发与经济 2011(25)
    • [7].电子病历中重叠时态数据的分析与消除[J]. 计算机技术与发展 2009(03)
    • [8].分布式多空间数据库复杂时态数据提取技术[J]. 科学技术与工程 2019(12)
    • [9].电子病历中不确定时态数据的时态过滤运算[J]. 计算机系统应用 2008(07)
    • [10].应急系统中时态数据的本体表示与检索研究[J]. 电脑开发与应用 2008(09)
    • [11].基于界址点的地籍时态数据模型[J]. 辽宁工程技术大学学报(自然科学版) 2009(03)
    • [12].应急系统中时态数据的本体表示研究[J]. 科技情报开发与经济 2008(08)
    • [13].双时态数据更新技术的研究[J]. 齐齐哈尔大学学报(自然科学版) 2013(04)
    • [14].一种面向自然语言表达的不确定时态数据的建模方法[J]. 河北科技大学学报 2010(05)
    • [15].时态数据的切片归档技术研究——以地理信息系统数据为例[J]. 档案与建设 2018(06)
    • [16].基于关系数据库实现时态数据库[J]. 电脑开发与应用 2010(07)
    • [17].基于ArcGIS Engine的时态数据可视化[J]. 电脑编程技巧与维护 2017(16)
    • [18].网络营销平台中的时态数据处理[J]. 网络安全技术与应用 2014(11)
    • [19].一种基于线序划分的时态数据索引技术[J]. 计算机科学 2013(01)
    • [20].气象GIS中的气象时态数据模型的设计[J]. 测绘与空间地理信息 2014(05)
    • [21].面向用户的BCDM时态数据的更新研究[J]. 计算机工程与设计 2009(20)
    • [22].Now相关概率不确定时态数据模型[J]. 嘉应学院学报 2009(06)
    • [23].水文时态数据管理与实现[J]. 电脑知识与技术 2012(14)
    • [24].确定学习与基于数据的建模及控制[J]. 自动化学报 2009(06)
    • [25].时态数据索引TDindex研究与应用[J]. 中国科学:信息科学 2015(08)
    • [26].异构信息空间中支持多模态融合实体搜索的多层时态数据模型[J]. 计算机科学 2015(04)
    • [27].研究房产信息系统中的时态数据管理[J]. 通讯世界 2015(09)
    • [28].时态数据完整性约束研究与实现[J]. 计算机科学 2010(11)
    • [29].时态数据挖掘在手机用户消费行为中的应用[J]. 数理统计与管理 2008(01)
    • [30].HBase下时态信息索引策略研究[J]. 广东工业大学学报 2014(03)

    标签:;  ;  ;  ;  ;  ;  ;  

    不确定时态数据挖掘方法及其在证券行情预测中的应用
    下载Doc文档

    猜你喜欢