基于特征分析的金融时间序列挖掘若干关键问题研究

基于特征分析的金融时间序列挖掘若干关键问题研究

论文题目: 基于特征分析的金融时间序列挖掘若干关键问题研究

论文类型: 博士论文

论文专业: 计算机软件与理论

作者: 黄超

导师: 朱扬勇

关键词: 数据挖掘,时间序列,维约简,相似性查找,自回归移动平均,分割,波动聚集,分形,聚类

文献来源: 复旦大学

发表年度: 2005

论文摘要: 随着金融行业的竞争日益激烈,分析决策对数据的依赖性和敏感度也越来越高。在此背景下,许多金融机构开始运用更先进的信息技术与智能决策支持技术,对业务系统中积累的海量数据进行深入的分析,以发现有价值的各种规律。作为一种新兴的智能决策支持技术,数据挖掘逐步在金融行业中得到应用。 在金融领域,时间序列数据是一类重要的数据类型,对时间序列的挖掘是金融数据挖掘的一个重要内容。本文在分析金融时间序列特征与实际应用需求的基础上,针对金融时间序列挖掘的若干关键问题进行了研究,这些问题的研究对于金融领域的趋势分析与趋势预测、数据的精确建模、风险分析以及投资组合研究等方面有着重要的意义。总的说来,本文的主要研究成果包括: (1)针对金融时间序列的趋势性和趋势变动性,提出了一种基于回归系数的时间序列维约简与相似性查找方法。本文首先证明了对于任意长度的时间序列,可以仅使用常数存储空间、在线性时间内递推计算其回归系数。在此基础上提出了一种基于回归系数的时间序列维约简方法——逐段回归近似(PRA),该方法具有线性时间复杂度,并且对均值平稳的独立噪声干扰不敏感。同时本文证明了使用PRA方法进行相似性查找满足下界定理(也称为收缩性),因而是有效的。对实际数据的实验结果表明,使用PRA方法,可以对金融时间序列进行基于趋势与趋势变动的相似性查找,这一点在外汇、期货市场的数据分析中尤为重要。 (2)针对金融时间序列的自相关特征以及底层生成机制的动态变化特征,提出了一种基于ARMA模型的联机时间序列分割算法。根据ARMA模型的最小方差预测特性,首先提出了一种用于度量当前ARMA模型是否适合描述后续数掘的指标——适合度。在此基础上,提出了一种基于ARMA模型的联机时间序列分割算法,算法通过计算模型对后续数据段的适合度,判断当前模型是否适合继续描述后续数据,从而对模型进行动态调整,或者对序列进行分割并逐段建立ARMA模型。实验结果表明,对跨越较长时期的金融时间序列逐段建立ARMA模型,不仅能够用于分析数据的底层生成机制与自相关特征的变化情况,并且能对序列进行更精确的建模。 (3)基于金融时间序列的自相似性与波动聚集性,提出了一种新的波动聚集性模型——基于自相似的波动聚集模型,用于研究在不同时段,序列波动的自相似特征。为了研究该模型,提出了一种新的基于线性回归模型的联机时间序列分割算法,与以往基于拟合误差的分割算法不同,该算法根据序列的拟合

论文目录:

目录

摘要

ABSTRACT

第一章 绪论

1.1 研究背景

1.1.1 数据挖掘技术的产生和发展

1.1.2 金融信息化与数据挖掘技术

1.1.3 本文的研究对象

1.2 相关研究

1.2.1 金融时间序列的传统分析方法

1.2.2 时间序列挖掘方法

1.2.3 混合方法

1.3 传统分析方法与时间序列挖掘方法的不足

1.4 本文工作

1.4.1 本文的研究方法

1.4.2 本文的研究成果

1.4.3 本文结构

第二章 金融时间序列数据的特征分析

2.1 金融时间序列特征分析的意义

2.2 金融时间序列的关键特征分析

2.2.1 金融资产的相关性与关联性

2.2.2 趋势性与趋势变动性

2.2.3 自相关

2.2.4 数据生成机制的动态变化性

2.2.5 波动聚集性

2.2.6 分形与多重分形

2.3 本章小结

第三章 基于回归系数的时间序列维约简与相似性查找

3.1 线性回归模型

3.2 回归参数的递推计算

3.2.1 回归参数的递推计算方法

3.2.2 回归参数递推计算的实验结果

3.3 基于回归系数的时间序列维约简与相似性查找

3.3.1 相关工作

3.3.2 基于回归系数的维约简

3.3.3 基于PRA方法的相似性查找

3.4 实验结果

3.4.1 PRA方法的时间复杂度

3.4.2 基于PRA方法相似性查找的准确性

3.5 本章小结

第四章 基于ARMA模型的联机时间序列分割算法

4.1 相关工作

4.2 ARMA模型与最小方差预测

4.2.1 ARMA模型及建模过程

4.2.2 ARMA模型的最小方差预测

4.3 基于最小方差预测的模型适合度

4.3.1 模型对单个数据的适合度

4.3.2 模型对数据段的适合度及分割点确定

4.4 基于ARMA模型的联机时间序列分割算法

4.5 实验结果

4.5.1 仿真数据的实验结果

4.5.2 实际数据的实验结果

4.6 本章小结

第五章 基于自相似的时间序列波动聚集性研究

5.1 自相似性与标度不变性

5.2 基于自相似与标度不变性的波动聚集模型

5.3 波动聚集性的分割算法

5.3.1 相关工作

5.3.2 基于趋势变动与拟合优度的联机分割算法SCTGF

5.3.3 基于自相似的波动聚集性分割算法

5.3.4 SCTGF-V算法的其它应用

5.4 实验结果

5.5 本章小结

第六章 基于多重分形的时间序列聚类

6.1 分形与多重分形

6.2 相关工作

6.3 时间序列广义分形维与多重分形谱的计算

6.4 广义分形维与多重分形谱的物理意义

6.4.1 概率函数对多重分形的意义

6.4.2 D_q、α和f(α)的物理意义

6.5 基于多重分形的时间序列聚类

6.6 实验结果

6.7 本章小结

第七章 总结与展望

参考文献

攻读学位期间作者的工作成果

致谢

发布时间: 2005-09-19

参考文献

  • [1].金融时间序列模式挖掘方法的研究[D]. 吴学雁.华南理工大学2010
  • [2].面向网络金融知识服务的模型与方法研究[D]. 黄冬.哈尔滨工业大学2015

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

基于特征分析的金融时间序列挖掘若干关键问题研究
下载Doc文档

猜你喜欢