知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用

知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用

论文摘要

随着新闻在金融工具交易算法中变的越来越重要,金融行业观察者,投资者和其它的金融分析家对新闻给予了更多的关注。一些金融服务公司为此设立了特定的服务,用来帮助用户过滤一些不相关的新闻和文本文档信息譬如证交所的条例规定信息等。除了金融服务公司以外,一些新闻发布商同样为用户提供了类似的服务,尽管如此,提供给用户的过滤后的新闻信息仍然需要人的判断处理以便进一步发现新闻内容对金融市场的意义,对于特定交易的金融工具需要进一步区分哪些是重要的新闻,哪些是不重要的新闻,并判断每类重要新闻对该金融工具市场走势的影响极性。但是这些人工的处理判断通常会受到自身信息处理能力的局限性以及认知的偏见性的影响。因此,为了用户能够在金融市场中对新闻信息进行更客观的判断,降低人工处理对信息判断的影响,我们设计了一个基于本体论模型的数据挖掘框架,这个框架用来客观的,量化的描述新闻与金融工具交易活动之间的关系。框架包含两个相互关联的部分:一部分是一个本体论模型,主要用于表达金融工具市场中的新闻知识。这一模型又由两个部分组成,其中一部分是一个用OWL DL语言表达的模型(OWL DL是Web本体论语言的一个子语言),这一部分主要描述了领域知识的层级结构,包括新闻、金融工具市场参与者、金融工具及其他们之间的关系。同时这部分也对领域知识中的某些特定词汇给了明确的定义。另外一个部分是一个因果关系图,用来说明新闻对金融工具存在着直接或间接的“因-—果”影响模式,这些影响模式可以用OWL规则语言写入。另一部分是基于这个本体论模型的一个数据挖掘框架,这个框架由三部分组成:第一部分是本体论模型在protégé工具中的实现,被用来依据金融工具的特性和新闻的分类对将要处理的新闻和金融数据进行分类处理;第二部分是一个规则推理系统,在protégé中的jess插件中实现。对于某个给定的金融工具交易活动,这个推理系统可以推荐给用户哪些是可能重要的新闻,并产生对这个金融工具进行数据挖掘的一个模型;第三部分是一个贝叶斯网络算法,是通过结合分类处理后的金融和新闻数据以及对应的数据挖掘模型而产生的一个算法,这个算法精确的计算出了那些可能重要的新闻与某种金融工具交易活动之间存在的量化关系。这个论文中的研究主要有以下主要贡献:1)在本体论模型的基础上,有三个子贡献,首先,可以更深刻的理解金融工具市场中的新闻知识;第二,可以帮助建立基于新闻的金融交易模型或算法;第三,可以辅助和支持相关系统的开发与设计(譬如根据新闻对股票价格进行预测的系统,帮助金融市场参与者搜索相关新闻的系统等)。2)在基于本体论模型的数据挖掘框架上,这个研究提供了:1.一个用来处理不同类的新闻或来自不同行业间的、不同特性的金融数据的本体论模型方法;2.一个用来把领域知识结合到整个数据挖掘过程中的推理系统,其产生的数据挖掘模型包含了对某个金融工具的交易活动重要的新闻变量以及这些新闻对该活动的影响性(“正的”,“中性的”,“负的”);3.对这个数据挖掘框架的实验评价,以便验证该框架的有效性。尽管论文中给出了如何定量、定性的学习新闻与金融工具之间的关系的方法,但仍然有一些不足。因此,后续的研究有两个可能的方向:一是雇佣有投资经验的投资者参与评估试验,利用框架给出的数据结果作决策,验证框架是否有效,数据结果是否能帮助投资者减少由于主观认知的偏见性而造成的损失。但是这个研究方向有一些不可避免的困难,因为有经验的投资者很难被集中起来进行试验;另外一个可能的研究方向是开发一个系统,用框架中给出的数据结果作为输入支持投资者对实时新闻做出及时的交易决策。一些决策理论将会指导如何开发这类系统。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 引言
  • 1.2 研究问题
  • 1.3 研究目标
  • 1.4 研究方法论
  • 1.4.1 设计为一个创造物品
  • 1.4.2 研究问题的关联性
  • 1.4.3 设计评估
  • 1.4.4 设计是一个搜索的过程
  • 1.5 论文概述
  • 第2章 文献回顾
  • 2.1 金融市场中的新闻和金融工具
  • 2.1.1 金融市场中的新闻
  • 2.1.2 金融工具
  • 2.1.3 新闻和金融工具之间的关系
  • 2.2 应用在新闻和金融工具关系上的信息技术
  • 2.3 本体论模型
  • 2.3.1 本体论
  • 2.3.2 因果关系图
  • 2.4 数据挖掘
  • 2.4.1 数据挖掘技术
  • 2.4.2 贝叶斯网络数据挖掘技术
  • 第3章 新闻和金融工具因果关系的本体论模型
  • 3.1 把新闻和金融工具关系表达成本体论模型的优势
  • 3.2 本体论模型
  • 3.2.1 本体论模型中的类
  • 3.2.2 新闻和金融市场参与者的关系
  • 3.2.3 金融市场参与者和金融工具之间的关系
  • 3.2.4 新闻和金融工具之间的关系
  • 3.3 因果关系图模型
  • 3.3.1 领域知识分析
  • 3.3.2 因果关系模型
  • 3.4 案例分析
  • 第4章 基于本体论模型的数据挖掘框架-应用在挖掘新闻和金融工具的关系
  • 4.1 传统方法的局限性
  • 4.2 基于本体论模型的框架
  • 4.2.1 框架的逻辑结构
  • 4.2.2 框架中的任务
  • 4.3 实验评估
  • 4.3.1 假设
  • 4.3.2 样本数据描述
  • 4.3.3 实验设计与程序
  • 4.3.4 实验结果
  • 4.4 总结
  • 第5章 论文总结
  • 5.1 论文的主要工作和贡献
  • 5.2 后续的研究方向
  • 参考文献
  • 附录 1 OWL DL 编码
  • 附录 2 模型中的符号含义
  • 致谢
  • 在读期间发表的学术论文与取得的研究成果
  • 相关论文文献

    • [1].PBR定理与量子态的实在性[J]. 自然辩证法通讯 2018(03)
    • [2].Ontology的Gruber定义:中文语境理解[J]. 计算机工程与设计 2008(08)

    标签:;  ;  ;  ;  ;  ;  

    知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用
    下载Doc文档

    猜你喜欢