论文摘要
现在股民对自己所持股票的判断依据很多来自互联网,但由于现在网络信息量巨大、信息间没有相应的语义支持,使得他们难以充分利用网上的股评信息。在分析国内外语义Web基础上,本文通过语义对股评信息进行推理,预测第2天的股价趋势,并给出了基于股评信息的系统架构,主要研究工作如下:首先,确定股评信息与股评信息预处理。通过股评信息的概念,将股评信息分为大盘股评、板块股评和个股股评三类,并对股评信息的结构进行分析;将股评信息分成各种关键词,建立系统的预测特征词库。将从网上抽取的股评信息与词库进行匹配,存入到相应的数据库中。其中,介绍了以ETL过程为基础的数据清理方法,对源数据库中的股评信息进行预处理,并通过对源数据库中数据的抽取,将数据进行转换到所需的数据格式,并存入到相应的表中。然后,提出了股评信息的推理原则与方法。针对股评信息(即大盘股评、板块股评和个股股评)可能得到的结果(上涨、下跌、平仓)建立样本空间,构建数学模型。(1)根据三类股评信息在股票走势预测的过程中的重要性设定初始权值,建立三个熵空间(个股股评、大盘股评、对应的行业板块股评),计算三个空间的熵值;通过熵值对权值进行修改。(2)将熵权的理论引入到该模型中,建立基于熵权的股评评价范阵,最终得到熵权值对权值进行修改。(3)在引入极大熵的理论时,通过主观约束条件和客观约束条件同时约束构建的目标函数,最终构建相应的数学模型,求解各个评价指标的权重值。最后,给出了股评信息系统的架构。该架构把股评信息系统分成URI层、XML/XML Schema层、Ontology(RDF)层以及Agent层;设计了系统中各个层之间信息交换的XML格式,同时结合XML及XML Schema,描述了用户与系统的交互过程;构建系统中的各类本体,给出了本体的描述;描述了本体之间的Agent的工作机制,给出了本体与Agent之间的交互实例;从Web Service的交互机制方面描述了连接组件的设计,并给出了系统组件的任务单的整个过程。在此基础上,通过一个实例验证了在此架构下获取的股评信息的推理方法的可行性。