导读:本文包含了行情数据抽取论文开题报告文献综述及选题提纲参考文献,主要关键词:数据抽取,Web内容挖掘,行情数据抽取,表格数据抽取
行情数据抽取论文文献综述
于春燕[1](2007)在《Web行情数据的抽取研究》一文中研究指出根据"行情数据常表现为最大的表格区域"等规律,提出了先识别最大表格再自动抽取行情数据的抽取算法,该算法无需用户定义目标区域即可自动抽取并存储数据。(本文来源于《电脑知识与技术(学术交流)》期刊2007年21期)
于春燕[2](2007)在《Web中的行情数据抽取与预测研究》一文中研究指出随着Web技术的飞速发展,万维网已经成为世界上最大的资源库,面向Web数据的挖掘与应用成为数据挖掘领域的研究热点。其中,针对Web中大量动态表格形式的行情数据的有效获取和预测,具有理论价值和实际意义。本文主要针对这一课题开展研究,内容如下:(1)提出了Web行情数据抽取算法和Web页特征抽取算法。两个算法都充分利用了HTML的语法规则和Web页设计规律。Web行情数据抽取算法主要基于“Web行情数据通常在网页中表现为区域最大的数据表格”等规律,首先自动识别出最大的数据表格,然后转换为DOM树结构,最后抽取DOM树的结点值。与传统算法不同,算法无需用户定义抽取数据区域,实现了自动抽取。为了描述被抽取的页面,提出了Web页的元数据描述模型及元数据提取算法。元数据抽取算法充分利用Web页规律,通过正则表达式实现了有效抽取。实验表明,Web行情数据抽取算法和元数据提取算法均具有较好的性能。(2)开展了Web行情数据的预测研究。行情数据预测需求一般分为长期预测(一年以上)和短期预测(一年之内)。利用Web行情数据抽取算法获取某农产品报价数据后,针对长期和短期预测需求,分别运用多个时间序列预测模型、使用不同的样本数据,比较预测模型和样本数据对预测性能的影响。实验表明,长期预测采用线性季节模型和长期样本数据的性能较好;短期预测采用Holter-Winter季节模型和短期样本数据的性能较好。(3)设计并实现了一个农产品价格预测原型系统。该系统针对某个农产品,自动从特定网站获取每日价格行情数据,以图式显示指定样本区间的价格数据,并根据用户输入的预测区间选择模型进行价格预测。(本文来源于《合肥工业大学》期刊2007-09-01)
行情数据抽取论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着Web技术的飞速发展,万维网已经成为世界上最大的资源库,面向Web数据的挖掘与应用成为数据挖掘领域的研究热点。其中,针对Web中大量动态表格形式的行情数据的有效获取和预测,具有理论价值和实际意义。本文主要针对这一课题开展研究,内容如下:(1)提出了Web行情数据抽取算法和Web页特征抽取算法。两个算法都充分利用了HTML的语法规则和Web页设计规律。Web行情数据抽取算法主要基于“Web行情数据通常在网页中表现为区域最大的数据表格”等规律,首先自动识别出最大的数据表格,然后转换为DOM树结构,最后抽取DOM树的结点值。与传统算法不同,算法无需用户定义抽取数据区域,实现了自动抽取。为了描述被抽取的页面,提出了Web页的元数据描述模型及元数据提取算法。元数据抽取算法充分利用Web页规律,通过正则表达式实现了有效抽取。实验表明,Web行情数据抽取算法和元数据提取算法均具有较好的性能。(2)开展了Web行情数据的预测研究。行情数据预测需求一般分为长期预测(一年以上)和短期预测(一年之内)。利用Web行情数据抽取算法获取某农产品报价数据后,针对长期和短期预测需求,分别运用多个时间序列预测模型、使用不同的样本数据,比较预测模型和样本数据对预测性能的影响。实验表明,长期预测采用线性季节模型和长期样本数据的性能较好;短期预测采用Holter-Winter季节模型和短期样本数据的性能较好。(3)设计并实现了一个农产品价格预测原型系统。该系统针对某个农产品,自动从特定网站获取每日价格行情数据,以图式显示指定样本区间的价格数据,并根据用户输入的预测区间选择模型进行价格预测。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
行情数据抽取论文参考文献
[1].于春燕.Web行情数据的抽取研究[J].电脑知识与技术(学术交流).2007
[2].于春燕.Web中的行情数据抽取与预测研究[D].合肥工业大学.2007