论文摘要
本文主要研究了应用WEB文本挖掘技术收集企业竞争情报信息的理论和方法,作者希望通过已有的元搜索、文本过滤、信息抽取等WEB文本挖掘相关技术自动提取Internet上竞争对手的相关信息,例如企业名称、企业规模、生产能力、联系方式等,从而为企业提供大量的信息素材和有效的决策支持,提高企业的竞争力。文中作者首先提出了基于WEB文本挖掘的企业竞争情报收集系统的总体框架,并对其三个关键子系统—网页采集子系统、文本过滤子系统和信息抽取子系统的实现方法和关键技术进行了分析和设计。最后,按照作者提出的思想,编程实现了一个基于WEB文本挖掘的企业竞争情报收集原型系统,利用该系统验证了作者所提思想方法的可行性及证明了该思想方法的准确性。
论文目录
摘要Abstract1 绪论1.1 研究背景1.2 企业竞争情报系统相关理论及研究现状1.2.1 企业竞争情报系统1.2.2 我国企业建立 ECIS 的意义1.2.3 ECIS 的国内外研究现状1.3 论文观点的提出及主要研究内容1.4 论文组织结构2 WEB 文本挖掘研究2.1 WEB 挖掘2.2 WEB 挖掘的分类2.3 WEB 文本挖掘2.3.1 文本特征表示2.3.2 文本分类2.3.3 文本聚类3 系统总体设计及相关技术3.1 系统总体框架3.2 元搜索技术3.2.1 搜索引擎概述3.2.2 元搜索引擎3.2.3 元搜索引擎特点3.3 文本过滤技术3.3.1 文本过滤一般的实施方法3.3.2 文本过滤的特点及分析3.3.3 基于样本公共特征的文本过滤3.4 信息抽取技术3.4.1 信息抽取系统的一般结构3.4.2 信息抽取关键技术3.4.3 信息抽取系统的实现途径3.4.4 基于模式的信息抽取实现方法4 系统详细设计及关键技术4.1 网页采集子系统的设计4.1.1 网页采集子系统设计思路4.1.2 网页采集子系统的总体结构及流程4.1.3 信息搜集子系统的关键技术分析4.2 文本过滤子系统的设计4.2.1 文本过滤子系统的设计思路4.2.2 文本过滤子系统的总体结构及流程4.2.3 文本过滤子系统的关键技术分析4.3 信息抽取子系统的设计4.3.1 信息抽取子系统的设计思路4.3.2 信息抽取子系统的总体结构及流程4.3.3 信息抽取子系统的关键技术分析5 原型系统的设计实现与应用实例5.1 系统概况5.2 原型系统的实现5.2.1 网页采集子系统的实现5.2.2 文本过滤子系统的实现5.2.3 信息抽取子系统的实现5.3 一个应用实例6 总结与展望6.1 总结6.2 展望攻读硕士学位期间发表的学术论文致谢参考文献
相关论文文献
标签:企业竞争情报系统论文; 文本挖掘论文; 元搜索论文; 文本过滤论文; 信息抽取论文;