基于WEB文本挖掘的企业竞争情报收集系统

基于WEB文本挖掘的企业竞争情报收集系统

论文摘要

本文主要研究了应用WEB文本挖掘技术收集企业竞争情报信息的理论和方法,作者希望通过已有的元搜索、文本过滤、信息抽取等WEB文本挖掘相关技术自动提取Internet上竞争对手的相关信息,例如企业名称、企业规模、生产能力、联系方式等,从而为企业提供大量的信息素材和有效的决策支持,提高企业的竞争力。文中作者首先提出了基于WEB文本挖掘的企业竞争情报收集系统的总体框架,并对其三个关键子系统—网页采集子系统、文本过滤子系统和信息抽取子系统的实现方法和关键技术进行了分析和设计。最后,按照作者提出的思想,编程实现了一个基于WEB文本挖掘的企业竞争情报收集原型系统,利用该系统验证了作者所提思想方法的可行性及证明了该思想方法的准确性。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景
  • 1.2 企业竞争情报系统相关理论及研究现状
  • 1.2.1 企业竞争情报系统
  • 1.2.2 我国企业建立 ECIS 的意义
  • 1.2.3 ECIS 的国内外研究现状
  • 1.3 论文观点的提出及主要研究内容
  • 1.4 论文组织结构
  • 2 WEB 文本挖掘研究
  • 2.1 WEB 挖掘
  • 2.2 WEB 挖掘的分类
  • 2.3 WEB 文本挖掘
  • 2.3.1 文本特征表示
  • 2.3.2 文本分类
  • 2.3.3 文本聚类
  • 3 系统总体设计及相关技术
  • 3.1 系统总体框架
  • 3.2 元搜索技术
  • 3.2.1 搜索引擎概述
  • 3.2.2 元搜索引擎
  • 3.2.3 元搜索引擎特点
  • 3.3 文本过滤技术
  • 3.3.1 文本过滤一般的实施方法
  • 3.3.2 文本过滤的特点及分析
  • 3.3.3 基于样本公共特征的文本过滤
  • 3.4 信息抽取技术
  • 3.4.1 信息抽取系统的一般结构
  • 3.4.2 信息抽取关键技术
  • 3.4.3 信息抽取系统的实现途径
  • 3.4.4 基于模式的信息抽取实现方法
  • 4 系统详细设计及关键技术
  • 4.1 网页采集子系统的设计
  • 4.1.1 网页采集子系统设计思路
  • 4.1.2 网页采集子系统的总体结构及流程
  • 4.1.3 信息搜集子系统的关键技术分析
  • 4.2 文本过滤子系统的设计
  • 4.2.1 文本过滤子系统的设计思路
  • 4.2.2 文本过滤子系统的总体结构及流程
  • 4.2.3 文本过滤子系统的关键技术分析
  • 4.3 信息抽取子系统的设计
  • 4.3.1 信息抽取子系统的设计思路
  • 4.3.2 信息抽取子系统的总体结构及流程
  • 4.3.3 信息抽取子系统的关键技术分析
  • 5 原型系统的设计实现与应用实例
  • 5.1 系统概况
  • 5.2 原型系统的实现
  • 5.2.1 网页采集子系统的实现
  • 5.2.2 文本过滤子系统的实现
  • 5.2.3 信息抽取子系统的实现
  • 5.3 一个应用实例
  • 6 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 攻读硕士学位期间发表的学术论文
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于WEB文本挖掘的企业竞争情报收集系统
    下载Doc文档

    猜你喜欢