Web页面文本信息的自动提取技术研究

Web页面文本信息的自动提取技术研究

论文摘要

Web页面文本信息的自动提取技术是为了满足信息资源整合的合理性和时效性需要,通过对网页文件的预处理,利用专门的算法对页面文本文件进行信息提取,通过对提取后的数据进行数据分析、处理,得到用户需求的有用信息。本文通过对现有web开发技术的分析;研究了页面预处理和自动提取的方法;论述了网页文本信息的数据分析处理应用的方法;结合具体事例探讨了Web页面文本信息自动提取技术和应用的实用价值。

论文目录

  • 内容提要
  • 绪论
  • 1.1 引言
  • 1.2 Web页面文本自动提取技术的研究现状
  • 第一章 Web 页面文本信息及其开发技术
  • 1.1 Web 页面文本信息概述
  • 1.2 Web 页面文本信息的特点
  • 1.3 Web 页面文本信息的分类与组织
  • 1.4 万维网技术
  • 第二章 Web 页面文本信息的预处理
  • 2.1 概述
  • 2.2 信息自动处理技术
  • 第三章 Web 文本信息自动提取技术研究
  • 3.1 Web 网页信息及其处理的特点
  • 3.2 Web 文本信息的自动提取技术概述
  • 3.3 Web 页面文本信息自动提取的流程
  • 3.4 Web 页面文本文件的提取方法
  • 第四章 网页文本分析处理及其应用
  • 4.1 文本信息分析处理
  • 4.2 网页文本信息数据分析处理
  • 第五章 Web 页面自动提取与应用系统实现
  • 5.1 网络教学应用系统的设计背景
  • 5.2 网络教学应用系统的设计目的和意义
  • 5.3 系统平台选择
  • 5.4 系统功能分析与实现
  • 结论
  • 参考文献
  • 摘要
  • ABSTRACT
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    Web页面文本信息的自动提取技术研究
    下载Doc文档

    猜你喜欢