论文摘要
Web页面文本信息的自动提取技术是为了满足信息资源整合的合理性和时效性需要,通过对网页文件的预处理,利用专门的算法对页面文本文件进行信息提取,通过对提取后的数据进行数据分析、处理,得到用户需求的有用信息。本文通过对现有web开发技术的分析;研究了页面预处理和自动提取的方法;论述了网页文本信息的数据分析处理应用的方法;结合具体事例探讨了Web页面文本信息自动提取技术和应用的实用价值。
Web页面文本信息的自动提取技术是为了满足信息资源整合的合理性和时效性需要,通过对网页文件的预处理,利用专门的算法对页面文本文件进行信息提取,通过对提取后的数据进行数据分析、处理,得到用户需求的有用信息。本文通过对现有web开发技术的分析;研究了页面预处理和自动提取的方法;论述了网页文本信息的数据分析处理应用的方法;结合具体事例探讨了Web页面文本信息自动提取技术和应用的实用价值。