基于Web挖掘的搜索引擎技术研究

基于Web挖掘的搜索引擎技术研究

论文题目: 基于Web挖掘的搜索引擎技术研究

论文类型: 硕士论文

论文专业: 软件工程

作者: 胡小睿

导师: 唐胜群

关键词: 挖掘,搜索引擎,信息检索

文献来源: 武汉大学

发表年度: 2005

论文摘要: Internet的迅速发展使其成为当今世界上最大的信息库,它是全球范围内传播信息的重要渠道,其中以WWW的发展最为迅速。但Internet是一个开放的网络,网上资源的分布相当分散,并且网上也没有统一的管理和结构,这导致了搜索的困难。如何快速、准确地从浩瀚的信息资源中找到有用的信息是网络用户面临的一个大问题,因此希望有新的工具来定位信息资源。 网络信息搜索技术结合了现代信息检索技术和WWW的相关技术,旨在研究开发出一个智能化的搜索软件,能在网络上自动地进行信息发现和索引,建立结构化索引库,向用户提供查询服务。 随着互联网的迅猛发展,搜索引擎的发展越来越需要借助各种技术来进一步推动。作为知识挖掘新的研究内容的web挖掘,由于自身在信息处理中的层次较高,同时与搜索引擎的关系非常密切,对搜索引擎技术有很大借鉴作用。所以搜索引擎通过应用Web挖掘技术,可以增强信息处理能力,使得信息检索发展到一个新的水平。 本文从开发和研究的角度对WWW搜索引擎的相关技术作了详细的分析和讨论,并介绍了一个针对中小型企业的基于Web挖掘的小型智能搜索系统WMSE,它通过基于Web结构挖掘思想对检索结果进行优化排序,为用户提供更加准确的信息,更好的满足用户的检索需求。 在文章的主体部分,以搜索引擎的设计流程为主线,描述了搜索引擎的几个子系统:搜集子系统、索引子系统、检索子系统和用户界面子系统。其中,特别强调了所采用的相关技术和关键算法。 最后,简要介绍了系统的性能,并对系统今后的发展提出了一些设想。

论文目录:

摘要

Abstract

引言

第1章 绪论

1.1 论文选题的意义

1.1.1 选题研究背景

1.1.2 搜索引擎面临的问题

1.2 国内外的研究动向

1.3 论文的研究内容和结构安排

第2章 搜索引擎相关理论

2.1 搜索引擎工作原理

2.2 搜索引擎的分类及评价标准

2.2.1 搜索引擎的分类

2.2.2 搜索引擎的评价标准

2.2.3 关于智能

2.3 当前搜索引擎的关键技术

2.3.1 信息获取策略

2.3.2 检索结果的联机聚类

2.3.3 基于超链的相关度排序

2.3.4 基于概念的检索

2.3.5 基于相关度反馈

第3章 Web挖掘理论基础

3.1 Web掘的定义

3.2 Web挖掘的分类

3.2.1 Web内容挖掘

3.2.2 Web结构挖掘

3.2.3 Web使用记录挖掘

3.3 Web挖掘的特点

3.4 Web挖掘应用于搜索引擎

3.4.1 Web信息检索定义

3.4.2 搜索引擎技术研究现状与存在问题

3.4.3 Web挖掘与搜索引擎的关系

3.4.4 Web挖掘应用于搜索引擎技术

3.5 本章小结

第4章 系统的剖析

4.1 系统特性

4.2 系统的硬件拓扑

4.3 系统的软件模块

4.4 系统的工作原理

4.5 系统的开发环境及配置

4.6 本章小结

第5章 系统的设计与实现

5.1 网络机器人的设计

5.1.1 搜索模型和算法设计

5.1.2 并行的搜集方案

5.1.3 镜像网页的消除

5.2 网页的分析

5.2.1 中文的编码处理

5.2.2 特征值提取

5.2.3 生成网页的描述信息

5.3 索引的生成

5.3.1 索引的结构

5.3.2 网页索引的生成

5.3.3 超链分析

5.4 检索

5.4.1 找到相关的网页

5.4.2 对结果进行排序

5.4.3 建立 Cache

5.5 用户界面

5.5.1 用户的界面技术

5.5.2 提供个性化服务

5.6 系统测试和性能分析

第6章 总结与展望

6.1 全文总结

6.2 本论文的主要成果

6.3 研究展望

附录

参考文献

致谢

发布时间: 2006-03-27

参考文献

  • [1].搜索引擎技术中的Web结构挖掘算法研究[D]. 陈鑫卿.山西大学2003
  • [2].基于支持向量机的Web文本挖掘研究[D]. 徐华.哈尔滨工程大学2004
  • [3].Web表格数据提取与分析系统的设计与实现[D]. 曹贞兴.哈尔滨工业大学2016
  • [4].一种适用于领域专家的WEB数据提取的方法[D]. 李政博.吉林大学2009
  • [5].Web数据挖掘及其在电子商务中的应用[D]. 任明枢.山东科技大学2004
  • [6].Web技术在托卡马克实验数据可视化中的应用[D]. 万宽红.华中科技大学2017
  • [7].Web应用中基于树的克隆代码检测方法的研究[D]. 李超群.湖南大学2014
  • [8].Web应用漏洞的检测方法研究与实现[D]. 许苗华.中南林业科技大学2018
  • [9].基于Web的电网巡视管理系统的设计与实现[D]. 易文丽.湖南大学2016
  • [10].GPU加速的Web应用漏洞检测技术研究与实现[D]. 李绍滔.湖南大学2016

相关论文

  • [1].Web挖掘及其在网络搜索引擎中的应用研究[D]. 杨春伟.中国石油大学2007
  • [2].分布式Web挖掘与搜索的研究与实现[D]. 姚勇.西安电子科技大学2006
  • [3].搜索引擎排序算法的研究[D]. 陈洁惠.河海大学2007
  • [4].搜索引擎技术的研究与实现[D]. 丁宬杰.上海交通大学2007
  • [5].Web搜索引擎原理与实现[D]. 应亦丰.浙江大学2007
  • [6].Web挖掘在教学资源搜索引擎中的应用研究[D]. 李凯.东北师范大学2007
  • [7].Web数据挖掘和个性化搜索引擎研究[D]. 刘妮娜.浙江大学2005
  • [8].基于PageRank算法的搜索引擎优化策略研究[D]. 张巍.四川大学2005
  • [9].Web挖掘中超文本分类的研究与实现[D]. 王飞.西北工业大学2006
  • [10].智能中文搜索引擎若干关键技术的研究与实现[D]. 潘照明.浙江大学2006

标签:;  ;  ;  

基于Web挖掘的搜索引擎技术研究
下载Doc文档

猜你喜欢