基于Web搜索引擎系统的设计与实现

基于Web搜索引擎系统的设计与实现

论文摘要

为了适应网络信息的飞速增长,并且能够迅速、方便地从网络中获取有效信息,搜索引擎逐渐走进了人们的生活,“竹竹”搜索引擎系统在这样的条件下,应运而生。本文首先系统的介绍了搜索引擎的概念、发展历史、和搜索引擎的分类。然后,对“竹竹”搜索引擎系统进行需求分析,对系统进行总体设计,并对系统的各个功能模块进行详细的设计和实现,最后“竹竹”搜索引擎系统进行了测试。“竹竹”搜索引擎是基于Web的,面向笔记本电脑品牌的搜索引擎。系统的前端以MVC模式来实现,Spring做中间层,JDBC作后端来开发实现的。本系统分为三个子模块,抓取模块实现的功能为:将web上的海量网页抓取到系统中;该模块使用Heritrix来完成对网页的抓取。处理模块实现的功能为:解析网页,提取其中的有用内容,为网页建立词库,由于笔记本电脑的品牌名在现有词库中不存在,因此要建立其特有的词库文件,对解析网页生成的信息文件进行分词,并建立索引,将索引存入数据库中;该模块通过Lucene的API来实现对网页内容的建索,使用HTMLParser的API实现了对网页内容的解析。用户模块实现的主要功能是:用户模块是系统的用户接口;用户通过此模块完成与系统的交互,当用户在查询界面上输入要检索的品牌信息后,系统将在可以接受的时间内,返回用户所需的结果集;该模块通过DWR封装了AJAX技术,处理用户请求;通过Lucene的API来实现检索。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 选题背景
  • 1.1.1 搜索引擎的发展历史
  • 1.2 研究现状
  • 1.2.1 搜索引擎的概念
  • 1.2.2 搜索引擎的分类
  • 1.3 本论文的研究内容
  • 1.4 相关技术介绍
  • 1.4.1 Heritrix
  • 1.4.2 Lucene
  • 1.5 论文章节结构
  • 第二章 系统需求分析
  • 2.1 系统功能需求
  • 2.2 系统性能需求
  • 2.2.1 抓取模块
  • 2.2.2 处理模块
  • 2.2.3 用户模块
  • 第三章 系统总体设计
  • 3.1 搜索引擎的工作原理
  • 3.2 "竹竹"搜索引擎的总体架构设计
  • 第四章 系统详细设计与实现
  • 4.1 系统实现的总体逻辑
  • 4.2 抓取模块
  • 4.2.1 Heritrix子模块工作流程
  • 4.2.2 运行Heritrix子模块
  • 4.2.3 分析网页子模块
  • 4.3 处理模块
  • 4.3.1 解析网页子模块
  • 4.3.2 创建词库子模块
  • 4.3.3 生成持久化类子模块
  • 4.3.4 创建Document子模块
  • 4.3.5 存储数据子模块
  • 4.4 用户模块
  • 4.4.1 搜索页面
  • 4.4.2 详细信息页面
  • 第五章 系统测试
  • 5.1 系统测试的分类
  • 5.1.1 线下功能测试
  • 5.1.2 线下性能测试
  • 5.1.3 线上的功能测试
  • 5.1.4 线上的性能测试
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].搜索引擎系统中的蚁群算法分析[J]. 西安文理学院学报(自然科学版) 2016(04)
    • [2].基于语义主题搜索引擎系统研究[J]. 萍乡高等专科学校学报 2014(03)
    • [3].迷你搜索引擎系统的设计[J]. 信息与电脑(理论版) 2010(22)
    • [4].搜索引擎系统中热点问题的探讨[J]. 成都电子机械高等专科学校学报 2009(04)
    • [5].超级节点方式的搜索引擎系统的设计与实现[J]. 计算机与数字工程 2008(08)
    • [6].分布式搜索引擎系统效能建模与评价[J]. 软件学报 2012(02)
    • [7].蚁群算法在搜索引擎系统中的应用研究[J]. 计算机技术与发展 2009(12)
    • [8].几种典型网格搜索引擎系统的结构体系分析[J]. 图书情报工作 2008(05)
    • [9].基于用户兴趣的个性化搜索引擎系统[J]. 攀枝花学院学报 2009(03)
    • [10].“搜梅州”搜索引擎系统的设计与实现[J]. 嘉应学院学报 2011(02)
    • [11].一种基于云平台的局域网搜索引擎设计与实现[J]. 信息系统工程 2015(10)
    • [12].基于Lucene的小型搜索引擎系统的架构与实现[J]. 电脑编程技巧与维护 2010(11)
    • [13].核心业务性能优化模式在搜索引擎系统中的研究与应用[J]. 信息与电脑(理论版) 2014(04)
    • [14].基于Deep Web的图书搜索引擎系统设计[J]. 计算机与数字工程 2009(09)
    • [15].基于改进用户浏览行为个性化搜索引擎系统研究[J]. 软件导刊 2013(10)
    • [16].基于Memcached的日历搜索引擎系统优化设计与实现[J]. 计算机应用 2011(03)
    • [17].元搜索引擎系统的研究[J]. 科技创新导报 2009(35)
    • [18].基于网络爬虫的搜狐网新闻搜索引擎系统的实现[J]. 数字通信世界 2017(07)
    • [19].基于SQL Server的FTP搜索引擎系统的设计[J]. 软件导刊 2008(06)
    • [20].基于语义Web服务的分布式服装搜索引擎系统设计[J]. 计算机应用 2009(06)
    • [21].实现一个垂直育儿搜索引擎系统的探索[J]. 网友世界 2012(19)
    • [22].搜索引擎系统中网页抓取模块研究[J]. 现代计算机(专业版) 2010(03)
    • [23].丽水市网络图书馆建设的实践与思考[J]. 图书馆研究与工作 2011(03)
    • [24].基于本体的纺织服装主题搜索引擎系统研究[J]. 丝绸 2014(11)
    • [25].基于校园网的信息资源搜索引擎系统的设计[J]. 贵州工业大学学报(自然科学版) 2008(05)
    • [26].面向产业集群的协同商务系统构建研究[J]. 中国信息界 2010(05)
    • [27].基于Swing和Lucene的桌面搜索引擎系统设计与实现[J]. 电脑编程技巧与维护 2012(01)
    • [28].基于Zookeeper分布式搜索引擎系统的配置文件自动更新方法、装置及系统[J]. 广东通信技术 2015(05)
    • [29].基于本体的企业搜索引擎研究[J]. 工业控制计算机 2012(02)
    • [30].Geeking:基于胜者表的体育新闻搜索引擎系统[J]. 集成技术 2016(02)

    标签:;  

    基于Web搜索引擎系统的设计与实现
    下载Doc文档

    猜你喜欢