基于Lucene的搜索引擎应用与研究

基于Lucene的搜索引擎应用与研究

论文摘要

随着快速增长的网络信息资源,人们很关切如何从互连网上找出对用户有价值的信息。搜索引擎解决了用户检索网络信息的难题,它是人们获取信息极为有效的工具。随着越来越深入的研究搜索引擎,搜索引擎技术正在不断的向前发展。未来的竞争不仅限于互联网,本机、局域网、企业网内部以及无线网都将被包括在内。而搜索引擎的设计与实现是一项庞大的工程,要运用较多专业技术知识,所以也成为了一大难点。本文首先对搜索引擎的相关知识和工作原理进行了介绍,在实现搜索引擎过程中所使用的索引和搜索技术进行探讨并对搜索引擎的性能指标进行了描述。其次研究Lucene,分析Lucene实现全文索引和检索的过程,并对中文分词及其相关技术进行了叙述。针对Lucene的页面优先算法不足,论文还提出了一种综合利用PageRank算法和Direct Hit算法并考虑到分层结构的页面优先算法,以提高系统搜索性能。基于以上关键技术,论文采用.NET平台的开发环境,提出了一种基于Lucene的搜索引擎解决方案,并完成该模拟系统。最后,在实现模拟系统对其所使用的技术和方法进行总结,为设计出更优化的搜索引擎指出方向和方法,使其能更一进提高搜索引擎的工作性能。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 引言
  • 1.1 研究的目的和意义
  • 1.2 本文研究的内容
  • 1.3 本文的组织结构
  • 第2章 搜索引擎概述
  • 2.1 搜索引擎相关概念
  • 2.2 搜索引擎的分类
  • 2.2.1 机器人的搜索引擎
  • 2.2.2 目录搜索引擎
  • 2.2.3 元搜索引擎
  • 2.3 国内外发展现状
  • 2.4 搜索引擎的发展以及趋势
  • 2.5 搜索引擎所要解决的问题
  • 2.6 论文的创新
  • 第3章 搜索引擎的关键技术分析
  • 3.1 搜索引擎的工作原理
  • 3.1.1 搜索引擎的框架
  • 3.1.2 搜索引擎工作流程
  • 3.2 搜索引擎的相关技术
  • 3.2.1 搜索器的相关技术
  • 3.2.2 索引器的思想
  • 第4章 搜索引擎性能指标和改进的页面优先算法
  • 4.1 评价搜索引擎性能指标
  • 4.2 PageRank 算法和 DirectHit 算法
  • 4.2.1 PageRank 算法
  • 4.2.2 DirectHit 算法
  • 4.3 改进的页面优先算法
  • 第5章 Lucene 的核心技术分析
  • 5.1 搜索引擎 Lucene
  • 5.2 索引的建立与索引分析器
  • 5.3 搜索
  • 5.4 中文分词
  • 5.4.1 发展及趋势
  • 5.4.2 分词系统的评估
  • 第6章 基于 Lucene 搜索引擎模拟系统设计与实现
  • 6.1 系统实现目标
  • 6.2 搜索引擎系统的实现
  • 6.2.1 整体构架与模块划分
  • 6.2.2 网页采集(Spider)模块的实现
  • 6.2.3 网页索引模块的实现
  • 6.2.4 网页搜索模块的实现
  • 6.3 系统的运行效果
  • 6.4 系统的不足之处
  • 第7章 结论与展望
  • 参考文献
  • 致谢
  • 附录
  • 相关论文文献

    • [1].基于Lucene的电网主厂站遥信信号自动对比验收技术研究与应用[J]. 电气传动自动化 2020(02)
    • [2].基于Lucene的生产管理系统一站式检索中心的研究与设计[J]. 现代计算机(专业版) 2016(36)
    • [3].基于Lucene的垂直搜索引擎的设计与实现[J]. 福建电脑 2015(12)
    • [4].一个基于Lucene的维文搜索引擎的设计与实现[J]. 福建电脑 2015(05)
    • [5].基于Lucene的试卷查重系统设计与实现[J]. 信息技术与信息化 2016(05)
    • [6].基于Lucene的垂直搜索引擎研究与实现[J]. 桂林电子科技大学学报 2014(03)
    • [7].基于Lucene语义检索优化数字图书馆信息服务研究[J]. 科技情报开发与经济 2014(15)
    • [8].基于Lucene的合理化建议搜索引擎研究与实现[J]. 网络安全技术与应用 2014(08)
    • [9].Lucene框架下构建高校校园网搜索引擎[J]. 电脑知识与技术 2013(11)
    • [10].实现Lucene接口的中文分词器的比较研究[J]. 科技信息 2012(12)
    • [11].基于Lucene全文检索在网络舆情的研究[J]. 信息安全与通信保密 2012(09)
    • [12].基于Lucene的高校图书垂直搜索引擎的研究与实现[J]. 太原师范学院学报(自然科学版) 2011(04)
    • [13].基于Lucene的全文检索构件的研究与实现[J]. 计算机应用与软件 2010(02)
    • [14].基于LUCENE的站内搜索的研究与实现[J]. 河北软件职业技术学院学报 2009(01)
    • [15].基于LUCENE的藏文全文检索的研究[J]. 西藏大学学报(自然科学版) 2009(01)
    • [16].基于本体和Lucene的语义检索模型设计与实现[J]. 现代电子技术 2009(12)
    • [17].基于Lucene的全文搜索引擎[J]. 现代计算机(专业版) 2009(11)
    • [18].基于Lucene技术的垂直搜索引擎的研究[J]. 软件导刊 2008(03)
    • [19].Lucene架构下布尔查询的执行计划研究[J]. 云南民族大学学报(自然科学版) 2019(06)
    • [20].基于银行关键字的Lucene测试用例检索系统[J]. 信息与电脑(理论版) 2017(08)
    • [21].基于Lucene引擎构建在线地址匹配服务[J]. 测绘与空间地理信息 2016(02)
    • [22].基于Lucene的中文分词系统设计与实现[J]. 自动化与仪器仪表 2016(05)
    • [23].基于Lucene的图像检索实验设计[J]. 实验室研究与探索 2013(10)
    • [24].基于Lucene的全文搜索排序算法的研究与改进[J]. 武汉纺织大学学报 2013(06)
    • [25].基于Lucene的倒排索引性能的研究[J]. 无线互联科技 2014(08)
    • [26].基于Lucene的校园网智能搜索引擎的设计与实现[J]. 现代电子技术 2013(06)
    • [27].基于本体和Lucene的网络教育资源管理检索系统[J]. 计算机应用与软件 2012(07)
    • [28].Lucene排序算法的研究和改进[J]. 中国新技术新产品 2011(04)
    • [29].Lucene的全文检索的研究与应用[J]. 计算机技术与发展 2010(02)
    • [30].构建基于Lucene的网站站内搜索[J]. 信息与电脑(理论版) 2010(04)

    标签:;  ;  

    基于Lucene的搜索引擎应用与研究
    下载Doc文档

    猜你喜欢