站内搜索论文-李子健

站内搜索论文-李子健

导读:本文包含了站内搜索论文开题报告文献综述及选题提纲参考文献,主要关键词:C#,搜索引擎,Lucene.net

站内搜索论文文献综述

李子健[1](2018)在《基于Lucene.net的站内搜索引擎设计与实现》一文中研究指出目前互联网快速发展,各类网络应用快速增加,网络信息呈爆炸性增长。为提高生产效率和生活便利,使信息传播更加快捷,需要一款信息检索工具快速定位用户感兴趣的信息。诚然,当前网络上已经有很多门户网站和像百度、必应等的搜索引擎帮助人们检索信息,但这并不能完全满足用户的日常需求。特别是对于某些局域网、校园网、大型企业园区。这些组织涉及部门多、信息量大、信息私密性高,并且信息的发布往往缺乏一个统一管理,所以他们更需要一个好的信息搜索切入口,当站内信息随着时间积累增多,员工、学生或外来访问者便需要在网站中逐页寻找相关信息或者文件,造成极大不变。因此在本次论文中,本人针对这个具体问题进行了阐述,并提出解决方案。本文主要是研究并设计开发一个针对单位内部的站内搜索引擎,主要针对处于封闭或半封闭的网站群。从零开始介绍搜索引擎的基本架构及其中的关键技术,如爬虫的原理与实现,如何构建索引目录,分词技术的主要方法、搜索排序模型的构建等,接着使用C#语言,并结合关系数据库技术、搜索引擎框架Lucene.net、前端页面技术构建一个完整的站内搜索引擎。开发的内容主要包含两大模块,一个是数据采集模块,主要包含网络爬虫、信息清洗、数据入库、索引构建等功能。另一个是搜索模块,利用数据采集模块建立的索引实现搜索功能,并加入搜索缓存以及敏感词过滤等功能。整个开发流程将按照软件工程开发的要求进行,首先进行需求分析,按照UML标准,使用大量图表的形式介绍模块功能,然后逐步编码实现整个系统,并在文章最后对系统进行测试。(本文来源于《华南理工大学》期刊2018-04-20)

王子木[2](2018)在《基于语义网的站内搜索引擎模块的研究与实现》一文中研究指出互联网时代,信息呈现出爆炸式的扩散和增长,每天我们都在生产和接收海量的各类信息,对于用户而言,想要精准、快速和便捷的获取想要的信息,变得愈发的困难;而对于互联网服务公司而言,如何创新技术应用、提升客户服务水平,成为提升用户满意度、增强用户粘性的重要措施。因此,智能化、情景化、社会化的语义搜索技术,成为众多互联网公司和学者的研究目标。面向语义网的搜索引擎将充分的利用语义网丰富的语义信息作为出发点,通过分析语义文档中的语义标注和本体的知识表示使得用户针对某一个专题进行精确的搜索成为可能,面向语义网的搜索引擎的关键技术研究对推动互联网技术的进一步发展以及语义网的普及具有重要意义。国网商城系国家电网公司统筹安排建设的互联网电子商务平台,平台以网上缴费、在线服务、电商化采购为着力点,打造集公共事业缴费、产业协同发展、商品销售、电动汽车一站式服务、分布式电源、清洁能源替代、金融创新等线上线下服务为一体的电子商务与金融交易平台。客户业务应用众多,搜索引擎无疑需要发挥出重要的支撑作用,为用户提供直接到达目标信息的通道。从系统上线情况来看,搜索也确实一直是用户使用频率最高、关联应用数据最广、使用反馈最多的系统功能。但在搜索过程体验、系统响应速度、搜索结果的精准性等方面,有待改进完善。本文对语义网及其相关的前沿技术进行深入研究,针对自然语言分析处理技术、机器学习技术、语义分词技术等技术进行剖析,集中了上述的观点,提出一种新的信息搜索模式的工作方式——基于语义网的智能搜索引擎模块。结合理论模型,立足国网商城项目,本文从解决实际问题角度出发,分析当前国网商城搜索引擎存在的弊端,对商城搜索引擎改造进行了详细设计,将搜索引擎封装为独立的模块,对外提供WebService接口,搜索功能通过调用服务实现数据和信息的搜索。通过改造,商城搜索功能基本实现前端体验合理化、系统功能智能化、数据应用简单化的总体目标。对于用户,站内搜索的优化可以改善用户搜索的准确率,快速找到用户想要的商品,避免过多操作,提升体验;对于运营,站内搜索系统化的价值巨大,可以了解用户的意图,优化网站的结构,改善站点的用户体验。(本文来源于《华北电力大学》期刊2018-03-01)

吴修庆[3](2018)在《基于更新信息的网页机器理解及其在站内搜索引擎中应用》一文中研究指出在介绍搜索引擎的概念、架构的基础上,总结了搜索引擎的研究内容和现状,其中最核心的技术是网页分析技术。在分析站内搜索引擎在网页分析方面的特点基础上提出了利用网页更新信息来分析网页的思想。最后给出利用该思想分析网页的结果,表明该方法获取的网页更新信息对网页分析确实有帮助作用。(本文来源于《工业控制计算机》期刊2018年02期)

叶文全[4](2017)在《微课管理系统站内搜索增强研究与实现》一文中研究指出本文结合分词搜索、相关度排序、自定义分页,并使用存储过程实现搜索。在搜索的准确性、相关度、性能、安全等方面都有较大的改良,较好的解决了微课管理系统的站内搜索难题。(本文来源于《数字技术与应用》期刊2017年10期)

张梦南[5](2016)在《面向SaaS的站内搜索模型的设计与实现》一文中研究指出站内搜索引擎作为网站平台内部的搜索引擎,通过分析用户输入并检索返回相关站内数据,为平台的用户提供了快速、便捷的数据访问入口。而基于SaaS的网站往往具有多租户、功能多样性、数据多样性和不同的用户权限等级等特征。通过设计和实现面向SaaS的站内搜索模型,不仅可以缩短SaaS服务提供商的开发周期,还能根据需要自主定制索引规则,具备灵活性和可拓展性。作者所在实验室也在开发和维护基于SaaS的CRM系统。因此作者从实际需求角度出发,研究并分析了当前站内搜索引擎的发展现状和SaaS模式的特点,规划了本课题的研究内容。在本课题中,作者对传统站内搜索引擎实现方案进行了比较详细的归纳总结和技术调研,提出了改进的方向。通过分析目前已有的站内搜索引擎的具体实现,从架构层次抽象地给出了一个完整站内搜索引擎应具有的模块以及模块之间的关系。在该模型中,设计了一种索引结构将SaaS平台的结构化和非结构化数据进行了统一。设计并实现了可配置相关索引规则的接口,可供配置的检索结果接口。除此之外,也将模型中其它接口进行了具体实现并将面向SaaS的站内搜索模型应用到了现有实验室平台中,通过实际应用,验证了架构和技术方面的可行性。在创新性方面,作者分析了以往的分布式索引方法,并在分布式B+树方法的基础上进行改进,提出了一种索引线性分块和B+树相结合的方法。并且在仿真实验中,验证了该方法在检索效率和插入效率方面的性能优势。(本文来源于《北京邮电大学》期刊2016-12-21)

陆校松[6](2016)在《基于数据库检索的站内搜索功能模块设计与实现》一文中研究指出在信息爆炸式增长的互联网时代,企事业单位网站的信息内容越来越多,需要设计并实现一个站内搜索功能模块,以满足浏览者对网站信息的查询搜索,探讨了基于数据库的检索方式,针对南通航院职业技术学院人文艺术系网站,设计并实现了一个站内搜索功能模块,对中小型企事业单位网站站内搜索功能模块的制作起到了一定的借鉴作用。(本文来源于《电脑编程技巧与维护》期刊2016年20期)

郭肇毅[7](2016)在《基于Lucene的站内搜索引擎开发研究》一文中研究指出经典搜索引擎目前的性能已十分良好,但在对于某些特定网站内部信息的检索方面,若采取直接嵌入经典搜索引擎的方式,往往效果不佳。本文基于Lucene这一全文检索工具包,在对词条进行分析方面,将Lu.cene自带分析器与盘古分词工具相结合,开发了一款针对一个经典论坛的站内搜索引擎,经检测性能良好。(本文来源于《河南科技》期刊2016年03期)

孙芳媛[8](2016)在《基于倒排索引和字典树的站内搜索引擎的设计与实现》一文中研究指出随着互联网的不断发展,快节奏的生活,人们对更好的用户体验的追求,搜索的长时间等待变得让人无法忍受。如何获得更快的搜索、更好的搜索结果、更符合用户心理的推荐成为很多网站、手机应用的痛点。本项目意在通过建立倒排索引加快搜索,使用字典树结构快速找到联想词,二者相结合的方式提供良好的搜索体验。完成一个独立的站内搜索引擎,使得项目可以快速的移植到不同的系统中,提高开发速度,降低开发成本。本项目主要完成一个轻量级站内搜索引擎。系统主要分为两大部分:第一部分为全文索引引擎,主要负责从数据源建立倒排索引、以有效的格式保存索引、增量更新索引、索引的压缩、搜索排序等功能;第二部分主要为拼音搜索引擎,主要完成关键字检索、模糊查询、拼音联想等功能;此外完成系统对外的相关接口。主要的工作内容是:独立完成对整个站内搜索引擎需求分析、系统设计、系统实现以及测试等工作;完成了系统的8大核心功能模块,2个辅助模块以及所有对外的接口。具体包括(1)文档数据源获取,(2)倒排索引的建立与压缩,(3)倒排索引更新,(4)倒排索引的查找,(5)搜索排序,(6)拼音转化功能的实现,(7)拼音搜索Trie建立,(8)拼音联想词的查找,以及辅助功能如高亮显示、相关推荐等功能。系统进行设计时,极为关注其本身的可拓展性、可移植性和实用性。系统实现过程中使用基于磁盘排序的归并算法,可以针对内存无法装下的数据进行排序,增强系统可用性;同时使用cidx Hit算法进行压缩,使得倒排索引在不影响效率的情况下占用内存小;相关性的计算使用BM25算法,此外给出不同域权重排序方式,增强系统的灵活性;由于拼音生成联系词生成需要快速反馈给用户,所以选择了字典树作为拼音联想的核心数据结构,做到及时有效的对用户输入进行反馈,增强系统的用户体验性。最终内部搜索响应时间一般为0.02s,拼音联想响应时间约为2ms,有力保障了本系统的可用性和实用性。目前本文对应的系统应用项目成果展示为百度APIStore的官网站内搜索(http://apistore.baidu.com/)。(本文来源于《哈尔滨工业大学》期刊2016-06-01)

江文龙,赵逢禹,陈章[9](2016)在《加权映射匹配方法的站内搜索引擎设计》一文中研究指出通用搜索引擎与网站提供的站内搜索机制都无法实现基于内容的企业网站信息查找。在分析企业网站信息的类型后,针对该问题提出一个通用站内搜索引擎架构。给出该引擎的设计思想,介绍对象映射匹配方法、加权对象相似度计算算法、索引构建等实现技术。实现基于网页内容、Word与pdf附件内容的查找定位。实验结果显示,该方法具有很高的查准率和查全率。该引擎可为企业网站的内容搜索与个性化服务提供支持。(本文来源于《计算机应用与软件》期刊2016年04期)

武红宽[10](2016)在《基于sphinx服务实现酷友社区站内搜索》一文中研究指出随着用户的增多,酷友社区站内的帖子数据量不断增大。而现有的基于数据库的搜索对服务器的负载越来越大,严重时,能导致整个服务器跌机。重新构建酷友社区站内全文搜索的需求越发紧迫,本文研究的是基于sphinx服务实现酷友社区站内搜索,这样一来,用户也可以通过站内搜索引擎,更加快捷、准确地找到自己需要的内容。(本文来源于《中国新通信》期刊2016年06期)

站内搜索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

互联网时代,信息呈现出爆炸式的扩散和增长,每天我们都在生产和接收海量的各类信息,对于用户而言,想要精准、快速和便捷的获取想要的信息,变得愈发的困难;而对于互联网服务公司而言,如何创新技术应用、提升客户服务水平,成为提升用户满意度、增强用户粘性的重要措施。因此,智能化、情景化、社会化的语义搜索技术,成为众多互联网公司和学者的研究目标。面向语义网的搜索引擎将充分的利用语义网丰富的语义信息作为出发点,通过分析语义文档中的语义标注和本体的知识表示使得用户针对某一个专题进行精确的搜索成为可能,面向语义网的搜索引擎的关键技术研究对推动互联网技术的进一步发展以及语义网的普及具有重要意义。国网商城系国家电网公司统筹安排建设的互联网电子商务平台,平台以网上缴费、在线服务、电商化采购为着力点,打造集公共事业缴费、产业协同发展、商品销售、电动汽车一站式服务、分布式电源、清洁能源替代、金融创新等线上线下服务为一体的电子商务与金融交易平台。客户业务应用众多,搜索引擎无疑需要发挥出重要的支撑作用,为用户提供直接到达目标信息的通道。从系统上线情况来看,搜索也确实一直是用户使用频率最高、关联应用数据最广、使用反馈最多的系统功能。但在搜索过程体验、系统响应速度、搜索结果的精准性等方面,有待改进完善。本文对语义网及其相关的前沿技术进行深入研究,针对自然语言分析处理技术、机器学习技术、语义分词技术等技术进行剖析,集中了上述的观点,提出一种新的信息搜索模式的工作方式——基于语义网的智能搜索引擎模块。结合理论模型,立足国网商城项目,本文从解决实际问题角度出发,分析当前国网商城搜索引擎存在的弊端,对商城搜索引擎改造进行了详细设计,将搜索引擎封装为独立的模块,对外提供WebService接口,搜索功能通过调用服务实现数据和信息的搜索。通过改造,商城搜索功能基本实现前端体验合理化、系统功能智能化、数据应用简单化的总体目标。对于用户,站内搜索的优化可以改善用户搜索的准确率,快速找到用户想要的商品,避免过多操作,提升体验;对于运营,站内搜索系统化的价值巨大,可以了解用户的意图,优化网站的结构,改善站点的用户体验。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

站内搜索论文参考文献

[1].李子健.基于Lucene.net的站内搜索引擎设计与实现[D].华南理工大学.2018

[2].王子木.基于语义网的站内搜索引擎模块的研究与实现[D].华北电力大学.2018

[3].吴修庆.基于更新信息的网页机器理解及其在站内搜索引擎中应用[J].工业控制计算机.2018

[4].叶文全.微课管理系统站内搜索增强研究与实现[J].数字技术与应用.2017

[5].张梦南.面向SaaS的站内搜索模型的设计与实现[D].北京邮电大学.2016

[6].陆校松.基于数据库检索的站内搜索功能模块设计与实现[J].电脑编程技巧与维护.2016

[7].郭肇毅.基于Lucene的站内搜索引擎开发研究[J].河南科技.2016

[8].孙芳媛.基于倒排索引和字典树的站内搜索引擎的设计与实现[D].哈尔滨工业大学.2016

[9].江文龙,赵逢禹,陈章.加权映射匹配方法的站内搜索引擎设计[J].计算机应用与软件.2016

[10].武红宽.基于sphinx服务实现酷友社区站内搜索[J].中国新通信.2016

标签:;  ;  ;  

站内搜索论文-李子健
下载Doc文档

猜你喜欢