• 新闻信息采集系统的设计与实现

    新闻信息采集系统的设计与实现

    论文摘要网络新闻信息的自动采集对于新闻网页的自动分类、自动摘要、敏感信息监测以及Web挖掘等应用十分重要。本文以半结构化的新闻网页为对象,研究如何从纷繁复杂的网络空间中采集各种...
  • 图像搜索引擎

    图像搜索引擎

    论文摘要随着互联网的高速发展,网络上的多媒体信息也在急剧的增加,因此人们对多媒体信息的下载、分类和检索的需求也就随之而来。传统的搜索引擎不适合于自动下载多媒体信息并分类保存,所...
  • 基于语义Web的智能搜索的研究

    基于语义Web的智能搜索的研究

    论文摘要随着计算机技术的发展,互联网不断普及并已成为日常生活中获取知识和资源的重要途径,越来越多的人通过搜索引擎在互联网中寻找信息,但是由于传统的搜索引擎对信息资源缺少统一的语...
  • 个性化搜索引擎模型的研究与改进

    个性化搜索引擎模型的研究与改进

    论文摘要通过使用搜索引擎,人们可以方便快捷的从大量信息中查找出自己需要的内容。比起曾经功能单一的搜索引擎,现在的搜索引擎已经有了很大的发展。但是,现有的搜索引擎技术仍然存在有不...
  • 搜索引擎分析 ——基于PageRank算法的研究与改进

    搜索引擎分析 ——基于PageRank算法的研究与改进

    论文摘要伴随互联网爆炸性的发展,网上信息浩如烟海,普通网络用户想找到所需的资料难于大海捞针,所以迫切需要一种优异的搜索服务,将网上繁杂的内容整理成为可方便获取的信息。搜索引擎技...
  • Web搜索引擎的搜索结果聚类研究

    Web搜索引擎的搜索结果聚类研究

    论文摘要随着计算机技术和网络技术的不断发展,Internet成为当今世界上最大的信息库。面对浩如烟海的信息,用户试图通过浏览Web来发现信息、检索信息已经越来越困难。搜索引擎是...
  • 基于本体的医疗搜索引擎的设计和实现

    基于本体的医疗搜索引擎的设计和实现

    论文摘要随着互联网的普及和上网医疗信息的不断丰富,越来越多的普通用户和医护人员倾向于使用互联网查询、获取各种医疗信息。目前,用户主要通过通用搜索引擎和医学专业搜索引擎获取互联网...
  • 搜索引擎中的相似网页探测算法研究

    搜索引擎中的相似网页探测算法研究

    论文摘要相似网页(Near-DuplicateWebPages)在互联网中的大量存在,给搜索引擎带来了多方面的问题,如爬行程序反复的搜录同样内容的网页给搜索引擎的爬行程序自身及...
  • 基于Rough本体的手机领域语义搜索引擎的研究与实现

    基于Rough本体的手机领域语义搜索引擎的研究与实现

    论文摘要随着Web技术的广泛应用,手机信息化的程度越来越高,基于关键字匹配的手机搜索引擎无法反映Web信息在现实世界中的语义,由此不可避免地导致查准率和查全率低的缺陷;另一方面...
  • 基于特征短语的网页在线聚类方法

    基于特征短语的网页在线聚类方法

    论文摘要随着互联网技术的飞速发展,网络为我们提供了多元化的海量信息,越来越多的人开始使用搜索引擎来获取所需要的信息。然而,虽然搜索引擎发展迅速,但其效果远未达到令人满意的程度,...
  • WEB主题信息搜集技术研究

    WEB主题信息搜集技术研究

    论文摘要万维网(Web)可以视为一本汇聚了人类文明的百科全书,搜索引擎无疑是从这个百科全书中获取知识和信息最重要的工具。然而,传统搜索引擎和Web信息搜集技术在高度发展的同时,...
  • 基于本体的可伸缩的社会网络抽取算法的研究

    基于本体的可伸缩的社会网络抽取算法的研究

    论文摘要在对专业领域社会网络的抽取过程中涉及很多大数据集,将社会网络的抽取应用到一个大的组织(用户群)的时候,提交到搜索引擎中的关键字的数目成为了一个关键性的问题。由于需要将所...
  • 基于Lucene的主题搜索引擎研究

    基于Lucene的主题搜索引擎研究

    论文摘要搜索引擎(SearchEngine)以一定的搜索策略在互联网中搜集信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。而主题搜索引擎只...
  • 垂直搜索引擎技术的研究及实现

    垂直搜索引擎技术的研究及实现

    论文摘要在信息社会中,如何在浩如烟海的信息中找到我们所需要的、有用的信息成为一个十分重要的问题,Web搜索引擎也因此应运而生,影响我们的生活。目前许多搜索引擎都使用基于关键字查...
  • 基于关系子群发现算法的聚焦爬行技术

    基于关系子群发现算法的聚焦爬行技术

    论文摘要“聚焦爬虫(FocusedCrawling)”在万维网上爬行的时候,尽可能地下载与某(些)主题相关的网页,同时尽可能避免无关网页的下载。聚焦爬行的一个基本技术难点在于爬...
  • 基于搜索日志的用户行为研究及应用

    基于搜索日志的用户行为研究及应用

    论文摘要搜索引擎的出现,成为互联网发展史上又一个重要的里程碑。越来越多的互联网用户开始选择搜索引擎作为其获得网络资源的首选工具。但是搜索引擎的表现并不总是尽如人意,很多时候当用...
  • 主题网络爬虫的研究与设计

    主题网络爬虫的研究与设计

    论文摘要随着网络资源的急剧增长,在庞大的网络上,快、准、全地找到相关信息,变得越来越困难。此时,搜索引擎应运而生。搜索引擎是人们从网上查找信息最方便快捷的方式,也因此超过E-m...
  • 基于Map/Reduce的分布式智能搜索引擎框架研究

    基于Map/Reduce的分布式智能搜索引擎框架研究

    论文摘要随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎...
  • 基于元搜索的商务模型应用实践

    基于元搜索的商务模型应用实践

    论文摘要当今Internet技术正将世界各地的丰富信息资源带到我们每一个人面前。随着网络信息的爆炸式增长,人们越来越关心怎样高效、准确地检索出自己想要的信息资源。传统搜索引擎的...
  • 面向异步通讯机制的网页搜索技术研究

    面向异步通讯机制的网页搜索技术研究

    论文摘要随着互联网的飞速发展,信息化正在深刻的改变着世界的面貌和人们的生活方式。与此同时,互联网信息爆炸性的增长,使得人们如何快速准确地获取信息的问题日益突出。20世纪90年代...