网页分块论文
基于网页分块的主题爬虫方法研究
论文摘要随着网络上信息的爆炸式增长,普通搜索引擎的查询结果越来越不能满足用户查询的需要,尤其是那些查询特定信息的不同领域、不同背景的用户,因此适应特定主题和个性化搜索的垂直搜索...基于Nutch的面向特定主题的爬虫研究
论文摘要通用搜索引擎返回的信息很难满足用户对专业领域的信息需求,网络信息的海量性和动态性,也使通用搜索引擎不可能对所有信息进行索引,因此,主题式搜索技术成为搜索引擎领域一个新的...基于网页分块技术的主题爬行
论文摘要面向主题爬行的目的是有效,快速的找到和预定义主题相关的网页。它不是收集和索引所有可以爬行到的网页,而是仅仅分析和主题最相关的网页。这样就可以避免像通用搜索引擎那样爬行所...基于视觉信息的上下文广告关键词提取算法研究
论文摘要互联网已经成为目前最为重要的广告媒介之一,它能够以低成本将商品和服务向全世界的各个角落展示,这种独特能力吸引了众多的网络广告投资,也无形中带动了互联网的发展。在几年前,...