广告搜索中的查询处理算法

广告搜索中的查询处理算法

论文摘要

文本广告搜索为搜索引擎的全网搜索提供相关的、有针对性的文本广告。要匹配查询最相关的广告,广告搜索引擎应用了很多查询处理的技术,其中包括布尔检索和对稀有广告查询短语进行扩展。现有最好的广告查询短语扩展算法都是依赖于搜索引擎的检索结果,这样导致依赖性太强,不能形成一个独立的广告搜索系统。在寻找可靠的外部资源时,我们选择了维基百科。通过使用网页查询短语在已有的维基系统上进行检索top-检索,我们可以得到能够重新表达这个查询短语的信息。通过这些信息,我们可以重新构建广告查询短语,然后使用这个新的广告查询短语到现有的广告库中进行搜索。随后,我们也设计了一系列的实验来证明我们的方法是非常有效。因为弱与关系能够控制检索的结果数量,所以在广告搜索的查询中我们使用弱与关系来解决经典关系带来的问题。但是因为现有的弱与关系处理速度不够快,我们将提出一个全新高效的弱与关系处理框架。这个框架有效的利用了弱与关系的两个属性特点:分词后的词权重和弱与关系特有的一个阈值参数。我们首先关注查询中的一种非常特别的词。在分词后,查询短语中有一部分词权重可能非常高,以至于这一部分词必须出现在结果文集中。这种词我们称之为“强制词”。如果有这种类型的词,我们就可以很容易的构造一种非常快速的基于强制词弱与关系高效算法。然而,并不是所有的查询短语都含有强制词,因此我们又构建一种基于败者树的算法。通过和最原始的弱与关系算法相结合,这三种算法构建了我们的弱与关系处理框架。实验证明我们的方法比之前的方法更加有效,并且也非常健壮。

论文目录

  • 摘要
  • ABSTRACT
  • 插图索引
  • 表格索引
  • 算法索引
  • 第一章 引言
  • 1.1 广告搜索
  • 1.2 查询处理
  • 1.3 查询处理中的查询扩展
  • 1.4 查询处理中的布尔检索
  • 1.5 算法适应性
  • 1.6 本章小结
  • 第二章 国内外研究现状
  • 2.1 布尔检索
  • 2.2 查询扩展
  • 2.3 本章小结
  • 第三章 查询扩展和弱与关系的处理方法总览
  • 3.1 稀有查询短语的扩展
  • 3.1.1 问题定义
  • 3.1.2 框架总览
  • 3.2 弱与关系的处理方法
  • 3.2.1 弱与关系定义
  • 3.2.2 弱与关系处理框架总览
  • 3.3 本章小结
  • 第四章 广告搜索中的查询扩展算法研究
  • 4.1 维基文章的检索
  • 4.2 广告查询短语的生成
  • 4.3 广告匹配
  • 4.4 举例分析基于维基文章的算法
  • 4.5 本章小结
  • 第五章 弱与关系的算法研究
  • 5.1 基于插值搜索的弱与关系方法
  • 5.1.1 插值搜索
  • 5.1.2 在弱与关系方法中使用插值搜索
  • 5.1.3 复杂度分析
  • 5.2 基于排序的弱与关系方法
  • 5.2.1 原始的弱与关系方法
  • 5.2.2 复杂度分析
  • 5.3 基于败者树的弱与关系方法
  • 5.3.1 败者树
  • 5.3.2 在弱与关系处理中使用败者树
  • 5.3.3 复杂度分析
  • 5.4 三种方法的综合分析
  • 5.5 本章小结
  • 第六章 实验
  • 6.1 实验数据
  • 6.2 评估方法
  • 6.3 查询扩展的实验结果
  • 6.4 弱与关系各方法的实验结果及结果分析
  • 6.4.1 每秒查询数和θ的关系
  • 6.4.2 每秒查询数和索引大小的关系
  • 6.4.3 关于α的建议
  • 6.5 本章小结
  • 第七章 总结与展望
  • 7.1 总结
  • 7.2 展望
  • 附录A 专业词对应表
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].关键短语生成研究现状[J]. 现代计算机 2020(07)
    • [2].基于协同训练的电商领域短语挖掘[J]. 计算机工程 2020(04)
    • [3].基于短语成分表示的中文关系抽取[J]. 数据采集与处理 2020(03)
    • [4].基于风险短语挖掘的知识聚合模型研究[J]. 情报理论与实践 2020(08)
    • [5].基于语言和文化视角下的“吃字短语”研究[J]. 山西能源学院学报 2019(01)
    • [6].三项以上联合短语的特征分析[J]. 兰州文理学院学报(社会科学版) 2017(01)
    • [7].基于多策略过滤的汉日多词短语抽取和对齐[J]. 山东大学学报(理学版) 2015(09)
    • [8].短语知识在文言阅读考查中的应用[J]. 新作文(语文教学研究) 2019(05)
    • [9].高中英语教学中的短语积累及扩展探析[J]. 读写算 2019(04)
    • [10].论比况短语[J]. 语文学刊 2010(15)
    • [11].我会用“的”字短语[J]. 快乐作文 2017(45)
    • [12].短语连一连(英文)[J]. 阅读 2018(Z5)
    • [13].好记实用的押韵短语[J]. 初中生 2018(Z6)
    • [14].中考英语高频短语“连连看”[J]. 初中生天地 2017(33)
    • [15].短语连一连[J]. 疯狂英语(小学版) 2016(06)
    • [16].别样的短语教学 精彩的语用训练[J]. 小学教学设计 2016(22)
    • [17].短语连一连[J]. 疯狂英语(小学版) 2016(11)
    • [18].短语连一连[J]. 阅读 2016(77)
    • [19].主动出击 巧“默”短语[J]. 小学教学设计 2015(06)
    • [20].四字短语 “语”重心长[J]. 语文天地 2015(14)
    • [21].短语动词考点解读[J]. 初中生之友 2013(29)
    • [22].孔庆蕾短语(组诗)[J]. 海燕 2015(06)
    • [23].有关“mouth”的趣味短语[J]. 青苹果 2012(04)
    • [24].have引导的短语[J]. 小学教学设计 2012(36)
    • [25].美国人最爱用的个性短语[J]. 家教世界 2013(01)
    • [26].怎样扩词成短语[J]. 作文世界 2013(Z2)
    • [27].有这样一种四字短语[J]. 初中生 2013(Z5)
    • [28].编辑短语[J]. 民间传奇故事(A卷) 2009(06)
    • [29].运用口诀 巧辨易混短语[J]. 中考金刊 2009(01)
    • [30].运用口诀巧辨易混短语[J]. 学生之友(初中版)(下) 2010(01)

    标签:;  ;  ;  ;  

    广告搜索中的查询处理算法
    下载Doc文档

    猜你喜欢