个性化搜索中用户语义意图自动识别技术研究

个性化搜索中用户语义意图自动识别技术研究

论文摘要

目前大部分搜索引擎采用关键词匹配技术,即相同的查询关键词将返回相同的查询结果。而实际上,对于同一个查询词,不同的用户其查询意图可能不同,同一个用户在不同时期其查询意图也可能不同。个性化搜索技术正是为解决这一问题应运而生的,旨在为用户不同的信息需求提供个性化的搜索结果。查询词多义性问题的研究是实现个性化搜索的有效途径之一。查询词的多义性降低了搜索结果的准确率。为解决这一问题,本文提出对用户提交的具有多义的查询词进行用户语义意图自动识别的思想。用户的语义意图是指用户想表达的该查询词在当前会话中的真实语义,而基于Web环境的语义消歧是识别用户语义意图的关键技术之一。本文重点研究基于上下文的查询消歧和无上下文查询中的语义消歧问题,并讨论了基于用户语义意图的查询扩展技术。无上下文查询中的语义消歧是本文的一个创新点。针对现有的查询消歧方法不能解决单个多义查询词的消歧问题,本文提出一种新颖的解决方案——基于隐含上下文的查询消歧方法ICBWSD。该方法通过记录相邻的前一次查询和当前查询中用户点击的文档信息来获取查询词的隐含上下文,再应用基于上下文的消歧方法对目标词进行消歧。实验证明了ICBWSD方法的可行性和推断用户查询意图的乐观前景。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 问题提出
  • 1.2 解决方案
  • 1.3 研究的实际意义
  • 1.4 本文的组织结构
  • 第2章 个性化搜索技术研究
  • 2.1 个性化搜索概述
  • 2.2 个性化搜索的现状
  • 2.3 个性化搜索中的用户建模
  • 2.3.1 用户兴趣模型
  • 2.3.2 用户意图模型
  • 2.3.3 用户目标的研究
  • 2.4 用户语义意图与个性化搜索
  • 2.5 本章小结
  • 第3章 基于查询上下文的语义消歧
  • 3.1 基于Web消歧方法的特性
  • 3.2 WordNet简介
  • 3.2.1 WordNet的心理语言学假设
  • 3.2.2 WordNet的内容
  • 3.3 语义相关度
  • 3.3.1 语义相关度的概念
  • 3.3.2 语义相关性度量
  • 3.4 基于查询上下文的语义消歧
  • 3.4.1 基于查询上下文的语义消歧现状
  • 3.4.2 本文采用的消歧算法
  • 3.4.2.1 窗口大小
  • 3.4.2.2 算法描述
  • 3.5 实验及结果分析
  • 3.5.1 SENSEVAL-2数据集
  • 3.5.2 评价标准
  • 3.5.3 窗口大小的选取对消歧算法的影响
  • 3.5.4 语义相关度的选取对消歧算法的影响
  • 3.6 本章小结
  • 第4章 无上下文查询中的语义消歧
  • 4.1 无上下文查询中语义消歧的意义
  • 4.2 基于隐含上下文的查询消歧框架
  • 4.3 获取隐含上下文
  • 4.3.1 会话边界检测
  • 4.3.2 文档特征提取
  • 4.4 基于隐含上下文的查询消歧
  • 4.5 实验及结果分析
  • 4.5.1 评价标准
  • 4.5.2 案例分析
  • 4.5.2.1 样例的WordNet语义
  • 4.5.2.2 消歧结果分析
  • 4.6 本章小结
  • 第5章 基于用户语义意图的查询扩展
  • 5.1 查询扩展的研究现状
  • 5.2 用户语义意图的形式化表征
  • 5.3 基于用户语义意图的查询扩展
  • 5.3.1 选择扩展查询词
  • 5.3.2 计算扩展查询词权重
  • 5.4 用户查询与文档的语义相似度计算
  • 5.5 本章小结
  • 第6章 总结与展望
  • 6.1 本文主要工作总结
  • 6.2 未来工作展望
  • 参考文献
  • 致谢
  • 攻硕期间参加的项目及发表的论文
  • 相关论文文献

    • [1].基于网络表示学习的作者重名消歧研究[J]. 数据分析与知识发现 2020(Z1)
    • [2].基于多特征融合的同名专家消歧方法研究[J]. 北京大学学报(自然科学版) 2020(04)
    • [3].基于元路径异构网络嵌入的姓名实体消歧方法[J]. 河北科技大学学报 2020(03)
    • [4].融合实体知识描述的实体联合消歧方法[J]. 中文信息学报 2020(07)
    • [5].面向学术文献的作者名消歧方法研究综述[J]. 数据分析与知识发现 2020(08)
    • [6].科学合作网络姓名消歧问题研究[J]. 甘肃科技 2020(16)
    • [7].基于稀疏分布式表征的英文著者姓名消歧研究[J]. 计算机应用研究 2019(12)
    • [8].基于上下文特征的领域文献实体消歧算法[J]. 北京生物医学工程 2018(04)
    • [9].一种易用的实体识别消歧系统评测框架(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2017(02)
    • [10].地名知识辅助的中文地名消歧方法[J]. 地理与地理信息科学 2016(04)
    • [11].消歧审议瑞士行[J]. 中国妇运 2015(02)
    • [12].文献数据库中作者名自动化消歧方法应用研究[J]. 情报杂志 2013(09)
    • [13].自然语言处理中的语义消歧研究[J]. 淮南师范学院学报 2013(05)
    • [14].基于层次聚类的中文人名消歧方法研究[J]. 心智与计算 2010(04)
    • [15].一种论文作者重名消歧方法[J]. 软件导刊 2020(03)
    • [16].基于专家研讨思想的发明人姓名消歧研究[J]. 情报科学 2019(04)
    • [17].基于规则的维吾尔人名智能消歧研究[J]. 数字技术与应用 2017(12)
    • [18].基于双词主题模型的半监督实体消歧方法研究[J]. 电子学报 2018(03)
    • [19].我国专利数据中发明家姓名消歧算法研究[J]. 情报学报 2016(04)
    • [20].姓名消歧方法研究进展[J]. 情报工程 2016(01)
    • [21].一种基于特征映射的中文专家消歧方法[J]. 中文信息学报 2016(02)
    • [22].信息抽取和实体消歧[J]. 福建电脑 2014(11)
    • [23].基于向量空间模型的古汉语词义自动消歧研究[J]. 图书情报工作 2013(02)
    • [24].基于序列标注的全词消歧方法[J]. 中文信息学报 2012(02)
    • [25].机器翻译的一些消歧方法研究[J]. 西南民族大学学报(自然科学版) 2008(04)
    • [26].基于因子图的不一致记录对消歧方法[J]. 计算机研究与发展 2020(01)
    • [27].基于实体关联的消歧算法研究[J]. 中国电子科学研究院学报 2020(03)
    • [28].聚类集成技术在中文人名消歧中的应用研究[J]. 信息系统工程 2020(04)
    • [29].基于特征加权重叠度的中文实体协同消歧方法[J]. 中文信息学报 2017(02)
    • [30].面向实体链接的多特征图模型实体消歧方法[J]. 计算机应用研究 2017(10)

    标签:;  ;  ;  ;  ;  ;  

    个性化搜索中用户语义意图自动识别技术研究
    下载Doc文档

    猜你喜欢