信息检索中语段形式用户需求的分析

信息检索中语段形式用户需求的分析

论文摘要

如何准确快速地在互联网上获取信息已成为现在的研究热点。目前的大部分搜索引擎是根据用户输入的关键字组合进行词串匹配,返回大量网页,准确率低。在信息检索中,根据用户的查询输入,准确地理解用户的查询意图,是提高搜索结果准确性的关键所在。用户的真正意图是一个整体,表示一个完整的概念。分析用户需求,就是将形式上离散的输入,还原成用户的完整的原始的需求概念。以此概念为指导,可以预期大幅提高搜索效果。本文对语段形式的用户需求进行分析,这种形式的需求在用户查询日志中出现最多。本文通过概念图来表示需求概念,用节点表示概念,用弧表示概念间的关系。首先人工总结出几个常见的查询领域类别,标注出各查询类别的概念框架图。然后对查询进行预处理:利用搜索引擎进行粗切分,再用基于网络挖掘技术训练得到的若干复杂专有名词识别器,对切分后的结果进行识别。我们用专有名词识别和规则匹配的方法来将用户的查询进行归类,并识别出用户需求中含有的相应类别的属性的值,填充到该类别的概念框架图中。由此得到用户需求的概念图。本文收集了搜索引擎日志中大量出现的若干类别的用户查询实例,对系统的有效性进行测试。实验结果表明,对特定的若干类别的查询输入,系统有着较好的分析结果。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 信息检索
  • 1.1.2 用户需求分析
  • 1.2 研究现状
  • 1.2.1 对话系统/口语系统中的查询问题分析
  • 1.2.2 应用语义技术的需求分析
  • 1.3 本文工作及论文结构
  • 1.4 本章小结
  • 第二章 系统结构
  • 2.1 概念分析系统总体结构
  • 2.2 各个模块的功能
  • 2.2.1 需求类型归纳
  • 2.2.2 人工标注
  • 2.2.3 预处理
  • 2.2.4 概念分析
  • 2.3 本章小结
  • 第三章 预处理
  • 3.1 切分
  • 3.1.1 切分算法
  • 3.1.2 切分结果
  • 3.2 复杂专有名词识别
  • 3.2.1 相关工作
  • 3.2.2 识别算法
  • 3.2.3 缓存机制
  • 3.2.4 识别结果
  • 3.3 本章小结
  • 第四章 概念图
  • 4.1 概念图基础
  • 4.2 日志资料分析
  • 4.2.1 日志资料
  • 4.2.2 类型归纳
  • 4.3 概念内涵属性框架图标注
  • 4.3.1 标注准则
  • 4.3.2 标注结果
  • 4.4 本章小结
  • 第五章 概念图生成
  • 5.1 概念图的语义表示框架
  • 5.2 基于概念图的语义分析方法
  • 5.3 概念框架图的生成
  • 5.4 概念图的生成
  • 5.4.1 划类
  • 5.4.2 专名填充
  • 5.4.3 基于规则的其余属性识别
  • 5.5 实验结果
  • 5.6 本章小结
  • 第六章 总结
  • 参考文献
  • 致谢
  • 攻读硕士学位期间已发表或录用的论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    信息检索中语段形式用户需求的分析
    下载Doc文档

    猜你喜欢