企业信息检索中的对象检索方法研究

企业信息检索中的对象检索方法研究

论文摘要

企业信息检索是信息检索领域的一个重要分支,其目的就是研究如何在一个相对较小的数据范围内有效地管理知识、组织信息,为提高企业管理者的领导能力和员工的工作效率提供服务。企业信息检索是一个综合性的课题,涉及文本检索、信息提取、自然语言处理等多个学科;又是一个前沿性课题,引领信息检索向着更加精确化和更高的知识表达层次前进。企业信息检索的研究引起人们越来越多的关注。国际文本检索会议将企业信息检索列为信息检索领域重要的研究课题之一,开展了企业信息检索评测任务。评测在统一的平台下进行,主要分为专家检索和邮件检索两个子任务。本文围绕着两个任务开展了对象检索相关技术的研究,旨在解决企业信息检索中异构信息整合和检索效果改进等问题,主要成果如下:第一,探讨了基于文档的专家检索方法。主要包括专家定位和专家检索的文本建模方法研究。首先,研究了基于规则的专家定位方法。对专家重名引起的歧义问题,采用启发式规则进行重名消歧。其次,探讨了语言建模方法在专家检索中的应用。实现了两种基于语言模型的专家检索基本方法,并应用分层剖析法加以分析比较。最后,研究了基于相关反馈的专家检索方法。提出了反馈式专家检索模型,将专家检索转化为相关反馈问题,可充分利用在相关反馈问题上丰富的研究成果来解决专家检索问题。实验结果表明,本文的方法不仅易于工程实现,能够与传统文档检索有机结合,而且可以在保证检索精度的情况下提高检索效率,以达到快速准确处理较大规模数据的能力。第二,探讨了企业信息检索中的对象建模方法。主要包括对象的定义、对象信息提取和对象模型的分析。首先,给出了企业信息检索中的对象的定义。针对本文研究的专家检索和邮件检索,明确了对象的属性和关系。接着探讨了信息提取方法在对象属性提取和关系挖掘中的应用。对于专家对象,提出了专家的文本经验元属性以及基于窗口的经验元属性提取策略,将程序设计中的经验元概念扩展到语义层次。然后,分析了邮件对象模型。最后,探讨了专家对象模型,提出了基于机率比关系的文档向量模型为专家建模,克服了传统方法“偏爱”高频度专家的问题。实验结果表明,本文的方法能够很好地提高专家检索的精度,具有良好的应用前景。第三,探讨了基于对象的企业信息检索方法。我们期望能够采用基于对象的建模方法解决对象检索问题。首先,给出了基于对象的检索的数学模型,并且从理论上分析了对象排序算法,提出了相似度、置信度和重要度三个方面相结合的对象排序策略。在此基础上,分别实现了基于对象的专家检索方法与基于对象的邮件检索方法。最后,通过扩展基于对象的检索模型,提出了统一的多类对象混合检索方法。实验结果表明,本文的方法能够更好地解决对象检索问题。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 引言
  • 1.2 课题研究背景
  • 1.2.1 信息检索的发展
  • 1.2.2 企业信息检索的提出
  • 1.2.3 TREC企业信息检索评测
  • 1.3 企业信息检索概述
  • 1.3.1 企业信息检索的定义
  • 1.3.2 企业信息检索面临的挑战
  • 1.3.3 企业信息检索亟待解决的问题
  • 1.4 本文的主要工作
  • 1.5 本文内容安排
  • 本章参考文献
  • 第二章 信息检索的相关技术
  • 2.1 引言
  • 2.1.1 信息检索
  • 2.1.2 Lemur检索平台
  • 2.1.3 本章内容安排
  • 2.2 信息检索模型
  • 2.2.1 布尔模型
  • 2.2.2 向量空间模型
  • 2.2.3 概率模型
  • 2.2.4 统计语言模型
  • 2.3 文档处理与索引
  • 2.3.1 文档处理
  • 2.3.2 建立索引
  • 2.4 信息检索的评价指标
  • 2.5 本章小结
  • 本章参考文献
  • 第三章 企业数据中的对象
  • 3.1 引言
  • 3.2 对象的定义
  • 3.2.1 对象的定义与分类
  • 3.2.2 对象的属性
  • 3.2.3 对象的关系
  • 3.3 对象信息的提取
  • 3.3.1 Web信息提取
  • 3.3.2 Web信息提取算法
  • 3.3.3 对象属性提取
  • 3.3.4 对象关系挖掘
  • 3.4 本章小结
  • 本章参考文献
  • 第四章 基于文档的对象检索
  • 4.1 专家检索简介
  • 4.2 专家定位
  • 4.2.1 姓名的多样性
  • 4.2.2 姓名的歧义性
  • 4.2.3 基于规则的专家定位
  • 4.3 基于文档的专家检索相关技术
  • 4.3.1 基于文档的专家检索模型
  • 4.3.2 专家检索的语言建模方法
  • 4.4 反馈式专家检索技术
  • 4.4.1 查询扩展
  • 4.4.2 扩展词加权技术
  • 4.4.3 反馈式专家检索模型实现
  • 4.5 本章小结
  • 本章参考文献
  • 第五章 对象模型
  • 5.1 引言
  • 5.2 专家模型
  • 5.2.1 专家文本建模
  • 5.2.2 专家关系建模
  • 5.3 邮件模型
  • 5.3.1 邮件文本建模
  • 5.3.2 邮件关系建模
  • 5.4 本章小结
  • 本章参考文献
  • 第六章 基于对象的检索
  • 6.1 引言
  • 6.2 相关研究背景
  • 6.3 基于对象的检索模型
  • 6.3.1 对象的数学模型
  • 6.3.2 OBRM检索模型
  • 6.3.3 OBRM检索框架
  • 6.4 专家检索的对象方法
  • 6.4.1 简介
  • 6.4.2 专家对象元数据
  • 6.4.3 专家OBRM模型
  • 6.4.4 实验
  • 6.5 邮件检索的对象方法
  • 6.5.1 简介
  • 6.5.2 邮件对象元数据
  • 6.5.3 邮件OBRM模型
  • 6.5.4 实验
  • 6.6 多种对象的混合检索
  • 6.7 本章小结
  • 本章参考文献
  • 第七章 结论与展望
  • 7.1 本文的总结
  • 7.2 进一步的工作
  • 致谢
  • 博士期间发表的论文
  • 相关论文文献

    • [1].关于“信息检索学”是否存在问题的探讨[J]. 中国索引 2012(03)
    • [2].从新视角开展信息检索建模研究[J]. 中国出版 2020(08)
    • [3].在线健康信息检索行为实验研究内容梳理及启示[J]. 图书情报工作 2020(03)
    • [4].情境感知视角下的信息检索发展研究[J]. 图书情报导刊 2020(04)
    • [5].计算机信息检索对图书情报的影响分析[J]. 中国新通信 2020(17)
    • [6].任务情境下的儿童信息检索行为研究[J]. 图书馆理论与实践 2019(05)
    • [7].企业用户信息检索模式研究[J]. 中国管理信息化 2019(18)
    • [8].探讨现代信息检索对图书馆信息服务的影响[J]. 办公室业务 2019(22)
    • [9].“信息检索与利用”混合式教学中实践教学作业设置探讨[J]. 江苏科技信息 2018(13)
    • [10].基于蓝墨云班课的翻转课堂教学实践——以高职“信息检索”课程为例[J]. 中国信息技术教育 2017(01)
    • [11].信息检索在公安管理中的应用探讨[J]. 山西青年 2017(02)
    • [12].检索是一种素养[J]. 大学生 2017(07)
    • [13].自学检索[J]. 大学生 2017(10)
    • [14].信息检索服务小微企业的探析——基于“大众创业、万众创新”背景[J]. 科技创业月刊 2016(04)
    • [15].网络档案信息检索的元数据设计[J]. 山西档案 2020(01)
    • [16].巧用智能手机拓展高职信息检索课堂[J]. 北极光 2019(03)
    • [17].跨语言信息检索中的最关联英文语义翻译选取[J]. 现代电子技术 2017(12)
    • [18].雨课堂在《信息检索与利用》课程教学中的应用实践[J]. 中国教育信息化 2017(20)
    • [19].研究生与本科生信息检索焦虑研究[J]. 图书馆学刊 2015(11)
    • [20].网络环境下的图像信息检索行为的现状调查及优化对策[J]. 科教文汇(上旬刊) 2014(10)
    • [21].微信辅助信息检索教学的SWOT分析[J]. 中国新通信 2014(24)
    • [22].开放网络知识的信息检索与数据挖掘探究[J]. 电脑迷 2016(09)
    • [23].高校图书馆读者信息检索竞赛活动研究[J]. 新世纪图书馆 2014(10)
    • [24].跨语言信息检索在搜索引擎中的应用[J]. 中小企业管理与科技(上旬刊) 2013(04)
    • [25].艺术信息检索[J]. 大舞台 2012(03)
    • [26].我国企业信息检索存在的通病与对策[J]. 重庆与世界(学术版) 2012(07)
    • [27].财经院校经济信息检索与利用教育模式的构建[J]. 高等财经教育研究 2012(04)
    • [28].网络环境下高职院校信息检索教育的思考[J]. 科技信息 2009(31)
    • [29].2006-2007年国外用户信息检索行为研究述评[J]. 图书馆建设 2008(03)
    • [30].医科院校信息检索教育形式多样化的研究[J]. 科技情报开发与经济 2008(18)

    标签:;  ;  ;  ;  ;  ;  

    企业信息检索中的对象检索方法研究
    下载Doc文档

    猜你喜欢