基于粗糙集理论的智能信息检索方法的研究

基于粗糙集理论的智能信息检索方法的研究

论文摘要

信息检索是一种“人找信息”的信息服务形态,它们要求用户提交查询关键词来查找与之匹配的信息,当网络规模越来越大,信息越来越多时,信息的查找和获取也就变得越来越困难。如何迅速、高效地检索和访问各领域的信息资源以促进信息的交流与共享就成为了信息检索领域的研究重点。为此,一方面要研究如何利用人工智能的技术处理文本信息;另一方面要研究如何表示用户兴趣和优化用户兴趣查询以及智能化地处理用户与检索系统的交互等。本文研究基于粗糙集理论的智能信息检索方法,主要讨论文本信息检索的处理技术和优化用户查询以便提高用户查询质量。本文提出一种基于粗糙集理论的文本检索优化方法。利用粗糙集理论中的上近似、下近似和粗包含对文档集和查询进行优化处理。本文给出用户查询优化算法。首先对用户查询进行优化之后进行查询匹配,将结果按其与用户查询相似度高低的顺序返回,使用户获得与其兴趣最接近的查询结果。本文以中文文档为研究对象,对文本检索优化方法进行了实验研究,结果表明该方法对于文本信息检索是有效的。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 引言
  • 1.1 选题意义
  • 1.2 国内外研究综述
  • 1.2.1 信息检索的定义及其产生
  • 1.2.2 信息检索技术的热点
  • 1.2.3 现代信息技术对文本信息检索的影响
  • 1.3 本文的主要工作
  • 1.4 本文的组织结构
  • 第二章 粗糙集理论
  • 2.1 粗糙集理论的产生与发展
  • 2.2 粗糙集理论的特点
  • 2.3 粗糙集的基本知识
  • 2.4 粗糙集理论所处理的问题
  • 第三章 信息检索模型
  • 3.1 布尔模型
  • 3.2 概率检索模型
  • 3.3 向量空间模型
  • 3.4 基于概念的检索模型
  • 3.4.1 概念词典
  • 3.4.2 潜在语义索引
  • 3.5 信息检索的性能评价
  • 第四章 信息检索的关键技术
  • 4.1 文档表示
  • 4.1.1 文档的表示的几个相关概念
  • 4.1.2 特征项的选择
  • 4.1.3 特征项的权重计算
  • 4.2 分词
  • 4.2.1 机械匹配法
  • 4.2.2 特征词库法
  • 4.2.3 约束矩阵法
  • 4.2.4 语法分析法
  • 4.2.5 理解分词
  • 4.3 用户兴趣的表示
  • 4.3.1 基于内容的表示
  • 4.3.2 基于评价的表示
  • 4.3.3 基于知识的表示
  • 第五章 原型系统的设计与实现
  • 5.1 功能设计与实现方案的选择
  • 5.1.1 功能设计
  • 5.1.2 预处理功能及其实现方案
  • 5.1.3 核心功能的实现方案
  • 5.2 系统的组成及其功能
  • 5.2.1 文本检索系统框架模型
  • 5.2.2 相似度计算
  • 5.2.3 用户查询
  • 5.2.4 查询优化的算法描述
  • 第六章 结论与展望
  • 6.1 本文的总结
  • 6.2 未来工作
  • 致谢
  • 参考文献
  • 学期间公开发表论文及参与项目情况
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于粗糙集理论的智能信息检索方法的研究
    下载Doc文档

    猜你喜欢