基于粗糙集的信息检索研究

基于粗糙集的信息检索研究

论文摘要

粗糙集理论是一种处理含糊和不确定性问题的新型数据分析方法,以其为理论基础的数据处理技术得到深刻关注和不断发展。信息检索致力于寻求准确、高效、智能的信息组织与存取方法,成为当今智能信息处理领域的重要研究内容。本文基于粗糙集理论,针对信息检索模型和信息处理技术涉及的几个关键问题进行了较为深入的研究和探索。比较分析传统信息检索模型与标准粗糙集信息检索模型,将条件概率相似关系结合粗糙集理论引入信息检索,构造概率粗糙集信息检索模型,有效地解决了标准粗糙集信息检索模型中如何设计分类方法,以及体现类间关系的难题。在标引词空间定义条件概率关系,反映了标引空间的模糊相似性,不仅能充分挖掘和利用标引词间相似关系,而且可调节支持度阈值获得理想检索效果。深入研究规则获取过程的本质,分析已有规则获取方法存在的问题,将分布约简应用于规则归纳系统,定义规则的分布核与分布约简概念,提出一种基于分布约简构造规则知识库的增量式学习方法。采用启发式算法获取决策信息系统规则集,当新对象加入时在原有规则知识库基础上进行增量式更新,避免了为更新规则而重新运行规则获取算法。该方法能适应决策信息系统的不一致情形,且运用此方法所得规则集能够保持与原信息系统一致。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 引言
  • 1.2 国内外相关研究现状
  • 1.3 本文主要工作及创新点
  • 1.4 本文结构组织
  • 1.5 本章小结
  • 第二章 粗糙集理论与方法
  • 2.1 粗糙集基本概念
  • 2.2 数据约简
  • 2.3 信息系统与决策规则
  • 2.4 粗糙集数据分析方法
  • 2.5 本章小结
  • 第三章 信息检索理论与技术
  • 3.1 信息检索的起源与发展
  • 3.2 信息检索的研究内容
  • 3.3 布尔检索模型
  • 3.4 向量空间检索模型
  • 3.5 概率检索模型
  • 3.6 传统检索模型的评价
  • 3.7 本章小结
  • 第四章 基于粗糙集的信息检索模型研究
  • 4.1 粗糙集信息检索
  • 4.1.1 粗糙集信息检索实例
  • 4.1.2 粗糙集信息检索策略
  • 4.1.3 粗糙集信息检索与近似空间设计
  • 4.2 条件概率相似关系
  • 4.3 条件概率粗糙近似
  • 4.4 概率粗糙集信息检索模型
  • 4.5 本章小结
  • 第五章 基于粗糙集的规则获取研究
  • 5.1 规则获取的 Rough集原理
  • 5.2 基于粗糙集的规则获取算法
  • 5.3 基于粗糙集的增量式规则获取算法
  • 5.4 基于分布约简的增量式规则获取方法
  • 5.4.1 分布约简规则获取基本知识
  • 5.4.2 基于分布约简的规则获取
  • 5.4.3 基于分布约简获取规则的增量式方法
  • 5.5 自动归类
  • 5.6 本章小结
  • 第六章 实验数据分析
  • 6.1 粗糙集检索模型实验
  • 6.2 粗糙集规则获取实验
  • 6.3 本章小结
  • 第七章 研究工作总结与展望
  • 7.1 研究工作总结
  • 7.2 研究工作展望
  • 参考文献
  • 致谢
  • 攻读学位期间主要研究成果目录
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于粗糙集的信息检索研究
    下载Doc文档

    猜你喜欢