Rough集理论及其应用中若干问题的研究

Rough集理论及其应用中若干问题的研究

论文摘要

Rough集理论是Pawlak教授在20世纪80年代初提出的一种用于不确定和含糊数据分析的有效数学方法。在其后的20年中,Rough集理论在其理论研究和实际应用两方面都取得了长足的进展。目前,作为软计算方法的重要分支,Rough集理论涉及的领域包括模式识别、机器学习、决策分析、数据库中的知识发现、专家系统等。本文对Rough集理论及其应用中的一些问题进行了研究,主要的工作和取得的成果概括如下:●不一致决策表的知识约简方法.目前计算不一致决策表的分布约简、最大分布约简和分配约简的方法均基于区分矩阵,在大数据集下将耗费较多计算时间。对此提出了一种转换算法,将原不一致决策表上述三种约简的计算转换为对三种导出的一致决策表Pawlak约简的计算,进而利用针对Pawlak约简的高效启发式知识约简算法降低计算的开销。●不完备决策表的启发式知识约简算法.基于容差关系的Rough集模型是描述不完备决策表最常用的一种模型。在该模型下,广义决策约简是最常见的一种知识约简。目前一般是通过基于区分矩阵的方法计算这种约简,同样不适合数据量较大的情况。对此,在对与广义决策约简相关的性质进行分析的基础上定义了属性重要性,并以此作为启发式信息提出了一种完备的属性约简算法。●变精度Fuzzy Rough集的新定义.Fuzzy Rough集和Rough集类似,容易受到噪音数据的影响。针对这个缺点,研究者们受到变精度Rough集模型的启发,提出了变精度Fuzzy Rough集的概念。但现有的变精度Fuzzy Rough集模型并没有继承一些Rough集,变精度Rough集和Fuzzy Rough集所共有的基本性质。针对这一问题,提出了Fuzzy近似空间中某一Fuzzy集的β-下近似和β-上近似的新定义方式。该定义能够满足上述基本性质。●基于Rough集理论的交叉算子.根据人类DNA研究结果的启示,提出了一种基于Rough集理论的交叉算子,以克服传统交叉算子易于破坏定义长度较长、阶数较高的优良模式的缺点。利用这种交叉算子可以发现有效模式,同时保证这些有效模式即使在其定义长度较长、阶数较高时也不易在基因重组过程中被破坏。●基于Rough集理论的两阶段禁忌搜索算法.基于Rough集理论,提出了一种多样性搜索和集中性搜索分开进行的两阶段禁忌搜索算法,用于以TSP为代表的组合优化问题。该算法与大多数自适应禁忌搜索算法不同,没有采用动态调整禁忌搜索参数的方式平衡集中性搜索和多样性搜索,而是采用了两阶段搜索策略。第一阶段为多样性搜索。此阶段主要通过激励搜索过程远离起点,对解空间进行相当程度的探索。在此基础上构造希望区域决策表,继而求解其知识约简并构造希望区域。第二阶段为集中性搜索。此阶段以希望区域包含的最佳解为起点进行集中性搜索。在搜索过程中,参照希望区域的信息对当前解的选择进行有条件的限制,以灵活利用多样性搜索得到的关于路径的有用信息。●基于Rough集理论的聚类有效性指数.综合了目前常见的两类聚类有效性指数的基本思路,提出了一种针对Fuzzy c-均值算法的聚类有效性指数。该指数用类中心的距离和类的重叠程度两方面的信息来衡量模糊类之间的差异程度,并利用Fuzzy Rough集中的相关概念度量划分的一致性。在此基础上可以找到较为合理的划分。●基于Rough集理论的指代消解方法.提出了一种结合Fuzzy Rough集的基于实例学习方法,应用于中文文本中人称代词消解的研究。该方法的第一步是预处理,得到候选实例集合,然后按照仅涉及浅层语法和语义知识的属性集对其中的每个名词短语进行标记。第二步选择代表性较强的实例,并对其进行属性值约简以提高这些实例的泛化能力。这两个任务均利用Fuzzy Rough集中的相关概念来完成。以上两步为学习阶段。第三步即可根据这些实例判断新输入的名词短语是否为代词的先行语。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 Rough集理论发展概述
  • 1.2 Rough集理论的基本思想
  • 1.3 Rough集理论及其应用的研究现状
  • 1.3.1 Rough集理论研究的现状
  • 1.3.2 Rough集理论应用研究的现状
  • 1.4 本文的研究内容及意义
  • 1.5 本文的创新点
  • 1.6 本文的章节安排
  • 第二章 Rough集理论的基本概念
  • 2.1 信息系统与决策表
  • 2.2 不可分辨关系与近似空间
  • 2.3 集合近似
  • 2.4 Rough集的基本性质
  • 2.5 知识约简
  • 2.6 属性值约简
  • 2.7 区分矩阵与区分函数
  • 2.8 本章小结
  • 第三章 不一致决策表和不完备决策表的知识约简研究
  • 3.1 不一致决策表和不完备决策表
  • 3.2 不一致决策表知识约简的高效算法研究
  • 3.2.1 不一致决策表的知识约简
  • 3.2.2 不一致决策表的知识约简高效算法
  • 3.2.3 算法时间复杂度分析
  • 3.3 不完备决策表的启发式知识约简算法
  • 3.3.1 不完备决策表的知识约简问题概述
  • 3.3.2 不完备备决策表的容差关系模型中的基本概念
  • 3.3.3 基于容差关系的Rough集模型的知识约简及相关性质
  • 3.3.4 基于容差关系的Rough集模型的知识约简启发式算法
  • 3.3.4.1 属性重要性的度量
  • 3.3.4.2 知识约简算法
  • 3.3.4.3 算法时间复杂度分析
  • 3.4 实验及结果分析
  • 3.5 本章小结
  • 第四章 变精度Fuzzy Rough集的一种新定义
  • 4.1 基本概念
  • 4.1.1 变精度Rough集模型
  • 4.1.2 Fuzzy集
  • 4.1.3 Fuzzy Rough集模型
  • 4.2 变精度Fuzzy Rough集模型的相关工作
  • 4.3 变精度Fuzzy Rough集应具备的基本性质
  • 4.4 变精度Fuzzy Rough集模型的新定义
  • 4.5 新定义的基本性质
  • 4.6 本章小结
  • 第五章 Rough集理论在现代优化算法中的应用
  • 5.1 Rough集理论在遗传算法中的应用
  • 5.1.1 遗传算法概述
  • 5.1.2 基本概念
  • 5.1.3 基于Rough集理论的交叉算子
  • 5.1.3.1 模式及模式定理
  • 5.1.3.2 生物学上的启示
  • 5.1.3.3 具体实现
  • 5.1.4 实验及结果分析
  • 5.2 Rough集理论在禁忌搜索算法中的应用
  • 5.2.1 禁忌搜索算法概述
  • 5.2.2 禁忌搜索算法中的集中性和多样性搜索策略
  • 5.2.3 基于Rough集理论的两阶段禁忌搜索算法
  • 5.2.3.1 第一步:多样性搜索
  • 5.2.3.2 第二步:希望区域的确定
  • 5.2.3.3 第三步:集中性搜索
  • 5.2.3.4 算法中的若干技术细节
  • 5.2.4 算法的收敛性分析
  • 5.2.5 实验及结果分析
  • 5.2.5.1 实验方法
  • 5.2.5.2 测试实例及参数设置
  • 5.2.5.3 测试结果
  • 5.3.本章小结
  • 第六章 Rough集理论在聚类有效性分析中的应用
  • 6.1 FCM算法的基本概念
  • 6.2 基于Fuzzy Rough集的聚类有效性指数的定义
  • 6.2.1 聚类有效性指数设计中涉及到的概念
  • 6.2.2 基于Fuzzy Rough集的聚类有效性指数的定义
  • 6.3 实验及结果分析
  • 6.3.1 实验采用的数据集
  • 6.3.2 实验采用的方法
  • 6.3.3 实验及结果分析
  • 6.4 小结
  • 第七章 Rough集理论在自然语言处理中的应用
  • 7.1 自然语言处理
  • 7.1.1 自然语言处理的内涵及其意义
  • 7.1.2 自然语言处理的研究方法
  • 7.1.3 Rough集理论在自然语言处理中的应用
  • 7.2 指代消解研究的意义及其研究现状
  • 7.3 基本概念
  • 7.3.1 与指代相关的语言学概念
  • 7.3.2 基于任意Fuzzy关系的Fuzzy Rough集
  • 7.4 基于Fuzzy Rough集的汉语人称代词消解方法
  • 7.4.1 汉语人称代词消解研究面临的难点
  • 7.4.2 基于实例的学习
  • 7.4.3 基于Fuzzy Rough集的汉语人称代词消解方法描述
  • 7.4.3.1 语料预处理
  • 7.4.3.2 实例选择
  • 7.4.3.3 属性值约简
  • 7.4.3.4 判断新输入文本中的NP是否为代词先行语
  • 7.4.4 实验及结果分析
  • 7.4.4.1 实验所用语料及其处理细节
  • 7.4.4.2 实验结果及分析
  • 7.5 本章小结
  • 第八章 全文总结及进一步的工作
  • 8.1 全文总结
  • 8.2 今后的工作
  • 致谢
  • 参考文献
  • 攻读博士学位期间取得的研究成果
  • 相关论文文献

    • [1].基于Rough集理论对新农村建设指标评价模型的构建——以河南省部分县市为例[J]. 湖北农业科学 2014(07)
    • [2].基于Rough集理论的当地居民旅游影响感知研究——以甘南藏族自治州为例[J]. 资源开发与市场 2016(05)
    • [3].基于Rough集理论的和谐新农村价值取向研究[J]. 产业与科技论坛 2014(09)
    • [4].基于粒矩阵的相容关系的知识表示[J]. 计算机科学 2012(12)
    • [5].基于粒计算的Rough集模型[J]. 计算机科学 2009(05)
    • [6].Rough集理论中知识与运算的矩阵表示[J]. 计算机科学 2011(02)

    标签:;  ;  ;  ;  ;  ;  ;  

    Rough集理论及其应用中若干问题的研究
    下载Doc文档

    猜你喜欢