论文摘要
Rough集理论是Pawlak教授在20世纪80年代初提出的一种用于不确定和含糊数据分析的有效数学方法。在其后的20年中,Rough集理论在其理论研究和实际应用两方面都取得了长足的进展。目前,作为软计算方法的重要分支,Rough集理论涉及的领域包括模式识别、机器学习、决策分析、数据库中的知识发现、专家系统等。本文对Rough集理论及其应用中的一些问题进行了研究,主要的工作和取得的成果概括如下:●不一致决策表的知识约简方法.目前计算不一致决策表的分布约简、最大分布约简和分配约简的方法均基于区分矩阵,在大数据集下将耗费较多计算时间。对此提出了一种转换算法,将原不一致决策表上述三种约简的计算转换为对三种导出的一致决策表Pawlak约简的计算,进而利用针对Pawlak约简的高效启发式知识约简算法降低计算的开销。●不完备决策表的启发式知识约简算法.基于容差关系的Rough集模型是描述不完备决策表最常用的一种模型。在该模型下,广义决策约简是最常见的一种知识约简。目前一般是通过基于区分矩阵的方法计算这种约简,同样不适合数据量较大的情况。对此,在对与广义决策约简相关的性质进行分析的基础上定义了属性重要性,并以此作为启发式信息提出了一种完备的属性约简算法。●变精度Fuzzy Rough集的新定义.Fuzzy Rough集和Rough集类似,容易受到噪音数据的影响。针对这个缺点,研究者们受到变精度Rough集模型的启发,提出了变精度Fuzzy Rough集的概念。但现有的变精度Fuzzy Rough集模型并没有继承一些Rough集,变精度Rough集和Fuzzy Rough集所共有的基本性质。针对这一问题,提出了Fuzzy近似空间中某一Fuzzy集的β-下近似和β-上近似的新定义方式。该定义能够满足上述基本性质。●基于Rough集理论的交叉算子.根据人类DNA研究结果的启示,提出了一种基于Rough集理论的交叉算子,以克服传统交叉算子易于破坏定义长度较长、阶数较高的优良模式的缺点。利用这种交叉算子可以发现有效模式,同时保证这些有效模式即使在其定义长度较长、阶数较高时也不易在基因重组过程中被破坏。●基于Rough集理论的两阶段禁忌搜索算法.基于Rough集理论,提出了一种多样性搜索和集中性搜索分开进行的两阶段禁忌搜索算法,用于以TSP为代表的组合优化问题。该算法与大多数自适应禁忌搜索算法不同,没有采用动态调整禁忌搜索参数的方式平衡集中性搜索和多样性搜索,而是采用了两阶段搜索策略。第一阶段为多样性搜索。此阶段主要通过激励搜索过程远离起点,对解空间进行相当程度的探索。在此基础上构造希望区域决策表,继而求解其知识约简并构造希望区域。第二阶段为集中性搜索。此阶段以希望区域包含的最佳解为起点进行集中性搜索。在搜索过程中,参照希望区域的信息对当前解的选择进行有条件的限制,以灵活利用多样性搜索得到的关于路径的有用信息。●基于Rough集理论的聚类有效性指数.综合了目前常见的两类聚类有效性指数的基本思路,提出了一种针对Fuzzy c-均值算法的聚类有效性指数。该指数用类中心的距离和类的重叠程度两方面的信息来衡量模糊类之间的差异程度,并利用Fuzzy Rough集中的相关概念度量划分的一致性。在此基础上可以找到较为合理的划分。●基于Rough集理论的指代消解方法.提出了一种结合Fuzzy Rough集的基于实例学习方法,应用于中文文本中人称代词消解的研究。该方法的第一步是预处理,得到候选实例集合,然后按照仅涉及浅层语法和语义知识的属性集对其中的每个名词短语进行标记。第二步选择代表性较强的实例,并对其进行属性值约简以提高这些实例的泛化能力。这两个任务均利用Fuzzy Rough集中的相关概念来完成。以上两步为学习阶段。第三步即可根据这些实例判断新输入的名词短语是否为代词的先行语。
论文目录
相关论文文献
- [1].基于Rough集理论对新农村建设指标评价模型的构建——以河南省部分县市为例[J]. 湖北农业科学 2014(07)
- [2].基于Rough集理论的当地居民旅游影响感知研究——以甘南藏族自治州为例[J]. 资源开发与市场 2016(05)
- [3].基于Rough集理论的和谐新农村价值取向研究[J]. 产业与科技论坛 2014(09)
- [4].基于粒矩阵的相容关系的知识表示[J]. 计算机科学 2012(12)
- [5].基于粒计算的Rough集模型[J]. 计算机科学 2009(05)
- [6].Rough集理论中知识与运算的矩阵表示[J]. 计算机科学 2011(02)
标签:集理论论文; 决策表论文; 知识约简论文; 遗传算法论文; 禁忌搜索算法论文; 聚类有效性指数论文; 指代消解论文;