论文摘要
在计算机与网络信息技术飞速发展的今天,各个领域的信息与数据急剧增加,并且由于人类的参与使数据与信息中的不确定性更加显著,信息与数据中的关系更加复杂。如何从大量的、杂乱无章的、强干扰的不完备信息中挖掘潜在的、新颖的、正确的、有价值的知识,这给智能信息处理提出了严峻的挑战,由此产生了人工智能领域研究的一个崭新领域——数据挖掘(DM)和数据库知识发现(KDD)。在DM和KDD诸多方法中,形式概念分析、模糊聚类分析、粗糙集等对于处理不完备信息不失为有效的方法。模糊聚类分析与粗糙集都是表示和处理不确定性数据的重要方法,它们不仅可以处理不完全数据、噪声或不精确数据,而且在开发数据的不确定性模型方面是有用的,能提供比传统方法更灵活、更平滑性能。形式概念分析和粗糙集都是用来进行数据建模和数据分析的数学工具,形式概念分析具有较强的代数结构,它获取的知识更具有层次清晰和逻辑性强的优点,而粗糙集对于各种复杂数据集的知识获取已取得了大量的研究成果。由于形式概念分析与粗糙集研究的对象具有天然的相似性,它们之间的融合研究将拓展粗糙集在不完信息系统中的处理能力,是将粗糙集进一步推向实用的关键之一。本文跟踪国际学术前沿,建立了基于不完备形式背景的概念格结构模型和知识库;提出了一种新的基于模糊聚类分析的信息完备化方法;初步探讨了形式概念分析理论与粗糙集的融合。本文的结论不仅为分析处理数据提供了新的理论依据,而且具有重大的应用价值。本文获得了以下主要成果:1)形式概念分析在不完备形式背景中的知识获取。引入了粒度计算思想,在不完备形式背景中定义了对象一属性相容粒,同时融合形式概念分析理论提出了基于对象-属性相容粒的一信息获取方法。该方法在信息获取过程中,一方面,引入了粒度计算思想,在不同粒度下对问题进行抽象和简化,便于我们更好的理解问题,而不是淹没在问题的不必要的细节中,从而降低了信息获取的复杂性;另一方面,参考了相关领域中的专家意见,保障了信息获取的可靠性.本文可分成两个阶段:一、基于不同粒度下的对象-属性相容粒,生成完备化形式背景;二、融合多个完备化形式背景,在不完备形式背景上建立一个概念格结构模型。以上两个阶段的结论都有严格的理论依据和实验数据支持,同时说明了该方法的可行性和有效性。该方法不仅建立了基于不完备形式背景的概念格结构模型和知识库,而且为分析处理数据提供了一种新的理论依据。2)运用模糊聚类理论处理不完备信息系统。通过模糊聚类理论构建了一个新的信息处理平台,即相容模糊粒框架系统,它为正确修复遗漏信息提供了不同粒度下的数据支持。该系统由相容模糊粒框架族和遗漏信息粒集合两部分构成,我们将运用相容模糊粒框架族来获取遗漏信息粒中的缺失数据。不同粒度下修复遗漏信息的效用遵循边际效用递减原理,因为随着粒度的变大,它对修复遗漏数据的效用也会降低。由于数据的缺失数量会影响参数的合理设定,我们引入了模糊综合评判来度量数据的缺失量,为参数的合理设定提供依据。与一些传统方法相比较,它更能反应人类的认知过程。3)形式概念分析与粗糙集的融合研究。本文实现了形式概念分析与粗糙集的融合研究,用形式概念分析来刻画依赖空间、属性约简、独立、核与函数依赖等粗糙集中的核心概念。该理论简单且便于理解,有助于人们进行更深层次的探索与研究。