形式概念分析是德国学者wille在1982年提出的一种数学理论,其主要思想来源于哲学.在哲学中,概念是由外延和内涵两部分组成的思想单元.在形式概念分析中,概念的外延被理解为属于这个概念的所有对象的集合,而内涵则被认为是所有这些对象所共有的特征(或属性)集.概念集和概念间的泛化和例化关系可以构成一个概念格,它是形式概念分析理论中的核心数据结构,其相应的Hasse图则可实现了对数据的可视化.形式概念分析已被广泛地研究,并应用到机器学习,软件工程和信息获取等领域.通常经典的形式概念分析所研究的形式背景是完备的,即任一属性和对象都具有确定的关系.但在许多实际情况下,由于数据测量的误差,对数据的理解及传输产生失真等问题,使知识获取产生了较大的难度.这种数据缺失的形式背景称作不完备形式背景.本文采用扩展属性法对不完备形式背景进行处理,使不完备形式背景完备化,并对完备化的形式背景进行知识获取.目前形式概念分析主要研究单值形式背景,而对多值背景的研究并不多见.对多值背景的常见处理方法是梯级(Scaling),先选取特定的梯级背景,再通过对多值属性进行梯级得到一个单值的衍生背景,最后再应用经典形式背景的方法对衍生背景进行处理.这种方法不足之处在于梯级过程中可能生成一个较大的单值背景,为弥补这个缺陷,本文采用形式描述的方法对多值背景了进行处理,避免生成一个较大的单值背景.通过形式描述的方法我们可以构造多值背景上的概念,从而可以利用形式概念分析中的经典方法进行知识获取.本文的主要工作如下:1)在不完备形式背景上,采用扩展属性的方法对不完备形式背景进行完备化处理,进而进行提取规则,该方法的优点是不完备形式背景中的大量信息可以得到保持,不足之处是形式背景的属性有所增加.2)从映射的角度在多值背景上引入了形式描述的概念.在对形式描述进行限制的前提下定义了多值背景上的标准描述.利用标准描述来构造多值背景上的概念.该方法最大优点是可以避免产生一个庞大的衍生背景,从而可以避免在知识获取过程中产生一些冗余规则.
本文来源: https://www.lw50.cn/article/040a5c2f1bb75cbe3a85a962.html