论文题目: 概念格分布处理及其框架下的知识发现研究
论文类型: 博士论文
论文专业: 控制理论与控制工程
作者: 李云
导师: 刘宗田
关键词: 概念格,形式背景,部分格,并置和叠置,分治策略,频繁封闭项集,同交易项集,最小无冗余规则,简洁规则,量化封闭项集格,量化规则格,部分有效规则,最终有效规则
文献来源: 上海大学
发表年度: 2005
论文摘要: 概念格以其良好的数学性质已成功地应用于知识发现等诸多领域,但由于概念格自身的完备性,构造概念格的时间复杂度一直是影响形式概念分析应用的主要障碍。概念格应用的前提是概念格的构造。现在概念格的渐进式构造算法表现出了更强的生命力和适应性。但目前基本上都是属于基于对象的渐进式算法,而基于属性的构造算法未见报告。实际上,形式背景中数据的变化应该包括两个方面:一是对象的增减,二是属性的增减。增加属性可能使原来不能区分的对象能够区分,删除属性就可能使原来属于不同类的对象变为同一类。通过对概念格中概念之间的相互关系的了解,和对象和属性之间相互关系的研究,本文提出并实现了基于属性的概念格构造算法,特别是基于属性的渐进式生成算法。它不仅为概念格的生成提供了一种新的方法,而且解决了在已构造好概念格的前提下,增加属性所带来的概念格更新问题,另外,它也为分布式存储的形式背景的概念格横向合并提供了基础。 随着处理的形式背景的增大,构造概念格的时空复杂度也会随着急剧增大。研究采用新的方法和手段来构造概念格,就成为概念格研究的主要内容之一。现在已经提出的构造概念格的多种算法基本上是针对单个概念格的。采用分治策略来构造概念格是解决这一问题的有效途径。概念格的分布处理就是通过形式背景的拆分,形成分布存储的多个子背景,然后同时构造相应的子概念格,再由子概念格的合并得到所需的概念格。 由于概念格是其形式背景中的概念间关系的表现形式,它和对应的形式背景是一一对应的。因此,对概念格的分布处理必然涉及到形式背景的拆分、合并等处理。本文从形式背景的并置和叠置出发,定义了两种类型的形式背景和概念格;并对不一致背景的处理进行了研究;证明了横向合并的子形式背景的概念格和子背景所对应的子概念格的横向并是同构的;结合子概念格中概念间固有的泛化—特化关系,继承已有的概念格渐进式构造的算法,并对其进行改造,形成能满足多个子概念格合并处理要求的算法。 数据挖掘是自动从数据中提取出人们感兴趣的潜在的可用信息和知识,并将提取出来的信息和知识表示成概念、规则和模式。关联规则是发现知识的主要形式。提取关联规则的主要步骤是频繁项集的获取,而一个事务数据库中频繁项集的数量往往很庞大,从频繁项集中提取的规则就会很多,且存在大量的冗余。为了缩减频繁项集的数目同时也不丢失有用信息,现在采用用频繁封闭项集来提取最小无冗余的关联规则。
论文目录:
摘要
ABSTRACT
目录
第一章 绪论
1.1 研究的背景与意义
1.2 论文概要与主要贡献
第二章 概念格及其应用
2.1 形式概念分析的理论基础
2.1.1 形式背景和概念
2.1.2 概念格及其表示
2.1.3 多值形式背景及其处理
2.2 概念格的扩展模型
2.2.1 量化概念格
2.2.2 加权概念格
2.2.3 约简概念格
2.2.4 规则概念格
2.2.5 模糊概念格和粗糙概念格
2.3 概念格的应用
2.3.1 概念格在数据挖掘中的应用
2.3.2 概念格在信息检索方面的应用
2.3.3 概念格在软件工程中的应用
2.3.4 概念格在其他方面的应用
第三章 概念格的生成和维护技术
3.1 概念格的生成算法概述
3.1.1 批生成算法(Batch Algorithm)
3.1.2 渐进式生成算法(Incremental Algorithm)
3.2 基于属性的概念格生成算法
3.2.1 基于属性的渐进式生成算法
3.2.2 利用不完全覆盖的生成算法
3.3 概念格的维护技术
3.3.1 概念格的横向维护
3.3.2 概念格的纵向维护
3.4 结论
第四章 概念格分布处理模型
4.1 形式背景的分布处理
4.1.1 形式背景的并置和叠置
4.1.2 不一致背景及其处理
4.2 概念格的分布处理
4.2.1 概念格的分布处理概述
4.2.2 多概念格横向合并算法
4.2.3 多概念格纵向合并算法
4.3 结论
第五章 最小项集集合与封闭项集格
5.1 有关项集的基本定义
5.2 同交易集的频繁项集与封闭项集格
5.2.1 同交易集的频繁项集
5.2.2 封闭项集及其封闭项集格
5.3 最小项集集合及其计算
5.3.1 最小项集集合
5.3.2 最小项集集合的计算
5.4 结论
第六章 概念格与关联规则发现
6.1 关联规则提取的基本概念
6.2 基于概念格的关联规则发现
6.2.1 同交易集的频繁项集与最小无冗余规则
6.2.2 量化封闭项集格及其构造
6.2.3 最小无冗余关联规则的提取
6.3 基于概念格提取简洁关联规则
6.4 最小无冗余规则的渐进更新-量化规则格及其构造
6.4.1 增加节点连线的更新处理
6.4.2 删除节点连线的处理
6.4.3 量化规则格的渐进生成算法
6.4.4 两种方案的比较分析及其试验验证
6.5 结论
第七章 基于概念格分布处理的规则发现
7.1 基于概念格合并运算提取关联规则
7.2 利用部分概念格的规则集成获取关联规则
7.2.1 系统的框架
7.2.2 候选关联规则的核查与集成
7.2.3 简单示例验证
7.3 结论
第八章 结束语
参考文献
致谢
发布时间: 2005-09-16
参考文献
- [1].基于不确定性理论的概念格生成与知识获取的若干问题研究[D]. 马丽.河北师范大学2016
- [2].不确定性信息系统中的知识表达与约简[D]. 李美争.西南交通大学2016
- [3].概念格构造与应用中的关键技术研究[D]. 智慧来.上海大学2010
- [4].基于直观图的概念格知识获取理论与方法[D]. 万青.西北大学2015
- [5].形式概念分析和粗糙集理论的代数及拓扑式研究[D]. 杨凌云.扬州大学2010
- [6].基于粗糙集与公理模糊集的形式概念分析[D]. 王利东.大连理工大学2009
- [7].不完备信息系统知识约简方法及应用研究[D]. 杨霁琳.西南交通大学2010
相关论文
- [1].基于形式概念分析的图像数据挖掘研究[D]. 秦昆.武汉大学2004
- [2].基于领域知识的知识发现研究[D]. 杨立.中国科学院研究生院(软件研究所)2005
- [3].基于概念格模型的序列模式挖掘算法研究[D]. 金阳.吉林大学2007
标签:概念格论文; 形式背景论文; 部分格论文; 并置和叠置论文; 分治策略论文; 频繁封闭项集论文; 同交易项集论文; 最小无冗余规则论文; 简洁规则论文; 量化封闭项集格论文; 量化规则格论文; 部分有效规则论文; 最终有效规则论文;