论文题目: 贝叶斯网络结构学习及其在数据挖掘中的应用研究
论文类型: 博士论文
论文专业: 摄影测量与遥感
作者: 黄解军
导师: 万幼川,潘和平
关键词: 贝叶斯网络,结构学习,协同学,数据挖掘,概率推理,土地资源评价
文献来源: 武汉大学
发表年度: 2005
论文摘要: 21世纪是知识经济时代,也是数字化与信息化的时代。人类社会活动离不开信息的获取、处理、开发与利用,信息在人们的生活、服务和生产中发挥着日益重要的作用,信息产业成为推动现代市场经济发展的强大动力。勿庸置疑,信息已经成为促进经济增长和社会进步的一个重要因素,也成为科学发展与科学研究的主旋律。随着各种信息系统、专家系统、数据库和知识库的建立,极大地提高了人类信息管理和科学决策的水平与能力。同时,由于信息和数据量的急剧增加,如何有效地开发和利用这些信息资源成为目前的一项重要课题。在这种社会背景下,数据库技术、人工智能、数理统计和并行计算等技术的相互渗透,使得数据挖掘(Data Mining,DM)技术应运而生,并引起了商业界和学术界的广泛关注。 贝叶斯网络是20世纪80年代提出的不确定性推理方法,它为依赖关系和因果关系提供了一种自然而有效的表达方式。贝叶斯网络具备概率推理能力强、语义清晰、易于理解等技术特点,可以发现数据集中潜在的关系和模式,因此在数据挖掘中显示出独特的优越性。正是基于这一出发点,本文将贝叶斯网络结构学习作为一个核心研究内容,通过系统的理论研究和实验分析,以便建立一套系统的贝叶斯网络结构学习理论和计算方法,为贝叶斯网络的构建和实际应用提供有力的依据。纵观全文,主要研究工作和创新点体现在以下几个方面: 1、首先对贝叶斯网络理论进行了系统深入的分析和论述,描述了贝叶斯网络模型的构成。并用一个警报网络的实例模型对贝叶斯网络的构成及语义进行了详细介绍。总结和归纳出贝叶斯网络与其他方法相比的优势和特点。论述了贝叶斯网络的功能和推理机制,分析和讨论了贝叶斯网络学习的内容和目标,并对贝叶斯网络结构学习中的主要问题进行了深入地剖析。 2、在分析了条件独立性的有关性质和属性的基础上,推导出条件独立性与概率参数之间的几个推论并给予证明。从条件独立性的角度,给出了有向无环图(DAG)的一般性定义。讨论了互信息与条件独立性之间的内在关系,并指出通过计算每对变量的结构互信息,可以确定直接连接的变量,即确定在初始贝叶斯网络中的无向连接。研究了贝叶斯网络中无向图与依赖模型的关系,探讨了从数据集的列联表中进行条件独立性(CI)检验的方法。 3、首次将协同学理论引入到贝叶斯网络结构学习,并建立和形成了一套系统的结构学习理论和方法。论述了协同学的基本概念、原理及其应用,在此基础上,从一个全新的角度,首次提出基于协同学理论的贝叶斯网络结构学习方法,为分析和解决这一项复杂而繁琐的任务提供一个全新的视角和思路。探讨和研究了基于协同学的结构学习机制,把贝叶斯网络结构看成是一个开放的大系统,在专家知识、先验信息、观测数据的相互作用和影响下,通过最大后验概率与最小描述长度的协同计算,得到一个与样本数据最佳匹配的贝叶斯网络结构。这样不仅有利于综合利用相关信息解决计算复杂性的问题,避免主观偏见或数据噪音给结果带来的片面性;而且有机地结合网络结构的简洁性和精确性,使得结构模型与数据实例达到最佳匹配。
论文目录:
摘要
Abstract
第一章 绪论
1.1 引言
1.2 研究背景和意义
1.3 数据挖掘的提出及其发展
1.3.1 数据挖掘的提出与概念
1.3.2 数据挖掘的功能
1.3.3 数据挖掘的技术方法
1.3.4 数据挖掘中的问题与难点
1.4 贝叶斯网络的研究历史与现状
1.4.1 国外对贝叶斯网络的研究
1.4.2 国内对贝叶斯网络的研究
1.5 贝叶斯网络结构学习中的主要问题
1.5.1 结构空间的不连续性
1.5.2 结构空间的指数级规模
1.5.3 无环的限制
1.5.4 结构的等价类别
1.5.5 数据的不完备性
1.6 论文的研究内容与组织结构
第二章 贝叶斯网络的基本理论
2.1 引言
2.2 贝叶斯网络的构成
2.2.1 基本概念与定义
2.2.2 贝叶斯网络的模型与构成
2.2.3 一个贝叶斯网络模型的实例
2.3 贝叶斯网络的特点与功能
2.3.1 贝叶斯网络的特点
2.3.2 贝叶斯网络的功能与应用
2.4 贝叶斯网络的推理机制
2.5 贝叶斯网络结构学习的内容与方法
2.5.1 贝叶斯网络结构学习的内容与目标
2.5.2 贝叶斯网络结构学习的方法
2.6 本章小结
第三章 贝叶斯网络的条件独立性研究
3.1 引言
3.2 条件独立性
3.2.1 条件独立性的概念及其性质
3.2.2 互信息与条件独立性
3.2.3 互信息和相对熵用于结构学习
3.3 贝叶斯网络与条件独立性
3.3.1 无向图与依赖模型的关系
3.3.2 贝叶斯网络对条件独立性的表达
3.4 基于列联表的条件独立性检验
3.4.1 列联表的定义
3.4.2 列联表的独立性检验
3.4.3 列联表的条件独立性检验
3.4.4 独立性偏差和x~2统计检验的极限分布
3.5 本章小结
第四章 基于协同学的贝叶斯网络结构学习方法
4.1 引言
4.2 协同学理论
4.2.1 自组织
4.2.2 序参量
4.2.3 支配原理
4.2.4 协同学的基本思想与应用
4.3 基于协同学的贝叶斯网络结构学习方法
4.3.1 贝叶斯网络结构的属性
4.3.2 基于协同学的贝叶斯网络结构学习机制
4.3.3 结构似然的计算与问题求解
4.3.4 结构描述长度的计算与问题求解
4.4 贝叶斯网络结构优化与评估
4.4.1 基于互信息测度和CI检验的无向图构建
4.4.2 基于MAP/MDL集成准则的结构优化
4.5 本章小结
第五章 算法设计与实验分析
5.1 算法的理论基础与设计流程
5.1.1 算法的基本思路
5.1.2 算法的设计流程
5.2 潜在图(PG)算法
5.3 自治定向(AD)算法
5.4 归纳定向(ID)算法
5.5 结构优化(SR)算法
5.6 实例分析
5.6.1 学生升学计划网络模型
5.6.2 汽车故障诊断模型
5.7 本章小结
第六章 贝叶斯网络结构学习在数据挖掘中的应用
6.1 引言
6.2 数据挖掘的体系框架
6.2.1 数据准备体系
6.2.2 挖掘与建模体系
6.2.3 结果解释与评价体系
6.3 贝叶斯网络用于数据挖掘和知识发现
6.4 应用实例——基于贝叶斯网络的土地资源评价模型
6.4.1 随州市土地资源评价的贝叶斯网络模型
6.4.3 湖北省土地资源评价的贝叶斯网络模型
6.4.4 模型应用——通城县土地资源评价
6.5 结果分析
6.6 本章小结
第七章 结论与展望
7.1 主要研究工作与创新点
7.2 未来展望
7.3 结束语
参考文献
图索引
表索引
攻读博士期间发表论文及科研情况
致谢
发布时间: 2006-03-27
参考文献
- [1].数据挖掘方法及其在电力系统故障诊断中的应用研究[D]. 何友全.西南交通大学2004
- [2].智能融合数据挖掘方法及其应用[D]. 王天真.上海海事大学2006
- [3].单核苷酸多态性数据挖掘方法及其应用研究[D]. 李雄.湖南大学2015
- [4].正则化方法在数据挖掘中的应用与研究[D]. 姜彦.湖南大学2015
- [5].结合可视化与数据挖掘的数据分析方法探究[D]. 马昱欣.浙江大学2017
- [6].时间序列数据挖掘研究与应用[D]. 王达.浙江大学2004
- [7].粗糙集理论在数据挖掘领域中的应用[D]. 马昕.浙江大学2003
- [8].信息系统的约简与粒度分析及其在数据挖掘中的应用[D]. 王立宏.上海大学2004
- [9].序列数据挖掘的模型和算法研究[D]. 杨虎.重庆大学2003
- [10].数据挖掘相关算法的研究与平台实现[D]. 李秋丹.大连理工大学2004