树型贝叶斯网络分类器鉴别式训练研究

树型贝叶斯网络分类器鉴别式训练研究

论文摘要

分类器是自动识别、预测与诊断系统等智能技术应用研究的基础,是数据挖掘和机器学习领域的一个主要研究对象.在众多分类模型中,贝叶斯网络分类器得到了多年的持续研究,综合性能不断提高.近年来,为了进一步提高其分类精度,一些研究人员开始研究其与贝叶斯网络学习算法的差异性.因为优化贝叶斯网络分类器的目的是提高分类器的精度与效率,而优化贝叶斯网络的目的是提高描述数据变量分布的能力,所以两者在有些方面存在很大的不同.一般来讲,学习算法的设计可以采用生成式策略或鉴别式策略.由于鉴别式策略采用的评价标准能够直接衡量分类器的精度,且能够对与实际数据变量分布有一定差异的网络结构进行调整,所以更适合应用于设计分类器学习算法.但是,鉴别式训练策略的优化目标函数缺乏良好的数学性质、学习的复杂度较高,所以需要结合其特点研究分类模型的设计,提高分类器的精度,减少训练的时间;需要分析新模型对环境和数据质量的依赖程度,研究其实际应用的价值.本文围绕一些实际问题深入研究了树型贝叶斯网络分类器(Tree-Structured Bayesian Network Classifier, TBNC),主要贡献如下:(1)研究得出鉴别式参数学习算法不适合在具有冗余边的树型贝叶斯网络结构上训练参数.首先,对贝叶斯网络结构与数据中变量的真实分布之间的关系进行了定量描述,将比真实分布复杂的网络结构定义为存在冗余边的网络结构;然后,用实验验证了冗余边存在的普遍性及其消极影响,说明了研究树型贝叶斯网络分类器分类器的价值;最后,基于对数条件似然函数偏导数的性质提出了一种消除网络结构中冗余边的RSD (Reducing Structure by Derivatives, RSD)算法,对网络结构进行优化,并用实验验证了该算法能够有效提高鉴别式参数学习算法在树型贝叶斯网络结构上训练得到的分类器的分类精度.(2)研究得出有相同结构底图的树型贝叶斯网络分类器等价.首先,分析了树型贝叶斯网络结构空间及其等价类,描述了具有相同底图的树型贝叶斯网络结构的等价关系和属性变量子网中边的方向无关性:然后,提出了一种树型贝叶斯网络分类器学习框架LFWAR (A Learning Framework of TBNC Without Considering Arc Reversal, LFWAR),实验验证了LFWAR得到的分类器的精度和稳定性在统计意义上无显著差异;最后,在场景分类问题的基准图像数据库上实验验证了应用属性变量子网中边的方向无关性设计的算法能够在不降低分类精度的前提下,减少分类引擎的训练时间.(3)研究得出树型贝叶斯网络分类器结构训练过程在多源非独立同分布数据上是健壮的.利用菲谢尔p值组合方法设计了一种应用于多源非独立同分布数据的分类器学习算法,来分析非独立同分布数据对树型贝叶斯网络分类器结构训练的影响.尽管在机器学习领域的研究成果表明贝叶斯网络结构训练会受到非独立同分布数据的较强影响,菲谢尔p值组合方法能够有效降低这种影响,但这种方法难以有效提高树型贝叶斯网络分类器的性能,因而表明在非独立同分布数据上的树型贝叶斯网络分类器结构训练过程是健壮的.(4)研究得出树型贝叶斯网络分类器鉴别式参数训练过程对噪声数据是敏感的,需要相应降噪策略.首先,将仅适用于二类值分类问题的集成贝叶斯网络参数学习扩展到适用于多类值分类问题的集成参数学习;然后,应用一种控制样本权重的方法抑制噪声数据的影响,且对多类值分类问题,提出了一种适用于处理不平衡数据样本的类别置信度量函数和降噪算法SmoothedBNB (Smoothed Bayesian Network Boosted Classifier, SmoothedBNB);最后,实验验证了控制样本权重的方法能够降低鉴别式参数训练过程的噪声敏感性,且所提的SmoothedBNB算法能够处理多类值分类器降噪时遇到的不平衡数据问题.这些结论从多种角度论述了应用于分类的贝叶斯网络与应用于描述性的贝叶斯网络的差异性,展示了树型贝叶斯网络分类器的应用价值,改善了鉴别式训练策略的适应性,为实际应用奠定了良好的理论基础.

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 目录
  • 图目录
  • 表目录
  • 第1章 绪论
  • 1.1 研究背景和意义
  • 1.2 树型贝叶斯网络分类器发展及现状
  • 1.3 存在的问题
  • 1.4 本文的研究内容
  • 1.5 论文组织
  • 第2章 树型贝叶斯网络分类器
  • 2.1 分类器
  • 2.1.1 分类器的定义
  • 2.1.2 分类器监督学习方法
  • 2.1.3 分类器的误分类率
  • 2.1.4 交叉验证法评估分类器的性能
  • 2.1.5 尾配对t检验评估两分类器性能的差异
  • 2.2 贝叶斯网络
  • 2.2.1 概率图
  • 2.2.2 贝叶斯网络
  • 2.2.3 贝叶斯网络中的条件独立性表示
  • 2.3 树型贝叶斯网络分类器
  • 2.3.1 贝叶斯网络分类器
  • 2.3.2 朴素贝叶斯分类器及其简单拓展
  • 2.3.3 树型贝叶斯网络分类器TBNC
  • 2.4 本章小结
  • 第3章 树型贝叶斯网络分类器冗余边的研究及消除算法
  • 3.1 引言
  • 3.2 学习策略
  • 3.2.1 生成式学习策略
  • 3.2.2 鉴别式学习策略
  • 3.3 冗余结构的缺陷研究
  • 3.3.1 网络结构与变量分布关系的定量描述
  • 3.3.2 冗余结构的普遍存在性与缺陷实验
  • 3.4 冗余结构消除算法RSD
  • 3.4.1 基于对数条件似然函数偏导数的RSD算法
  • 3.4.2 RSD算法的性能实验
  • 3.5 本章小结
  • 第4章 同底图树型贝叶斯网络分类器等价研究及应用
  • 4.1 引言
  • 4.2 贝叶斯网络的等价性
  • 4.3 同底图树型贝叶斯网络分类器的等价性
  • 4.3.1 树型贝叶斯网络结构空间
  • 4.3.2 树型贝叶斯网络分类器结构等价类空间
  • 4.4 树型贝叶斯网络分类器学习框架LFWAR
  • 4.4.1 LFWAR学习框架
  • 4.4.2 LFWAR有效性实验
  • 4.5 场景分类中LFWAR的效应
  • 4.5.1 场景分类学习基本原理
  • 4.5.2 SCL算法
  • 4.5.3 SCL算法效率实验
  • 4.6 本章小结
  • 第5章 基于非独立同分布多源数据的结构学习健壮性研究
  • 5.1 引言
  • 5.2 非对立同分布数据统计合并方法
  • 5.3 TBCND算法
  • 5.4 基于非独立同分布数据的结构学习健壮性实验
  • 5.5 本章小结
  • 第6章 基于集成方法的多类值分类器参数学习及降噪算法
  • 6.1 引言
  • 6.2 树型贝叶斯网络分类器参数集成学习
  • 6.2.1 指数损失函数与对数条件似然函数的一致性
  • 6.2.2 类值分类器参数集成学习
  • 6.3 基于集成方法的多类值参数学习扩展
  • 6.4 基于集成学习的参数学习降噪算法
  • 6.4.1 二类值参数学习降噪算法
  • 6.4.2 多类值不平衡数据参数学习降噪算法SmoothedBNB
  • 6.5 分类器参数学习降噪实验
  • 6.6 本章小结
  • 第7章 总结与展望
  • 7.1 研究工作总结
  • 7.2 未来工作展望
  • 参考文献
  • 攻读学位期间发表和录用的论文
  • 学位论文数据集
  • 相关论文文献

    • [1].基于动态分类器集成系统的卷烟感官质量预测方法[J]. 计算机应用与软件 2020(01)
    • [2].基于标准数据集的分类器融合学习模型[J]. 微型电脑应用 2020(04)
    • [3].一种自适应子融合集成多分类器方法[J]. 计算机测量与控制 2019(04)
    • [4].基于多分类器融合的近红外光谱技术鉴别蜂蜜品种[J]. 化学分析计量 2019(03)
    • [5].基于分类器的身份证号码识别研究[J]. 贵州科学 2018(01)
    • [6].一种基于多分类器融合的人体运动行为识别模型[J]. 计算机科学 2016(12)
    • [7].一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版) 2017(02)
    • [8].一种代价敏感的三类分类器评估方法的研究与应用[J]. 通化师范学院学报 2017(08)
    • [9].基于多分类器组合的遥感土地利用分类研究[J]. 安徽农业科学 2015(32)
    • [10].多分类器融合与单分类器影像分类比较研究[J]. 矿山测量 2016(04)
    • [11].《未来垃圾分类器》[J]. 幼儿教育 2020(14)
    • [12].基于多分类器组合的城市不透水面提取研究[J]. 城市地理 2017(04)
    • [13].《垃圾分类器》[J]. 辅导员 2016(11)
    • [14].多分类器融合的遥感影像分类方法实验研究[J]. 全球定位系统 2020(05)
    • [15].一种基于核聚类的多分类器选择算法[J]. 电子技术与软件工程 2020(13)
    • [16].基于一种新的级联分类器的目标检测系统[J]. 现代电子技术 2020(01)
    • [17].最佳的分类器链局部检测与挖掘算法[J]. 计算机工程与设计 2017(11)
    • [18].基于多分类器融合与模糊综合评判的滚动轴承故障诊断[J]. 中国科技论文 2016(04)
    • [19].近红外光谱和多分类器融合的葡萄酒品种判别研究[J]. 光谱学与光谱分析 2016(11)
    • [20].基于多分类器集成的语音情感识别[J]. 微电子学与计算机 2015(07)
    • [21].基于集成分类器的流量识别技术研究[J]. 科技视界 2015(33)
    • [22].二叉树型多分类器融合的轴承故障诊断方法[J]. 计算机工程与应用 2015(21)
    • [23].智能垃圾分类器[J]. 科学启蒙 2013(12)
    • [24].一种新的多分类器融合方法[J]. 西南师范大学学报(自然科学版) 2014(01)
    • [25].动态加权投票的多分类器聚合[J]. 现代计算机(专业版) 2014(05)
    • [26].面向用户观点分析的多分类器集成和优化技术[J]. 计算机学报 2013(08)
    • [27].基于证据理论的优化集成分类器融合算法及应用[J]. 化工学报 2012(09)
    • [28].多类不平衡数据上的分类器性能比较研究[J]. 计算机工程 2011(10)
    • [29].基于多分类器融合的语音识别方法研究[J]. 重庆邮电大学学报(自然科学版) 2011(04)
    • [30].基于粗糙集约简的多分类器系统构造方法[J]. 计算机工程与应用 2010(03)

    标签:;  ;  ;  ;  ;  

    树型贝叶斯网络分类器鉴别式训练研究
    下载Doc文档

    猜你喜欢