带惩罚项的BP神经网络训练算法的收敛性

带惩罚项的BP神经网络训练算法的收敛性

论文摘要

前馈神经网络在许多领域有着广泛的应用。网络的泛化能力,即网络正确预测训练集之外样本的能力,是衡量神经网络性能的一个重要指标。研究表明,满足训练样本集上逼近精度的规模最小的网络具有较好的泛化能力[1-7]。 网络修剪是得到上述小网络的有效途径之一,它包括直接修剪法和惩罚项法。直接修剪法是指从一个很大的足够解决当前问题的网络开始,在训练结束后通过选择或有序的方式删除一些不重要或敏感度较小的连接权和神经元节点[3,8,9]。不过,该方法破坏了网络结构,往往使得网络训练需要很长的时间。惩罚项方法是一种间接修剪网络的办法,其原理是在传统的误差函数中加入一衡量网络结构复杂程度的“复杂度项”。应用到权值更新规则后,该项在训练过程中起到防止权值增长太大和驱使不重要权值逐渐减小到零的作用。尽管那些接近零的连接权没有从网络中被删除。但它们对网络输出几乎没有影响,已相当于从网络中被删除了。这样一来,训练后的神经网络实际上已是被修剪过的小网络了。可见,惩罚项法在没有破坏网络结构的同时又达到网络修剪的目的,从而是提高神经网络泛化能力的一个重要方法。 已有许多文献研究了多种不同形式的惩罚项[1-3,6,10-13],但他们中的大多数是在实验的基础上对惩罚项的性能进行研究的,并没有在数学上给出理论证明。本文从理论上分析了惩罚项对权值的压制作用,从而为以上实验观察结果提供了理论依据。反向传播算法(BP算法)是一种简单又常用的神经网络训练算法,它有批处理和在线两种运行模式。本文主要研究在批处理和在线两种运行模式下,带weigh-decay和inner-product惩罚项的BP算法的收敛性以及引入惩罚项后网络权值的一致有界性。本论文的结构安排如下: 第一章回顾一些有关神经网络的背景知识,第二章介绍几种常见的惩罚项,包括weight-decay惩罚项、weight-elimination惩罚项和inner-product惩罚项等。 第三章主要讨论带weigh-decay惩罚项的批处理BP算法和改进的批处理BP算法的收敛性。对于前者,我们给出惩罚项系数和学习率之间的一个确定的数学表达式,并证明在此条件下误差函数的单调下降、训练算法的收敛和训练过程中权值的一致有界。对于改进后的BP算法,我们不仅证明了一种变学习率的BP算法的收敛性,还考虑了带动量项的BP算法的收敛性问题。 第四章研究带weigh-decay惩罚项的在线BP算法的收敛性。在线学习方式下,训练样本在一个训练回合中呈现给网络的方式分为固定顺序和随机顺序两种。这一章我们证明在线运行方式下,当训练样本以固定顺序呈现给神经网络时带weigh-decay惩罚项的在线BP算法的收敛性。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 神经网络概述
  • 1.1.1 神经网络的特征与工作原理
  • 1.1.2 神经网络的拓扑结构
  • 1.1.3 神经网络的学习
  • 1.1.4 神经网络的几个研究课题
  • 1.2 提高神经网络泛化能力的方法
  • 1.2.1 网络结构优化算法
  • 1.2.2 训练的早期停止法
  • 1.3 前馈神经网络
  • 1.3.1 感知器网络结构及工作原理
  • 1.3.2 BP算法的批处理和在线运行
  • 1.4 本文的主要工作
  • 2 惩罚项简介
  • 2.1 Weight-decay简介
  • 2.2 Weight-elimination简介
  • 2.3 Combination of Weight-decay and Weight-elimination简介
  • 2.4 Structural Learning with Forgetting简介
  • 2.5 Inner-product简介
  • 3 批处理BP算法的收敛性
  • 3.1 带weight-decay惩罚项的批处理BP算法及收敛结果
  • 3.1.1 带weight-decay惩罚项的批处理BP算法
  • 3.1.2 重要定理及证明
  • 3.1.3 数值试验结果
  • 3.2 改进的BP算法及收敛性
  • 3.2.1 变学习率的BP算法及收敛性
  • 3.2.2 带动量项的BP算法及收敛性
  • 4 带Weight-decay惩罚项的在线BP算法的收敛性
  • 4.1 带weight-decay惩罚项的在线BP算法
  • 4.2 假设条件与重要引理
  • 4.3 重要定理及证明
  • 4.4 数值试验结果
  • 5 带Inner-product惩罚项的随机在线梯度算法的收敛性
  • 5.1 带inner-product惩罚项的在线梯度算法
  • 5.2 预备引理
  • 5.3 重要定理及证明
  • 6 从弱收敛到强收敛
  • 6.1 预备引理和强收敛分析
  • 6.2 收敛定理和简要证明
  • 结论与展望
  • 参考文献
  • 攻读博士学位期间学术论文完成情况
  • 论文创新点摘要
  • 致谢
  • 相关论文文献

    • [1].基于BP神经网络对地震前兆的研究[J]. 科学技术创新 2019(33)
    • [2].基于BP神经网络的涡轴发动机故障诊断研究[J]. 智库时代 2019(52)
    • [3].基于BP神经网络的磁流变阻尼器逆向模型研究[J]. 海军工程大学学报 2019(06)
    • [4].基于BP神经网络的电梯噪声评价方法[J]. 数字技术与应用 2019(12)
    • [5].基于BP神经网络和支持向量机的荨麻疹证候分类探讨[J]. 广州中医药大学学报 2020(03)
    • [6].基于BP神经网络代理模型的交互式遗传算法[J]. 计算机工程与应用 2020(02)
    • [7].基于BP神经网络的虚拟机评估[J]. 数字通信世界 2020(01)
    • [8].基于BP神经网络的科研项目经费管理风险评估[J]. 财务与会计 2019(22)
    • [9].基于BP神经网络的断层封闭性评价[J]. 复杂油气藏 2019(04)
    • [10].基于BP神经网络识别的曲堤油田低阻油层研究[J]. 宁夏大学学报(自然科学版) 2020(01)
    • [11].基于贝叶斯-BP神经网络的机械制造企业安全预警方法研究[J]. 安全与环境工程 2020(01)
    • [12].基于BP神经网络的扇区空管运行亚健康关联因子预测[J]. 安全与环境工程 2020(02)
    • [13].基于改进灰狼算法优化BP神经网络的短时交通流预测模型[J]. 交通运输系统工程与信息 2020(02)
    • [14].心理护理对于双相情感障碍(BP)病患认知功能产生的影响[J]. 临床医药文献电子杂志 2020(08)
    • [15].BP神经网络在雷达故障诊断中的应用[J]. 通信电源技术 2020(06)
    • [16].基于BP人工神经网络的英那河流域径流模拟研究[J]. 黑龙江水利科技 2020(03)
    • [17].基于BP神经网络的节能车弯道降速数学模型分析[J]. 汽车实用技术 2020(10)
    • [18].基于BP神经网络的临床路径优化[J]. 计算机技术与发展 2020(04)
    • [19].基于改进BP神经网络的羊肉价格预测[J]. 计算机仿真 2020(04)
    • [20].财务BP在企业管理中的应用与研究[J]. 商场现代化 2020(07)
    • [21].人工智能技术的热带气旋预报综述(之一)——BP神经网络和集成方法的热带气旋预报研究和业务应用[J]. 气象研究与应用 2020(02)
    • [22].基于改进BP神经网络的岩心图像分割方法研究[J]. 西安石油大学学报(自然科学版) 2020(04)
    • [23].基于BP神经网络的光纤陀螺误差补偿方法[J]. 物理与工程 2020(04)
    • [24].基于主成分分析和BP神经网络对大学生价值观的研究[J]. 科技经济导刊 2020(20)
    • [25].基于粒子群算法的BP模型在地下水位埋深预测研究中的应用[J]. 吉林水利 2020(08)
    • [26].基于BP神经网络的煤炭企业人岗匹配研究[J]. 煤炭经济研究 2020(07)
    • [27].基于改进BP神经网络的飞行落地剩油预测方法[J]. 飞行力学 2020(04)
    • [28].基于BP神经网络的网络安全态势预测[J]. 网络安全技术与应用 2020(10)
    • [29].以财务BP制度推进“业财融合”的研究[J]. 中国总会计师 2020(09)
    • [30].财务BP的企业实践研究[J]. 现代国企研究 2019(04)

    标签:;  ;  ;  ;  ;  

    带惩罚项的BP神经网络训练算法的收敛性
    下载Doc文档

    猜你喜欢