高阶神经网络的梯度训练算法收敛性分析

高阶神经网络的梯度训练算法收敛性分析

论文摘要

传统的神经网络是由多层的求和单元构成的,例如多层感知器等.这些网络不但是学者们研究的热点并且已经在各个领域得到了广泛应用.由于求和单元自身的非线性映射能力有限,因此在解决复杂的问题时,单纯由求和单元构成的网络可能无法达到要求的精度.例如,尽管有结论指出,有求和单元构成的单隐层前馈网络可以以任意的精度逼近任意函数.但是在逼近某个复杂的函数时,网络的隐层中需要补充大量的求和单元.这不但增大了网络的成本,而且还降低了网络的泛化能力.为了克服这个缺点,人们引入了某些具有更强的非线性性质的单元,例如:Sigma-Pi单元,积单元和Pi-Sigma单元等.这些单元可以通称为高阶单元.在结构中整合了高阶单元的神经网络被称为高阶神经网络(HONN),其中包括Sigma-Pi神经网络(SPNN),Pi-Sigma神经网络(PSNN)以及积单元神经网络(Product-Unit neural network-PUNN)等.人们已经对各类高阶神经网络的性能以及应用做了相应的研究,但是由于高阶神经网络的结构复杂,因此对其理论上的研究相对较少.梯度算法是目前最流行的前馈神经网络训练算法.梯度法有两种不同的执行方式,它们是在线执行方式和批处理执行方式.本文主要的工作是分析用梯度法训练高阶神经网络的收敛性.我给出了Sigma-Pi神经网络和积单元神经网络的梯度法收敛性结果.此外,我还研究了用高阶神经网络来实现任意的布尔函数,并给出了有效地解决方案.本文的结构及内容如下:第一章回顾有关神经网络的一些背景知识.在第二章中,通过对Σ-Π-Σ这类Sigma-Pi神经网络的分析,得到了一些与网络结构无关的梯度算法收敛性结论.该结论具有很好的扩展性,可以涵盖其他几类Sigma-Pi神经网络的收敛性,其中包括Σ-Σ-Π和Σ-Π-Σ-Π.并且此结论也适用于单隐层的求和神经网络,即Σ-Σ.在论述的过程了,对于训练过程中的误差函数的单调性也给出了相应的证明.第三章和第四章分别对用批处理梯度算法和在线梯度算法训练积单元神经网络时误差函数的单调性及收敛性进行了分析.该结论为由全局搜索算法和局部优化算法(梯度法)构成的组合算法的局部优化行为提供了理论支持.随后的数值试验也验证了理论结果的正确性.第五章提出了二进积单元神经网络(Binary Product-Unit neural network-BPUNN),并证明了这种网络可以模拟逻辑数学中的主析取范式,可以实现任意的布尔函数.网络的权值是通过直接计算得到的,而且都是二值的.随后还给出了该网络的规则读取算法,可以令我们从已得的网络中直接得到真值样本的数学表达式.第六章提出了带有输入转换的二进Pi-Sigma神经网络(BPSNN),并证明了这种网络可以实现任意的布尔函数.该网络在计算布尔函数时,对应着主合取范式.网络权值都是{-1,1}这样二值的,而且网络的训练不需要多步迭代的过程,权值是直接求解得到的.随后还给出了此网络的规则读取算法.

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 人工神经网络简介
  • 1.1.1 人工神经网络的定义
  • 1.1.2 人工神经网络的发展历史
  • 1.1.3 人工神经网络的特性
  • 1.1.4 人工神经元
  • 1.1.5 人工神经网络的拓扑结构
  • 1.1.6 人工神经网络的一些研究问题
  • 1.1.7 人工神经网络研究的发展方向
  • 1.2 人工神经网络的学习算法
  • 1.2.1 人工神经网络的学习算法分类
  • 1.2.2 梯度下降算法
  • 1.3 高阶神经网络
  • 1.4 本文的主要工作
  • 2 三类Sigma-Pi神经网络的批处理梯度算法收敛性分析
  • 2.1 背景介绍
  • 2.2 Sigma-Pi神经网络
  • 2.2.1 Sigma-Pi单元
  • 2.2.2 Sigma-Pi神经网络的等价性
  • 2.2.3 Σ-Π-Σ网络
  • 2.2.4 用批处理梯度算法训练Σ-Π-Σ网络
  • 2.3 主要的收敛性定理
  • 2.4 引理及定理的证明
  • 3 用批处理梯度算法训练积单元神经网络的收敛性分析
  • 3.1 背景介绍
  • 3.2 具有幂指数权值结构的积单元神经网络(PUNN)
  • 3.3 用批处理梯度算法训练PUNN
  • 3.4 主要的收敛性定理
  • 3.5 数值试验
  • 3.6 引理及定理证明
  • 4 用在线梯度法训练积单元神经网络的收敛性分析
  • 4.1 背景介绍
  • 4.2 积单元神经网络(PVNN)
  • 4.3 用在线梯度算法训练积单元神经网络
  • 4.4 假设条件与重要的引理
  • 4.5 主要的收敛性定理
  • 4.6 数值试验
  • 4.7 引理与定理的证明
  • 5 用二进积单元神经网络实现任意布尔函数
  • 5.1 背景介绍
  • 5.2 布尔函数
  • 5.3 二进积单元和二进积单元神经网络
  • 5.3.1 二进积单元(Binary Product Unit-BPU)
  • 5.3.2 二进积单元神经网络(BPUNN)
  • 5.4 用BPUNN实现任意布尔函数
  • 5.4.1 模拟逻辑运算"∨"、"∧"和"(?)"
  • 5.4.2 主要定理及其证明
  • 5.4.3 构造可以实现任意N元布尔函数的BPUNN
  • 5.4.4 BPUNN的规则读取算法
  • 5.4.5 BPUNN的真值数据实时处理功能
  • 5.5 应用举例
  • 6 用二进Pi-Sigma神经网络实现任意布尔函数
  • 6.1 背景介绍
  • 6.2 布尔函数
  • 6.3 带有输入转换的二进Pi-Sigma神经网络
  • 6.3.1 BPSNN的隐节点
  • 6.3.2 带有输入转换的二进Pi-Sigma神经网络(BPSNN)
  • 6.4 用BPSNN实现任意布尔函数
  • 6.4.1 模拟逻辑运算"∨"、"∧"和"(?)"
  • 6.4.2 主要定理及其证明
  • N→{0,1}的BPSNN'>6.4.3 构造可以实现任意N元布尔函数f:{0,1}N→{0,1}的BPSNN
  • 6.4.4 BPSNN的规则读取算法
  • 6.4.5 BPSNN的真值数据实时处理功能
  • 6.5 应用举例
  • 结论
  • 参考文献
  • 攻读博士学位期间学术论文完成情况
  • 致谢
  • 作者简介
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    高阶神经网络的梯度训练算法收敛性分析
    下载Doc文档

    猜你喜欢