基于视觉皮层网络的物体整体特征分析与算法研究

基于视觉皮层网络的物体整体特征分析与算法研究

论文摘要

人类的大部分信息都是通过视觉系统来获取的,所以关于视觉的研究成为探索人工智能的一个重要方向,它主要包括两大领域:生物视觉和计算机视觉。前者主要通过各种实验,来探索人类视觉系统的脑机制,理清视觉信息处理流程,以及每一步的功能特性;后者则希望借助于神经生物学上的研究成果,构建高效的物体检测和识别系统,从而服务于工业、农业、医疗、军事等各个领域。本文主要从计算机视觉的角度出发,研究如何利用现有的神经生物学上对视觉皮层网络的研究成果,构建视觉计算模型,提出相应的实现算法,并将这些方法应用于图像去噪、物体检测、物体识别以及场景分类等问题。本文的主要工作和创新点包括以下几个方面:1.一个完整的分层模型,一般都包含三个层次:信息表象层、局部特征群组层和整体特征层。本文在局部特征组合时引入任务相关的概念,即对于一个特定的识别任务,并不是所有的组合可能都是有效的,事实上有些组合特征虽然存在,但是对于某个任务在分类上并没有贡献,因此仅需考虑那些对分类问题有效的组合特征,我们将其定义为任务相关的局部组合特征,采用这种方法,可以大大减少局部特征的数量,在基本不降低识别效果的前提下显著的提高了计算效率。2.传统的LDA(Latent Dirichlet Allocation)算法起源于文本分析,而作为一种非常有效的特征提取方法,它在计算机视觉领域也有广泛的应用前景,特别是它为我们基于统计方法构建分层视觉模型提供了一种思路。但在两者的结合上一直有一个障碍,这就是传统LDA的基本单元“单词”是离散变量,而视觉信号一般被认为是连续变量。针对这个问题,本文大胆创新,将传统LDA模型的基本单元推广到连续变量,并与稀疏编码相结合提出了SCLDA(SparseCoding LDA)算法,该算法在解决场景分类和多类物体识别上取得了不错的效果。3.提出了一个卷积受限波尔兹曼机(Convolutional Restricted Boltz-mann Machines简称CRBM),它的可见层和隐含层都是服从高斯分布的连续随机变量,而一些传统的波尔兹曼机都是基于二值变量的。并且推导了相应的基于相对散度(contrastive divergence)的学习算法。在对隐含层变量加上稀疏性约束的前提下,通过对自然图像训练样本的学习,可以得到类似V1区简单细胞感受野的连接权值。一个经过训练的CRBM实际上相当于定义了一类图像的先验分布,基于这个先验分布我们设计了一个统计模型来描述被噪声污染的图像,从而推导出一种新型的快速去噪算法,该算法可以实时的对大图像进行去噪,而且去噪性能与目前最成功的一些算法接近。以上几项工作都是基于人脑视皮层网络的结构来设计提取物体整体特征的计算模型,本研究在给出模型框架的同时还给出了具体的实现算法,并针对各种应用问题进行了仿真实验。

论文目录

  • 摘要
  • ABSTRACT
  • 主要符号对照表
  • 第一章 绪论
  • 1.1 引言
  • 1.2 国内外研究进展综述
  • 1.2.1 视觉系统的神经生理学基础
  • 1.2.2 视觉计算理论
  • 1.2.3 视觉编码
  • 1.2.4 视觉计算模型
  • 1.3 本文研究内容及组织结构
  • 1.3.1 本文的研究目的
  • 1.3.2 本文的研究内容
  • 1.3.3 本文的组织结构
  • 第二章 视觉系统神经基础和计算模型
  • 2.1 生物视觉系统
  • 2.1.1 视觉通路
  • 2.1.2 神经元的感受野
  • 2.1.3 超完备表示和稀疏性
  • 2.2 稀疏编码
  • 2.2.1 稀疏编码的数学模型
  • 2.2.2 独立成分分析
  • 2.3 分层的视觉模型HMAX
  • 2.4 隐狄利克雷配置
  • 2.4.1 LDA的生成模型
  • 2.4.2 LDA的变分推理
  • 2.4.3 LDA的参数估计
  • 2.4.4 LDA在计算机视觉领域的应用
  • 2.5 波尔兹曼机
  • 2.5.1 模型结构
  • 2.5.1.1 能量极小化
  • 2.5.1.2 避免局部极值
  • 2.5.2 学习算法
  • 2.6 深层信念网络
  • 2.6.1 马尔科夫链和Gibbs采样
  • 2.6.1.1 马尔科夫链
  • 2.6.1.2 Gibbs采样
  • 2.6.2 受限波尔茨曼机
  • 2.6.3 相对散度学习
  • 2.6.4 逐层的贪心学习算法
  • 2.7 本章小结
  • 第三章 基于任务相关局部组合特征的物体识别
  • 3.1 引言
  • 3.2 模型和算法
  • 3.2.1 Gabor滤波
  • 3.2.2 基于互信息的特征选择算法
  • 3.2.2.1 基于互信息的特征选择简介
  • 3.2.2.2 预备知识
  • 3.2.2.3 算法描述和分析
  • 3.2.3 基于任务相关组合特征的分层模型
  • 3.3 实验结果分析
  • 3.3.1 特征选取
  • 3.3.2 物体检测
  • 3.3.3 多类物体分类
  • 3.4 讨论
  • 3.5 本章小结
  • 第四章 基于稀疏编码的分层隐主题模型及其应用
  • 4.1 引言
  • 4.2 基础知识
  • 4.2.1 狄利克雷分布
  • 4.2.2 图模型
  • 4.2.2.1 贝叶斯网络
  • 4.2.2.2 马尔科夫随机场
  • 4.2.3 EM算法
  • 4.2.4 变分推理
  • 4.3 模型和算法
  • 4.3.1 对自然图像小块的稀疏编码
  • 4.3.2 符号和术语的说明
  • 4.3.3 SCLDA的生成过程
  • 4.3.4 SCLDA的参数估计
  • 4.4 实验结果分析
  • 4.4.1 自然场景分类
  • 4.4.2 多类物体识别
  • 4.5 讨论
  • 4.6 本章小结
  • 第五章 带稀疏约束的卷积受限波尔茨曼机及其应用
  • 5.1 引言
  • 5.2 模型和算法
  • 5.2.1 受限波尔茨曼机
  • 5.2.2 相对散度学习
  • 5.2.3 卷积RBM
  • 5.2.4 连续随机变量的CRBM
  • 5.2.5 隐藏层单元的稀疏性
  • 5.3 稀疏CRBM在图像去噪上的应用
  • 5.3.1 去噪原理
  • 5.3.2 一次迭代的快速去噪算法
  • 5.3.3 参数对算法的影响分析
  • 5.3.3.1 硬阈值参数θ
  • 5.3.3.2 与稀疏性有关的参数λ和δ
  • 5.3.3.3 加权平均参数γ
  • 5.3.4 多次迭代的去噪算法
  • 5.4 讨论
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 本文的主要工作和创新点
  • 6.2 工作展望
  • 参考文献
  • 致谢
  • 个人简历、在学期间的研究成果及发表的论文
  • 上海交通大学博士学位论文答辩决议书
  • 相关论文文献

    • [1].算法:一种新的权力形态[J]. 治理现代化研究 2020(01)
    • [2].算法决策规制——以算法“解释权”为中心[J]. 现代法学 2020(01)
    • [3].面向宏观基本图的多模式交通路网分区算法[J]. 工业工程 2020(01)
    • [4].算法中的道德物化及问题反思[J]. 大连理工大学学报(社会科学版) 2020(01)
    • [5].算法解释请求权及其权利范畴研究[J]. 甘肃政法学院学报 2020(01)
    • [6].算法新闻的公共性建构研究——基于行动者网络理论的视角[J]. 人民论坛·学术前沿 2020(01)
    • [7].算法的法律性质:言论、商业秘密还是正当程序?[J]. 比较法研究 2020(02)
    • [8].关键词批评视野中的算法文化及其阈限性[J]. 学习与实践 2020(02)
    • [9].掌控还是被掌控——大数据时代有关算法分发的忧患与反思[J]. 新媒体研究 2020(04)
    • [10].美国算法治理政策与实施进路[J]. 环球法律评论 2020(03)
    • [11].算法解释权:科技与法律的双重视角[J]. 苏州大学学报(哲学社会科学版) 2020(02)
    • [12].大数据算法决策的问责与对策研究[J]. 现代情报 2020(06)
    • [13].大数据时代算法歧视的风险防控和法律规制[J]. 河南牧业经济学院学报 2020(02)
    • [14].风险防范下算法的监管路径研究[J]. 审计观察 2019(01)
    • [15].模糊的算法伦理水平——基于传媒业269名算法工程师的实证研究[J]. 新闻大学 2020(05)
    • [16].算法推荐新闻对用户的影响及对策[J]. 新媒体研究 2020(10)
    • [17].如何加强对算法的治理[J]. 国家治理 2020(27)
    • [18].“后真相”背后的算法权力及其公法规制路径[J]. 行政法学研究 2020(04)
    • [19].算法规制的谱系[J]. 中国法学 2020(03)
    • [20].论算法排他权:破除算法偏见的路径选择[J]. 政治与法律 2020(08)
    • [21].政务算法与公共价值:内涵、意义与问题[J]. 国家治理 2020(32)
    • [22].算法的法律规制研究[J]. 上海商业 2020(09)
    • [23].新闻算法分发对隐私权的冲击及规制[J]. 青年记者 2020(27)
    • [24].算法如何平等:算法歧视审查机制的建立[J]. 南海法学 2020(02)
    • [25].蚁群算法在文字识别中的应用研究[J]. 信息与电脑(理论版) 2019(22)
    • [26].大数据聚类算法研究[J]. 无线互联科技 2018(04)
    • [27].RSA算法的改进研究[J]. 计算机与网络 2018(14)
    • [28].智能时代的新内容革命[J]. 国际新闻界 2018(06)
    • [29].改进的负载均衡RSA算法[J]. 电脑知识与技术 2018(25)
    • [30].基于深度学习的视觉跟踪算法研究综述[J]. 计算机科学 2017(S1)

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    基于视觉皮层网络的物体整体特征分析与算法研究
    下载Doc文档

    猜你喜欢