一、视频编码算法的研究与标准的实现(论文文献综述)
孙海超[1](2021)在《基于HEVC的超高清视频压缩算法研究》文中指出随着社会的飞速发展和宇航技术的不断进步,对高清和超高清视频的需求量越来越大,产生的数据量也越来越多,这给视频传输及空间存储都带来了巨大的成本。所以高清和超高清视频压缩编码是必不可少的技术手段。同时视频压缩编码的性能和复杂度也直接影响着高清和超高视频的应用范围和潜力。因此在保持一定视频质量的情况下,提高视频编码的压缩比,降低视频编码的复杂度是亟需解决的问题。作为新一代高效视频编码标准,HEVC相比于上一代视频压缩编码H.264节省50%左右数据量。然而随着高清和超高清视频的发展和普及,分辨率越来越来大,数量越来越多,并且还要在具有高误码率、带宽有限等特点的空间通信系统中进行视频传输,无疑对视频编码性能和视频传输可靠性提出了更大的挑战。因此,研究如何提高视频压缩编码性能,以及在空间通信系统中进行可靠的视频传输具有很高的应用价值和研究价值。本文针对基于HEVC的视频压缩编码标准以及在空间通信系统中的视频传输进行了深入研究和分析,取得的主要研究成果如下:(1)针对在保证一定视频质量的情况下,需要降低压缩数据量以满足通信带宽有限的问题,本文从消除数据统计冗余的角度,提出了一种基于Bandelet变换的视频压缩算法。该算法通过拉格朗日方法,并结合四叉树划分,以获得DCT变换系数的最优Bandelet基,从而实现对变换系数的最佳稀疏表达,提高压缩比。仿真结果表明,本算法在保证视频质量不变的条件下,能够平均降低约8%的码流。(2)针对HEVC标准进行高清和超清视频的视频压缩时,计算复杂度大幅度增大的问题,本文提出了一种用于全I帧压缩模式的基于相关性的快速帧内预测的压缩算法和一种用于低延时压缩模式的混合编码框架的快速压缩算法。基于相关性的快速帧内预测的压缩算法利用当前编码单元和相邻单元的相关性去除小概率的预测深度,从而减少遍历预测深度的次数。同时通过建立帧内预测模式候选表,利用预测模式的相关性,提出了一种分层搜索的模式预测方法,从而减少遍历帧内预测模式的次数。仿真结果表明,该算法仅以损失约1.2%的视频质量为代价,减少了约34.2%的视频编码时间。混合编码框架的快速压缩算法结合了静态背景视频的特点,采用运动目标检测算法提取出背景区域和运动区域。运动区域采用已提出的快速帧内预测算法和标准的帧间预测方法,背景区域利用相邻帧的相关性进行帧内预测和帧间预测。仿真结果表明,改进的混合框架快速压缩算法也仅以损失约1.6%的视频质量为代价,减少了约44.6%的编码时间。同时本文利用运动目标检测算法提取的划分区域,采用不均等的量化阈值对不同区域进行视频压缩,以提升人们对感兴趣区域的高质量的视觉需求。(3)针对空间通信系统视频传输过程中数据包丢失或错误引起的失真的问题,本文利用极化码中每个比特通道的可靠度不同,提出了一种基于极化码的不均等差错保护算法。采用一种降维的搜索算法,实现近似最优的极化码构造,以提升极化码的性能。通过对不同重要程度的压缩数据采用可靠度不同的比特信道进行保护,以降低空间通信系统视频传输对视频失真的影响。仿真结果表明,在相同信道条件下与均等保护算法相比,能够获得更好的视频质量。
周德登[2](2021)在《基于H.266视频编码的帧间预测技术研究》文中进行了进一步梳理随着5G技术的发展与应用,高质量视频传输需求的更加迫切,而视频编码技术能将海量视频数据压缩形成视频码流,解决视频高效传输和存储问题。H.266/VVC(Versatile Video Coding)作为新一代视频编码,能够在上一代视频编码基础上大幅度提升编码质量。帧间预测技术是视频编码框架中相当重要的环节,可大幅提升视频压缩率,剔除视频数据中的时间冗余。本文对帧间预测技术深入研究,主要从编码块划分以及运动估计(Motion Estimation,ME)两方面展开工作,以实现降低编码时间消耗并提高编码速度的目标。(1)H.266/VVC引入了嵌套多类型树的四叉树块划分(Quadtree with Nested Multi-type Tree,QTMT),将块划分方式增加到了六种,能够适应更加灵活的视频,但是块划分时间也大幅度增加。针对上述问题,本文提出了基于视频图像纹理的I帧快速块划分决策技术,该技术通过Sobel边缘检测判断视频图像纹理的方向来减少几种块划分方式。同时,本文提出了基于视频图像相似度的P帧快速块划分决策技术,该技术通过哈希算法判断当前块和参考块的相似度来判断当前块是否参与运动,以此来决定是否跳过当前块后续的块划分操作。(2)帧间预测中最为耗时的部分是运动估计模块,运动估计是当前帧像素块在参考帧中寻找最佳匹配块的过程。当前编码标准中使用的是菱形搜索模型或六边形搜索模型。菱形搜索模型准确性高,耗时长,六边形搜索模型准确性不如菱形搜索模型,但比菱形搜索模型节省时间。针对以上问题,本文在六边形搜索模型基础上提出的旋转六边形搜索模型同时兼具准确性和低耗时的特点。根据统计结果显示,运动估计很大程度上会在搜索起始点得到最优匹配块,本文使用了双向增强小钻石模型来进一步降低运动估计耗时。实验结果表明,与VTM7.0原始算法相比,在保证视频图像质量基本不变的情况下,块划分阶段I帧编码时间平均减少39.02%,码率平均上升0.75%;P帧编码时间平均减少32.54%,码率平均上升1.22%;在运动估计阶段,编码时间平均减少51.55%,码率平均上升0.18%。在帧间预测编码测试联合算法时,整体编码时间平均减少60.19%,码率仅上升1.61%,编码效率得到了显着提升。
陶浩然[3](2021)在《基于VVC的视频帧内预测编码技术研究》文中研究表明为了满足人们不断增长的对高质量低码率视频的需求,研究新一代视频编码标准取代HEVC(High Efficiency Video Coding)是重要途径。而VVC(Versatile Video Coding)作为新一代多功能视频编码标准,它拥有比HEVC更广泛的应用场景。VVC为了提高编码质量,在各个模块增加了多种核心技术。但是,新增的技术会导致VVC存在编码计算复杂度高、编码时间长等问题。本课题目的就是提高VVC编码速度,以拓宽VVC应用领域。VVC依然采用混合编码框架。本论文主要研究框架中的帧内编码技术。由于在VVC帧内块划分中,现有算法没有充分利用空域信息;而在VVC模式决策上,复杂度依然较高,仍存在优化空间。针对上述问题,本文在VVC编码标准的编码块划分以及模式抉择任务中做了深入研究,主要工作如下:(1)概况性地阐述了视频编码发展过程以及技术研究现状,描述了VVC的编码框架及相应的编码原理。详细分析了帧内预测编码的编码块划分和模式预测过程,为本文的深入研究奠定框架基础。(2)编码块划分中,为了降低VVC帧内预测编码单元划分的计算复杂度,提出了基于梯度幅值相似度的编码块快速划分方法。首先,计算当前编码单元下层的四个子编码单元平均梯度幅值相似度偏差来确定当前编码单元进行四叉树划分或不划分。其次,当不满足以上划分条件时,通过遍历得到多类型树划分的子块像素方差的方差,基于此信息来选择多类型树中最佳的划分方式,避免了原划分方式中六种固定类型划分情形。(3)模式抉择中,在统计分析编码块模式决策过程的规律基础上,提出了一种基于梯度方向信息的帧内预测模式快速抉择算法。利用图像块纹理像素特征,将VVC帧内的67种模式划分为四个方向的模式集,通过判断当前块的纹理方向值将其归类,减少进入VVC粗选阶段的模式数量,进而提高了抉择速度。通过实验结果验证了本文算法性能的优劣。与标准测试模型7.0(VVC Test Model,VTM)编码器原有算法相比,在视频序列的全帧内编码时,本文所提算法在保证图像质量基本不变下,减少了57.91%的时间消耗,而码率只上升了1.79%。
姜天勇[4](2021)在《基于机器学习的分布式视频编码研究》文中研究指明随着人们对视频业务使用的不断加,越来越多新的要求在实际生产被提出。移动视频设备、军用无源视频设备、监控设备等一系列应用场景要求视频编码系统具有码率尽可能的低,编码端尽可能的简单的特点。为了应对这些需求,分布式视频编码(Distributed Video Coding,DVC)应运而生。分布式视频编码是一种基于分布式信源编码(Distributed Source Cording,DCS)的编码方式,与传统视频编码MPGE、H.264不同的是分布式视频编码采用独立编码-联合解码的编解码方式,在编码端每一帧独立编码,把传统视频编码中复杂的运动估计从编码端转移到解码端,很大程度上降低了编码端的复杂性。而在解码端仅需要较少的非关键帧信息,便可以完成对运动估计生成的边信息优化,从而达到降低码率的目的。本文主要就分布式视频编码小波域高阶建模并结合机器学习技术进行研究,主要研究内容如下:1)在以往DVC研究的基础上,针对传统常用的DVC框架不能有效的利用视频中的高阶信息的问题,本文使用经典边信息生成算法,提出一种可以充分使用视频高阶信息,并能够方便的和机器学习算法相结合的改进框架。2)本文在研究过程中,针对当前分布式视频编码系统在非关键帧重构过程中只使用视频时域特征及空域特征等低阶的特征的问题。受JPEG2000的显着性传播传递(Signifificance Propagation Pass,SPP)和震级细化传递(Magnitude Refifinement Pass,MRP)思想所启发,研究要解码的当前系数与其相邻系数之间的位平面级相关性,使用AdaBoost集成学习方式,结合CART决策树,形成一种提升树算法,提出视频中的基于AdaBoost的高阶特征建模算法(High-Order Model Base AdaBoost,HOMBAB)。并结合基于小波域的DVC,选取四个不同运动强度的视频序列进行仿真,证明该方式的合理性。3)利用HOMBAB,使用本文提出DVC框架,提出新的DVC算法。该算法分利用了小波变换后视频在高阶域中的特征向量,通过使用AdaBoost算法完成分类器的构建,最终得到结果优于未对其高阶特征进行学习的方式。本文从主观视频质量和客观视频质量两个方面评估算法。实验结果表明本文所提出的HOBAB-DVC在主观视频质量上可以还原出更丰富的细节,在客观指标方面,码率平均节省15%,PSNR有0.3到1.5d B的提升。
曹莹[5](2020)在《面向智能视频监控场景的感知优化与内容分析算法研究》文中认为智能视频监控系统改变了原有视频监控系统中基于人工的监控画面监视和内容分析模式,在一定程度上为视频监控提供了更加广阔的前景和发展空间。但如何通过普通感知设备获取有价值的目标信息是当前智能视频监控系统的核心问题之一。为解决这一问题,基于分布式视频编码和视频修复研究感知优化方案以获得具有较高质量的感知视频数据。继而在视频目标分割算法的基础上研究内容分析方案,以实现对海量感知视频目标信息的可靠提取。本文主要工作如下:1)基于预测的分布式视频编码优化算法研究。根据采用无线多媒体技术的智能视频监控系统对感知设备低功耗、高效率的要求,研究分布式视频编码方案,并针对分布式视频编码方案受视频背景环境、目标运动等干扰因素影响造成的解码数据质量下降问题,提出基于预测的边信息生成算法。所提算法首先根据视频块属性和视频块间的运动关系建立边信息预测模型;而后基于边信息预测模型,以视频块为单位,根据视频块属性得到较准确的运动矢量,进而提高边信息质量。仿真实验表明所提方法能够在满足采用无线多媒体技术的智能视频监控系统要求的同时,缓解视频背景环境、目标运动等对边信息质量的干扰,从而提高解码感知视频质量。2)基于张量列秩的视频修复算法研究。为解决普通感知设备受光照、天气等因素影响造成的数据质量下降问题,研究视频修复算法,并针对数据退化现象中的数据缺失问题,提出基于张量列秩(Tensor Train rank,TT-rank)的视频补全算法。在所提算法中,首先考虑视频中可能存在的数据分布不平衡及数据信息冗余问题,采用近似张量求解算法调整张量数据,得到只保留重要信息的且信息分布较均衡合理的张量数据。其次,为更好地映射视频信息在修复过程中的影响,根据张量数据特征提出自适应权重机制得到每一维数据相应的权重值。理论分析和仿真实验表明所提算法能够在避免更换昂贵感知设备的同时实现对感知视频数据质量的优化3)基于吸收马尔科夫链的感知视频片段目标分割算法研究。在获取具有较高质量的感知视频数据后,在内容分析中,为建立面向海量感知视频数据的自适应目标分割模型,首先针对感知视频片段设计基于吸收马尔科夫链的视频目标分割算法,在目标较剧烈运动、较大形变等因素的干扰下,通过对时空域特征的充分考虑实现对感知视频片段目标的有效分割,并将分割结果作为标记数据用于感知视频目标分割方案中,以实现对海量感知视频目标的自适应分割。所提方案首先利用目标选块和边权重模型搭建吸收马尔科夫链有向图;其次,设计再筛选机制,根据利用吸收时间完成初次筛选后的目标选块的时空域特征,确定每张视频帧唯一的目标选块,并结合优化模型细化目标选块,以得到分割目标。仿真实验表明所提目标分割算法能够充分利用感知视频片段的时空域特征,从具有较剧烈目标运动、较大目标形变等干扰因素的感知视频片段中有效分割视频目标,为感知视频目标分割方法提供较准确的标记数据。4)基于注意力机制的感知视频目标分割算法研究。针对感知视频提出基于注意力机制的视频目标分割算法,结合感知视频片段目标分割算法,建立面向海量感知视频数据的自适应目标分割模型,通过对视频目标时域特征的充分考虑,来应对感知视频目标运动、目标形变等干扰因素的负面影响,实现对海量感知视频目标信息的可靠提取。所设计方案具有两个分支:深度网络模型和光流预测模型。深度网络模型首先利用注意力机制突出视频目标相关特征;继而采用三维卷积和基于注意力机制的残差卷积长短时记忆网络以更好地获得目标时域特征。与此同时设计光流预测模型以降低背景运动对目标分割性能的影响。最后,采用残余区域清除算法清除分割结果中的非目标区域,得到分割目标。仿真实验表明,结合得到的标记数据,所提视频目标分割算法能够充分考虑感知视频时域特征,在视频目标运动、形变等的干扰下,完成对海量感知视频目标的自适应分割,实现海量感知视频数据目标信息的可靠提取。
姜晓鹏[6](2020)在《基于视觉显着性的HEVC快速帧间预测算法研究》文中认为高效视频编码(High Efficiency Video Coding,HEVC)是目前最新的视频编码标准,继承自H.264/AVC,通过引入新的技术,使得在保持良好视频质量前提下进一步提高编码效率。相对于H.264标准,HEVC在帧间预测模块采用了新的合并(Merge)模式、增加了灵活的块划分以及更合理的子像素插值算法,编码的性能也有所提高,但是编码的计算复杂度随之增加。因此,在保证编码效率的前提下,有效降低编码复杂度,是拓展HEVC编码标准在视频通信领域应用的关键。本文围绕HEVC帧间预测快速编码技术进行研究,优化了编码单元(Coding Unit,CU)划分和模式选择算法,降低了帧间预测编码复杂度。本文创新点主要包括以下几方面:(1)提出了一种基于残差分布的HEVC快速深度终止算法,在第一个阶段获得CU执行完Inter_2N×2N模式后的残差值,然后根据实际编码深度进行分类,并以高斯分布进行建模;第二阶段,以Inter_2N×2N模式完成后的残差均值为特征,计算残差在高斯分布中的概率并根据概率大小确定当前CU是否分割。(2)提出了一种基于多参考帧的HEVC帧间预测深度决策算法。首先计算每个编码树单元(Coding Tree Unit,CTU)与其参考帧列表中索引最小的两个参考帧的同位CTU的结构相似性(Structural Similarity,SSIM)值;然后以SSIM值为权重对同位CTU深度进行加权预测当前CTU的深度范围,同时利用父子CU信息相关性,提出一种快速参考帧选取算法,该算法根据父CU的最佳模式和编码信息确定当前CU的最佳参考帧。(3)提出了一种基于显着度的帧间预测优化算法。在CU深度划分方面,本文利用显着度检测模型得到当前帧中所有CTU的空域全局和局部显着度,并最终得到CTU的空域显着度值,并建立显着度值与显着度区域的对应关系,最终根据显着区域设置CTU深度范围。在帧间模式预测方面,计算CU内4×4块的显着度并做二值化处理,然后计算预测单元(Prediction Unit,PU)划分后各图像块中显着块的比例,并根据阈值确定是否执行某PU模式,该方案可以有效地避免在不必要模式的时间消耗。大量实验表明:本文提出的深度决策算法可以在保持视频客观质量的同时有效降低帧间编码复杂度;本文提出的基于显着度的帧间编码优化方案在保持客观视频质量和主观视频质量同时有效降低帧间编码复杂度。
张儒依[7](2020)在《面向3D-HEVC的低复杂度编码方法研究》文中指出视频作为信息呈现和传播的主要载体,已成为满足人民群众美好生活需求、推动信息技术产业和经济社会创新发展的重要引擎。其中,三维(ThreeDimensional,3D)视频由于其能够提供极具临场感、沉浸感的立体视觉体验,在娱乐、医学、教育等领域均发挥了重要作用,并展现出广阔的应用前景。为了满足人们对于观看舒适度和观看自由度的需求,多视点视频加深度(MVD)格式应运而生,该视频格式可以在原始视点间合成新的虚拟视点,从而提供视点范围更广的多视点视频序列。2015年2月,国际3D视频编码联合工作组(JCT-3V)颁布了基于新一代2D视频标准HEVC的3D视频编码扩展标准3D-HEVC,旨在提升MVD格式视频的压缩效率。但3D-HEVC在保证编码器性能及合成虚拟视点质量的同时,由于引入了许多先进的编码技术而导致编码器计算复杂度激增,严重阻碍了3D-HEVC标准的应用与推广。因此,如何采取有效方法对视频进行高质、高效的压缩编码是目前3D视频处理技术中面临的新挑战。本文以3DHEVC标准为研究对象,HTM为研究平台,以加速3D-HEVC中最为耗时的帧内和帧间编码过程为研究目标,力求在3D视频低复杂度编码方面的理论研究及应用实践上取得新突破。论文主要研究内容与成果如下:1.提出一种基于边缘检测的深度图帧内预测模式快速选择算法。以合理简化深度图帧内预测单元候选模式集为出发点,并以当前帧内预测单元最优模式与其纹理边缘方向和纹理复杂度的关联关系为依据,设计了基于边缘检测的粗模式决策候选模式集简化策略。基于该策略设计实现的快速算法与3D-HEVC标准测试模型HTM-16.0相比较,可在保证深度图及合成的虚拟视点质量的前提下,加速深度图帧内编码过程。2.提出一种基于支持向量机(SVM)的深度图帧内快速编码算法。通过探究深度图纹理复杂度、纹理特征属性与编码单元深度选择、预测单元最优模式之间的关联关系,设计了面向3D-HEVC深度图帧内编码单元深度范围快速选择和DMMs模式快速选择的SVM决策模型构建策略。基于两种策略设计实现的帧内快速编码算法与3D-HEVC标准测试模型HTM-16.0相比较,均可在保证深度图和合成视点重建质量的前提下,降低帧内编码复杂度。此外,实现了基于SVM的帧内编码单元快速选择与预测单元模式快速决策的联合优化算法,进一步节省了编码时间,同时验证了本文所提出算法的普适性、准确性。3.提出一种基于深度梯度提升(XGBoost)的非独立视点帧间快速编码算法。通过探究帧间编码单元划分深度与纹理特征的相关性,以及各视图间、各视点间编码单元划分结构的关联关系,本文构建了基于数据挖掘和机器学习方法的帧间编码单元深度范围快速决策机制,以降低3D-HEVC帧间编码复杂度。基于上述策略设计实现的帧间快速编码算法与3D-HEVC标准测试模型HTM-16.0相比较,可在保证深度图、纹理图及合成视点重建质量的前提下,进一步提高3D视频帧间编码速度。
段堃[8](2020)在《基于H.265/HEVC的高压缩率与低复杂度编码技术研究》文中进行了进一步梳理随着视频应用不断向高清及超高清迈进,激增的视频数据不断挑战着有限信道带宽和存储容量的下的视频传输与存储能力,使得目前广泛应用的H.264/AVC视频编码标准逐渐难以应对视频的高效存储与传输需求。基于此,视频编码联合专家组于2013年正式发布了新一代国际视频编码标准H.265/HEVC。虽然H.265/HEVC凭借其先进的编码工具实现了视频压缩效率的又一次飞跃,但H.265/HEVC标准在实现大规模普及的道路上,编码性能与编码复杂度之间的矛盾依旧存在。本文立足于第三代高效视频编码标准H.265/HEVC,力求在高压缩率编码与低复杂度编码的理论研究取得新的进展。本文主要开展的研究内容如下:1.提出了一种基于局部亮度直方图的场景切换检测算法。以局部亮度直方图对于帧间内容变化的优秀表征能力为依据,以视频中场景切换的高效检测为目标,设计了帧间内容变化测度与基于场景切换检测窗的场景切换检测策略。所提出的基于局部亮度直方图的场景切换检测算法可以实现超低计算成本下的高效场景切换检测,实现场景切换检测准确度与视频压缩效率提升。2.提出了一种基于局部亮度直方图的自适应帧类型决策算法。以局部亮度直方图对于视频时序特性的良好表征能力为依据,以视频中帧类型的高效自适应决策为出发点,设计了一种兼容性更好的固定帧类型决策算法与基于相邻帧间整体差异的自适应帧类型决策流程。所提出的基于局部亮度直方图的自适应帧类型决策算法可以实现在几乎不引入额外计算开销前提下的高效自适应帧类型决策,有效提升视频压缩效率。3.提出了一种自适应四叉树深度预测机制。以编码单元划分深度间的时空相关性为依据,以H.265/HEVC标准中的四叉树划分方式作为入手点,设计了相似编码区域标志位、相似编码区域深度范围预测算法与非相似编码区域深度范围预测算法。所提出的自适应四叉树深度预测机制可以在有效保证编码质量的前提下,显着加速编码过程。
张元东[9](2020)在《基于感兴趣区域的高性能视频编码算法优化研究》文中研究说明高性能视频编码(High Efficiency Video Coding,HEVC)算法是在H.264/AVC基础上发展的最新一代编码技术,相较于H.264/AVC可降低50%以上码率,但HEVC在降低码率的同时却增加了编码复杂度,而随着视频分辨率和数据量的提高,视频中存在更多的视觉冗余,人眼视觉关注机制更利于滤掉冗余信息。因此,基于感兴趣区域(Region of Interest,ROI)的高性能视频编码算法研究对降低编码复杂度和提高输出视频质量具有重要意义。传统Itti算法在提取ROI方面存在提取的ROI信息缺失、ROI检测不准确及提取的ROI边缘定位模糊问题。因此,针对传统Itti算法存在的问题,本文对Itti算法进行改进来提取视频帧的ROI。首先在Itti模型提取原有三个特征的基础上,基于空域提取纹理、形状特征,解决融合后图像存在信息缺失和ROI边缘定位模糊的问题;基于时域提取运动特征,解决检测ROI不准确的问题。然后,在归一化等操作下生成亮度、颜色、方向、纹理、形状和运动共六个单特征显着图。最后,基于信息熵融合理论结合设计的算法自适应获取每个单特征显着图的权重,提高融合后显着区域的精度。最终完成视频ROI的有效提取。在HEVC帧内预测算法中,CU的四叉树划分和35种PU预测模式的选择增加了不必要率失真代价的计算,导致HEVC算法复杂度较高。因此,针对HEVC帧内预测算法存在的问题,基于ROI采用设计的算法对帧内预测算法进行优化改进。首先,基于ROI采用降维的思想结合设计的CU深度判决算法和判断准则确定当前CU的最终划分深度,提前终止CU的划分,实现降低帧内预测算法复杂度。其次,基于ROI引入二维离散傅里叶变换(Two-dimensional discrete Fourier transform)并结合设计的PU预测模式选择算法确定当前PU的最佳预测模式,降低不必要率失真代价的计算,进一步降低帧内预测算法复杂度。HEVC的JCTVC-K0103码率控制算法对目标码率分配存在比特权重估计不准确、忽略人眼主观观测机制和参数更新阶段计算量较大的问题。为此,针对K0103码率控制算法存在的问题,提出基于感兴趣区域的JCTVC-K0103码率控制优化算法。首先,采用CTU层分配的比特作为时空域复杂度分配的权重,实现CTU层比特权重的重新分配。然后,基于ROI采用设计的算法对目标比特分配权重进行再分配,使输出视频更符合人眼视觉关注机制。最后,引入拟牛顿法对参数模型进行更新,降低参数模型更新过程的计算量。利用本文提出的方法对来自JCT-VC提供的数据进行实验对比分析,实验结果表明:本文提出的方法能够准确、客观的实现降低编码复杂度、提高输出视频质量和使输出视频更符合人眼视觉关注机制,完成基于感兴趣区域的高性能视频编码算法的优化,可为高性能视频编码算法的研究工作提供一定的参考。
刘晓燕[10](2020)在《基于视觉感知的高效视频编码优化方法》文中认为随着数字媒体技术的发展,视频数据量呈现爆炸性增长,如何高效地压缩视频成为巨大的挑战。国际电信联盟ITU-T和国际标准化组织ISO/国际电工委员会IEC,一直致力于制定有效的视频编码标准,来应对这一挑战。目前国际最先进的视频编码标准为H.265/高效视频编码(High Efficiency Video Coding,HEVC),比H.264/高级视频编码(Advanced Video Coding,AVC)的编码效率提高了一倍。但是人眼毕竟是视频数据的最终接收端,根据人类视觉系统的感知特性可知,将人类视觉系统的感知特性与视频编码相结合,剔除视频中的视觉感知冗余势必能带来更好的编码增益。基于此,本论文将人类视觉感知特性加入到视频编码框架中,提出了基于视觉感知的高效视频编码优化方法,主要有以下几个方面的研究:1、在HEVC中,基于I帧(Intra frame)的编码树单元(Coding Tree Unit,CTU)级比特分配算法采用同位CTU的均方误差(Mean Squared Error,MSE)或平均绝对差(Mean Absolute Difference,MAD)作为比特权重来指导比特分配,这种做法没有充分考虑人眼的视觉感知特性。因此,提出了一种基于空域视觉感知失真的比特分配算法。首先,采用融合空域掩蔽效应的感知失真评价标准替换传统的失真评价标准,建立新的空域感知失真与码率的关系模型,接下来,通过数据统计和拟合的方式验证模型的准确性。此外,提出了两种参数估计方法来求解参数模型。最后,通过率失真优化理论以及拉格朗日乘子法推导求解出每个CTU的感知权重因子指导比特分配。为了验证所提算法的性能,采用空域感知失真评价模型对所提算法进行率失真性能评价。还使用了其他七种视频质量评价模型对所提算法进行性能评估。实验结果表明在相同感知质量的情况下,所提算法平均降低了6.27%的编码比特率,大大提高了编码性能。2、对于I帧图像的比特分配考虑空域视觉感知特性可以很好的提高编码效率,但对于非I帧图像的编码仅仅考虑视频的空域感知特征不足以充分剔除视觉感知冗余。因为视频是由一帧帧图像组合而成的,在编码非I帧图像时还需要考虑视频的时域感知特性,利用融合了时空域视觉特征的感知模型可以更好的评估非I帧图像的感知失真。所以提出采用基于时空域感知失真模型指导视频编码中的码率控制技术。首先,除去视频中的I帧图像,通过统计过程得到非I帧图像的时空域感知失真和码率之间的关系模型。然后,根据非I帧时空域感知失真和码率之间的关系,得到每个CTU的感知权重。之后,根据感知权重来指导CTU级比特分配。最后,利用R-?和QP-?模型,得到编码的量化参数值,进而指导CTU级码率控制算法。所提算法与JCTVC-K0103算法相比,大大提高了视频编码的效率。3、为了满足临床治疗所需的图像质量以及尽可能的提高压缩率,提出了一种用于病理切片图的基于感兴趣区域(Region of Interest,ROI)的视频编码方法。首先利用病理切片图的感知特性确定图像阈值,将病理切片图分为感兴趣区域和非感兴趣区域。然后分别确定病理切片图中感兴趣区域和非感兴趣区域的感知失真值。针对病理切片图的感兴趣区域采用人眼不可察觉失真的方式压缩,对于临床非感兴趣区域在不影响视觉效果的前提下采用最大失真压缩。实验表明分区域压缩病理切片图的编码方式比采用同一种方式压缩病理切片图节省比特率92%。在编码的过程中,为了控制不同区域的感知质量,要遍历所有的量化参数并计算出对应的失真值,计算复杂度比较高。通过建立失真与量化参数之间的关系模型,可以快速实现量化参数的选取,大大降低了编码的复杂度。实验表明基于感兴趣区域的病理切片图快速编码方法比全遍历编码方法的时间节省率为97%,不仅保持了编码的压缩效率,而且大大降低了编码的复杂度。本文所提出的基于视觉感知的高效视频编码优化方法,充分考虑了如掩蔽效应、对比敏感度,视觉注意力机制等人类视觉感知特性。将感知模型加入到视频编码框架中,剔除了人眼的感知失真,优化了比特资源分配,有效的提高了视频编码的效率。将感知编码运用到病理切片图中,大大提高了病理切片图编码的压缩效率。本课题的研究对感知编码的发展有一定的理论依据,对视频会议、图像视频压缩、媒体传播、智慧医疗等有着积极的指导意义。
二、视频编码算法的研究与标准的实现(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、视频编码算法的研究与标准的实现(论文提纲范文)
(1)基于HEVC的超高清视频压缩算法研究(论文提纲范文)
摘要 |
abstract |
第1 章 绪论 |
1.1 课题研究背景及意义 |
1.2 HEVC视频压缩的研究现状 |
1.2.1 HEVC视频压缩算法的优化研究 |
1.2.2 视频传输的不均等差错保护技术研究 |
1.3 论文的主要工作和章节安排 |
第2 章 视频压缩及相关关键技术 |
2.1 视频压缩发展概述 |
2.2 HEVC视频压缩算法概述 |
2.2.1 四叉树划分 |
2.2.2 帧内预测技术 |
2.2.3 帧间预测技术 |
2.2.4 变换技术 |
2.2.5 量化技术 |
2.2.6 可分级视频编码 |
2.3 空间通信系统视频传输概述 |
2.4 实验与结果分析 |
2.5 本章小结 |
第3章 基于Bandelet变换的视频压缩算法 |
3.1 DCT变换 |
3.2 基于Bandelet变换的压缩算法 |
3.2.1 残差变换系数 |
3.2.2 Bandelet变换 |
3.2.3 算法流程 |
3.3 性能评估与分析 |
3.3.1 二次变换原理仿真验证与分析 |
3.3.2 基于Bandelet变换的压缩算法的仿真验证与分析 |
3.4 本章小结 |
第4 章 基于静态背景视频的压缩算法 |
4.1 基于静态背景视频的感兴趣区域的压缩算法 |
4.1.1 算法流程 |
4.1.2 系统实现和性能评估 |
4.2 基于静态背景视频的快速视频压缩算法 |
4.2.1 静态背景视频的相关性分析 |
4.2.2 快速视频压缩算法 |
4.2.2.1 基于相关性的快速帧内预测压缩算法 |
4.2.2.2 混合编码框架的快速压缩算法 |
4.3 性能评估与分析 |
4.3.1 快速帧内预测压缩算法的仿真验证与分析 |
4.3.2 混合编码框架快速压缩算法的仿真验证与分析 |
4.4 本章总结 |
第5 章 基于极化码的视频压缩不均等差错保护算法 |
5.1 极化码的编译码研究 |
5.1.1 信道极化现象和极化码编码 |
5.1.2 极化码译码 |
5.2 近似最优的极化码构造算法 |
5.2.1 信道模型 |
5.2.2 基于高斯近似的极化码构造 |
5.2.3 算法流程 |
5.3 基于极化码的不均等差错保护算法 |
5.3.1 失真模型分析 |
5.3.2 算法流程 |
5.4 性能评估与分析 |
5.4.1 近似最优的极化码构造算法的仿真验证与分析 |
5.4.2 基于极化码的不均等差错保护算法的仿真验证与分析 |
5.5 本章小结 |
第6 章 总结与展望 |
6.1 总结 |
6.2 未来展望 |
参考文献 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
(2)基于H.266视频编码的帧间预测技术研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 课题的研究背景及意义 |
1.2 国内外研究现状和发展态势 |
1.2.1 视频编码标准的发展历程 |
1.2.2 H.266/VVC研究现状 |
1.3 主要研究内容及创新点 |
1.4 本文结构安排 |
2 H.266 视频帧间预测编码技术 |
2.1 引言 |
2.2 混合视频编码框架 |
2.3 H.266/VVC帧间预测新增关键技术 |
2.4 性能评价指标 |
2.4.1 标准测试配置 |
2.4.2 失真评估准则 |
2.5 本章小结 |
3 帧间编码块结构优化 |
3.1 引言 |
3.2 H.266/VVC编码块结构 |
3.2.1 I帧、P帧和B帧 |
3.2.2 编码块划分原理 |
3.2.3 编码块划分过程及复杂度分析 |
3.3 基于图像纹理特征的I帧块划分优化 |
3.3.1 I帧块划分与视频纹理的关系 |
3.3.2 Sobel边缘检测快速块划分决策算法 |
3.3.3 实验结果 |
3.4 基于图像相似度的P帧块划分优化 |
3.4.1 P帧块划分的时间相关性 |
3.4.2 哈希算法快速P帧块划分决策算法 |
3.4.3 实验结果 |
3.5 本章小结 |
4 帧间运动搜索算法优化研究 |
4.1 引言 |
4.2 运动估计算法原理 |
4.2.1 常见的块匹配准则 |
4.2.2 基本模型搜索算法 |
4.2.3 混合模型搜索算法 |
4.3 旋转六边形模型算法研究 |
4.3.1 基本六边形模型存在的缺陷 |
4.3.2 旋转六边形模型 |
4.3.3 实验结果 |
4.4 双向增强小钻石模型算法研究 |
4.4.1 运动矢量中心偏置统计分析 |
4.4.2 双向增强小钻石模型算法 |
4.4.3 实验结果 |
4.4.4 联合实验 |
4.5 本章小结 |
5 总结与展望 |
5.1 全文工作总结 |
5.2 后续研究工作 |
致谢 |
参考文献 |
攻读学位期间取得的研究成果 |
(3)基于VVC的视频帧内预测编码技术研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 课题研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 视频编码标准的探索历程 |
1.2.2 H.266/VVC研究现状 |
1.3 本文的主要研究和创新内容 |
1.4 本文的章节安排 |
2 多功能视频编码标准H.266/VVC |
2.1 引言 |
2.2 H.266/VVC编码框架 |
2.3 H.266/VVC关键帧内预测技术 |
2.4 实验条件和评价指标 |
2.4.1 客观评价指标 |
2.4.2 标准测试配置 |
2.5 本章小结 |
3 帧内编码块划分算法优化 |
3.1 引言 |
3.2 编码块四叉树及多叉树划分 |
3.2.1 块划分 |
3.2.2 块划分过程及复杂度分析 |
3.3 基于梯度幅值偏差的帧内编码块划分快速决策 |
3.3.1 梯度幅值偏差 |
3.3.2 基于梯度幅值偏差的块划分决策 |
3.3.3 实验结果分析 |
3.4 本章小结 |
4 帧内预测模式抉择算法优化 |
4.1 引言 |
4.2 帧内预测模式选择过程及复杂度分析 |
4.2.1 帧内预测模式抉择过程 |
4.2.2 帧内预测模式抉择复杂度分析 |
4.3 基于梯度方向信息的帧内模式快速抉择算法 |
4.3.1 帧内模式统计分析 |
4.3.2 基于梯度方向信息的模式抉择算法 |
4.3.3 算法实现流程 |
4.3.4 实验结果分析 |
4.4 本章小结 |
5 总结与展望 |
5.1 全文总结 |
5.2 不足与展望 |
致谢 |
参考文献 |
攻读学位期间取得的研究成果 |
(4)基于机器学习的分布式视频编码研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与研究意义 |
1.2 研究现状及发展态势 |
1.3 研究目标及内容 |
1.4 本文的结构安排 |
第二章 分布式视频编码理论基础 |
2.1 分布式信源编码 |
2.1.1 Slepian-Wolf理论 |
2.1.2 Wyner-Ziv理论 |
2.2 边信息生成算法 |
2.2.1 边信息外推 |
2.2.2 边信息内插 |
2.3 分布式视频编码常用框架 |
2.3.1 PDDVC和TDDVC系统框架 |
2.3.2 DRVC系统框架 |
2.3.3 DISCOVER系统框架 |
2.4 本章小结 |
第三章 基于高阶域特征提取的DVC框架设计 |
3.1 HOM-DVC框架 |
3.1.1 HOM框架编码端设计 |
3.1.2 HOM框架解码端设计 |
3.2 视频图像预处理设计 |
3.2.1 视频帧小波变换 |
3.2.2 基于小波变换的视频帧预处理 |
3.3 基于小波域的视频高阶统计特征挖掘算法 |
3.3.1 JPEG-2000 算法 |
3.3.2 基于机器学习的视频高阶特征挖掘 |
3.3.2.1 视频帧初步特征选取 |
3.3.2.2 视频帧特征搜索 |
3.4 本章小结 |
第四章 基于机器学习的高阶域分布式视频编码算法 |
4.1 AdaBoost算法 |
4.1.1 AdaBoost算法概述 |
4.1.2 AdaBoost算法原理 |
4.2 基于机器学习的HOMBAB分布式视频编码改进算法 |
4.2.1 弱分类器选取 |
4.2.2 弱分类器建立 |
4.3 基于AdaBoost的高阶提取特征信息训练 |
4.4 本章小结 |
第五章 仿真结果及分析 |
5.1 仿真环境 |
5.2 仿真结果与分析 |
5.2.1 主观视频质量比较 |
5.2.2 客观性能比较 |
5.2.3 算法复杂度分析 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 后续工作与展望 |
致谢 |
参考文献 |
(5)面向智能视频监控场景的感知优化与内容分析算法研究(论文提纲范文)
摘要 |
Abstract |
专用术语注释表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外相关工作研究进展 |
1.3 论文的研究内容和主要贡献 |
1.3.1 研究内容 |
1.3.2 主要贡献 |
1.4 论文结构安排 |
第二章 研究基础及相关工作 |
2.1 分布式视频编码算法相关研究 |
2.1.1 分布式视频编码基础理论概述 |
2.1.2 相关工作 |
2.2 视频修复算法相关研究 |
2.2.1 张量基础理论概述 |
2.2.2 相关工作 |
2.3 视频目标分割算法相关研究 |
2.3.1 视频目标分割基础理论概述 |
2.3.2 相关工作 |
2.4 本章小结 |
第三章 基于预测的分布式视频编码优化算法研究 |
3.1 引言 |
3.2 相关工作 |
3.3 基于预测的边信息生成算法 |
3.3.1 边信息预测模型 |
3.3.2 生成边信息 |
3.4 仿真实验与结果分析 |
3.4.1 实验参数设置 |
3.4.2 基于公开数据集的实验结果与分析 |
3.5 本章小结 |
第四章 基于张量列秩的视频修复算法研究 |
4.1 引言 |
4.2 相关工作 |
4.3 基于张量列秩的视频补全算法 |
4.3.1 基于张量列秩的近似张量求解算法 |
4.3.2 基于张量列秩的自适应权重机制 |
4.3.3 基于张量列秩的自适应加权张量补全算法 |
4.4 仿真实验与结果分析 |
4.4.1 实验参数设置 |
4.4.2 基于公开数据集的实验结果与分析 |
4.4.3 基于实际监测场景感知数据的实验结果与分析 |
4.5 本章小结 |
第五章 基于吸收马尔科夫链的感知视频片段目标分割算法研究 |
5.1 引言 |
5.2 相关工作 |
5.2.1 基于自定义特征规则的半监督视频目标分割 |
5.2.2 基于自定义特征规则的无监督视频目标分割 |
5.3 基于吸收马尔科夫链的视频目标分割算法 |
5.3.1 边权重模型 |
5.3.2 基于吸收马尔科夫链有向图的视频目标分割机制 |
5.4 仿真实验与结果分析 |
5.4.1 实验参数设置 |
5.4.2 基于公开数据集的实验结果与分析 |
5.4.3 基于实际监测场景感知数据的实验结果与分析 |
5.5 本章小结 |
第六章 基于注意力机制的感知视频目标分割算法研究 |
6.1 引言 |
6.2 相关工作 |
6.2.1 无监督神经网络视频目标分割 |
6.2.2 半监督神经网络视频目标分割 |
6.3 基于注意力机制的时空CNN-LSTM视频目标分割算法 |
6.3.1 三维卷积注意力残差预测模型 |
6.3.2 光流预测模型 |
6.3.3 生成分割目标 |
6.4 仿真实验与结果分析 |
6.4.1 实验参数设置 |
6.4.2 基于公开数据集的实验结果与分析 |
6.4.3 基于实际监测场景感知数据的实验结果与分析 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
附录1 攻读博士学位期间撰写的论文 |
附录2 攻读博士学位期间参加的科研项目 |
致谢 |
(6)基于视觉显着性的HEVC快速帧间预测算法研究(论文提纲范文)
摘要 |
Abstract |
专用术语注释表 |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 帧间预测快速算法相关的研究现状 |
1.2.2 基于HVS的HEVC编码器研究现状 |
1.3 本文主要研究内容 |
1.4 论文结构安排 |
第二章 HEVC视频编码原理及优化技术 |
2.1 HEVC中预测相关的重要编码技术 |
2.1.1 HEVC编码总体流程 |
2.1.2 HEVC编码块结构 |
2.1.3 HEVC预测编码 |
2.2 HEVC帧间预测快速算法介绍 |
2.2.1 帧间预测快速深度决策算法 |
2.2.2 帧间预测快速模式决策算法 |
2.2.3 帧间预测快速运动估计算法 |
2.3 基于HVS的视频编码算法介绍 |
2.3.1 基于显着度的CU尺寸预测快速算法 |
2.3.2 基于显着度的CU模式预测快速算法 |
2.4 本章小结 |
第三章 基于统计特性和时域相关性的深度优化算法 |
3.1 HEVC中CU深度划分简介 |
3.2 基于残差统计特性的深度终止方法 |
3.2.1 基于残差统计特性的快速深度终止方案 |
3.2.2 算法整体流程 |
3.2.3 实验结果与分析 |
3.3 基于多参考帧的快速帧间深度决策算法 |
3.3.1 基于残差统计特性的快速深度划分方案 |
3.3.2 快速深度决策方案实验结果及分析 |
3.3.3 快速参考帧选取优化方案 |
3.4 实验结果与分析 |
3.5 本章小结 |
第四章 基于视频显着度的帧间预测算法优化 |
4.1 基于显着度的CU快速深度划分算法 |
4.1.1 显着性检测模型介绍 |
4.1.2 基于显着度的CU快速深度划分具体方案 |
4.1.3 实验结果及分析 |
4.2 基于显着度的帧间模式优化方案 |
4.2.1 帧间预测模式选择技术分析 |
4.2.2 基于显着度的帧间预测快速模式选择方法 |
4.2.3 实验结果及分析 |
4.3 实验结果与分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
附录1 攻读硕士学位期间申请的专利 |
附录2 攻读硕士学位期间参加的科研项目 |
致谢 |
(7)面向3D-HEVC的低复杂度编码方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 3D视频技术与3D视频编码标准 |
1.1.1 立体视觉产生原理 |
1.1.2 3D视频的采集 |
1.1.3 3D视频格式 |
1.1.4 3D视频编码标准发展历程 |
1.2 课题研究背景及意义 |
1.3 3D视频低复杂度编码研究现状 |
1.3.1 3D视频帧内编码研究现状 |
1.3.2 3D视频帧间编码研究现状 |
1.4 研究内容与论文结构 |
1.4.1 研究目标 |
1.4.2 研究内容 |
1.4.3 论文组织结构 |
第2章 高效3D视频编码标准3D-HEVC简介 |
2.1 视频编码标准 |
2.1.1 视频编码的意义 |
2.1.2 视频编码标准发展历程 |
2.2 HEVC视频编码标准 |
2.2.1 HEVC视频编码标准概述 |
2.2.2 HEVC编码关键技术 |
2.3 基于3D-HEVC的3D视频编码标准 |
2.3.1 3D-HEVC编码概述 |
2.3.2 3D-HEVC纹理图编码关键技术 |
2.3.3 3D-HEVC深度图编码关键技术 |
2.4 3D-HEVC标准编码测试模型——HTM |
2.5 本章小结 |
第3章 基于边缘检测的深度图帧内预测模式快速选择算法 |
3.1 3D-HEVC深度图帧内编码复杂度分析 |
3.1.1 帧内编码单元划分方式 |
3.1.2 帧内预测模式选择 |
3.1.3 帧内编码复杂度分析 |
3.2 算法提出动机分析 |
3.2.1 纹理图和深度图帧内编码复杂度对比 |
3.2.2 编码单元纹理边缘方向、纹理复杂度与帧内预测模式关系分析 |
3.3 基于边缘检测的深度图帧内模式快速选择算法 |
3.3.1 边缘检测原理 |
3.3.2 纹理平坦区域帧内模式选择规则 |
3.3.3 纹理复杂区域帧内模式选择规则 |
3.3.4 算法流程 |
3.4 实验结果与分析 |
3.4.1 测试条件及编码环境配置 |
3.4.2 算法性能评价 |
3.5 本章小结 |
第4章 基于SVM的深度图帧内快速编码算法 |
4.1 算法提出动机分析 |
4.1.1 动机1:编码单元划分深度、编码单元纹理复杂度和编码时间的关系分析 |
4.1.2 动机2:DMMs模式、编码性能及编码时间之间的关系分析 |
4.2 支持向量机 |
4.2.1 支持向量机 |
4.2.2 数据筛选和模型训练工具 |
4.3 深度图帧内编码单元深度快速决策算法 |
4.3.1 数据预处理 |
4.3.2 模型构建 |
4.3.3 算法流程 |
4.3.4 实验结果 |
4.4 深度图帧内DMMs模式快速选择算法 |
4.4.1 DMMs模式快速选择算法 |
4.4.2 算法流程 |
4.4.3 实验结果 |
4.5 深度图帧内编码单元划分快速决策与预测模式快速选择的联合优化算法 |
4.5.1 算法流程 |
4.5.2 联合优化算法性能评价 |
4.6 本章小结 |
第5章 基于XGBoost的非独立视点帧间快速编码算法 |
5.1 3D-HEVC帧间编码复杂度分析 |
5.1.1 3D-HEVC帧间编码结构 |
5.1.2 帧间预测编码单元划分 |
5.2 算法提出动机分析 |
5.2.1 动机1:编码单元深度和编码时间消耗关系分析 |
5.2.2 动机2:同一视点的纹理图与深度图的编码单元深度相关性分析 |
5.2.3 动机3:独立视点与非独立视点编码单元划分相关性分析 |
5.3 极端梯度提升法(e Xtreme Gradient Boosting,XGBoost) |
5.3.1 基学习器——CART |
5.3.2 XGBoost算法基本思想 |
5.4 非独立视点帧间编码单元深度快速选择算法 |
5.4.0 面向编码单元深度快速选择的XGBoost模型构建机制 |
5.4.1 数据挖掘 |
5.4.2 模型训练 |
5.4.3 算法流程 |
5.4.4 实验结果及分析 |
5.5 本章小结 |
总结与展望 |
参考文献 |
攻读硕士期间科研成果及科研工作 |
致谢 |
(8)基于H.265/HEVC的高压缩率与低复杂度编码技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 研究现状 |
1.2.1 视频编码标准研究现状 |
1.2.2 高压缩率与低复杂度算法研究现状 |
1.3 本文的研究内容及主要贡献 |
1.4 论文的章节安排 |
第2章 高效视频编码标准H.265/HEVC简介 |
2.1 H.265/HEVC标准的发展历程 |
2.1.1 H.265/HEVC标准的提出 |
2.1.2 H.265/HEVC扩展标准 |
2.2 H.265/HEVC标准编码架构与关键技术 |
2.2.1 H.265/HEVC标准编码架构 |
2.2.2 H.265/HEVC关键技术 |
2.2.3 H.265/HEVC标准的编码结构 |
2.3 基于H.265/HEVC标准的编码器 |
2.3.1 x265简介 |
2.3.2 HM简介 |
2.4 本章小结 |
第3章 基于局部亮度直方图的场景切换检测算法 |
3.1 I Slice分析与视频的场景切换 |
3.1.1 I Slice对视频编码效率的影响 |
3.1.2 视频中的场景切换 |
3.2 算法提出动机 |
3.2.1 动机一:计算复杂度过高 |
3.2.2 动机二:全局亮度直方图性能较差 |
3.3 基于局部亮度直方图的场景切换检测算法 |
3.3.1 局部亮度直方图的获取 |
3.3.2 帧间内容变化测度 |
3.3.3 场景切换检测策略 |
3.3.4 算法流程图 |
3.4 实验结果及分析 |
3.4.1 测试条件与测试序列 |
3.4.2 算法性能评估 |
3.5 本章小结 |
第4章 基于局部亮度直方图的自适应帧类型决策算法 |
4.1 固定帧类型决策算法 |
4.1.1 Mini-GOP与标准兼容性拓展 |
4.1.2 基于Mini-GOP的帧类型决策流程 |
4.2 视频时序特性与帧类型 |
4.3 基于局部亮度直方图的自适应帧类型决策算法 |
4.4 实验结果及分析 |
4.4.1 测试条件与测试序列 |
4.4.2 算法性能评估 |
4.5 本章小结 |
第5章 面向H.265/HEVC的自适应四叉树深度预测机制 |
5.1 基于四叉树结构的CTU划分过程复杂度分析 |
5.1.1 最优CTU划分方式决策 |
5.1.2 编码复杂度分析 |
5.2 算法提出动机:CTU间时空相关性分析 |
5.3 自适应四叉树深度预测机制 |
5.3.1 相似区域标志 |
5.3.2 相似区域深度范围预测算法 |
5.3.3 非相似区域深度范围预测算法 |
5.3.4 算法流程图 |
5.4 实验结果及分析 |
5.4.1 测试条件与测试序列 |
5.4.2 算法性能评估 |
5.5 本章小结 |
总结与展望 |
参考文献 |
攻读硕士期间科研成果及科研工作 |
致谢 |
(9)基于感兴趣区域的高性能视频编码算法优化研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究的背景及意义 |
1.2 课题研究现状与存在的问题 |
1.2.1 国内外研究现状 |
1.2.2 存在的问题 |
1.3 课题主要研究内容 |
1.4 论文的组织结构 |
第2章 课题研究的相关理论与技术 |
2.1 感兴趣区域检测算法的相关理论 |
2.1.1 感兴趣区域检测的Itti算法 |
2.1.2 感兴趣区域检测的Itti算法原理 |
2.1.3 感兴趣区域检测评价标准 |
2.2 高性能视频编码帧内预测算法 |
2.2.1 编码单元CU |
2.2.2 预测单元PU |
2.3 高性能视频编码JCTVC-K0103码率控制算法 |
2.3.1 目标比特分配 |
2.3.2 目标比特实现 |
2.4 本章小结 |
第3章 基于改进Itti算法的感兴趣区域检测 |
3.1 Itti算法检测感兴趣区域的描述及分析 |
3.2 改进的Itti算法检测感兴趣区域 |
3.2.1 算法改进思路 |
3.2.2 纹理特征计算 |
3.2.3 形状特征计算 |
3.2.4 运动特征计算 |
3.2.5 自适应权值特征融合 |
3.3 实验分析 |
3.4 本章小结 |
第4章 基于感兴趣区域高性能视频编码帧内预测算法的设计 |
4.1 高性能视频编码帧内预测算法的描述及分析 |
4.2 高性能视频编码帧内预测算法的设计 |
4.2.1 快速CU划分算法 |
4.2.2 PU模式快速选择算法 |
4.3 实验分析 |
4.3.1 验证提出算法的正确性和命中率 |
4.3.2 验证提出算法的编码性能 |
4.4 本章小结 |
第5章 基于感兴趣区域的高性能视频编码JCTVC-K0103码率控制算法 |
5.1 高性能视频编码JCTVC-K0103码率控制算法的描述及分析 |
5.2 高性能视频编码JCTVC-K0103码率控制算法的设计 |
5.2.1 基于时空域的CTU层目标比特分配 |
5.2.2 基于拟牛顿法的参数模型更新 |
5.3 实验分析 |
5.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的学术论文及专利 |
致谢 |
(10)基于视觉感知的高效视频编码优化方法(论文提纲范文)
摘要 |
abstract |
第1章 引言 |
1.1 研究课题的背景及意义 |
1.2 国内外研究现状 |
1.3 研究目标与内容 |
1.4 论文章节安排 |
第2章 基于视觉感知的高效视频编码简介 |
2.1 人类视觉系统简介 |
2.1.1 人类视觉系统的结构 |
2.1.2 人类视觉系统的感知特性 |
2.2 视频编码技术 |
2.2.1 视频编码标准的发展 |
2.2.2 高效视频编码原理及框架 |
2.3 感知视频编码技术 |
2.3.1 码率控制 |
2.3.2 率失真优化 |
2.4 本章小节 |
第3章 基于空域视觉感知失真的比特分配 |
3.1 相关研究 |
3.2 问题与动机 |
3.3 基于空域视觉感知的码率和失真模型 |
3.3.1 空域视觉感知失真的测量 |
3.3.2 建立空域视觉感知失真与码率之间的函数关系 |
3.4 CTU级感知加权因子确定 |
3.4.1 基于简单多项式函数模型的感知权重因子确定 |
3.4.2 基于复杂多项式函数的模型的感知权重因子确定 |
3.5 基于视觉感知的CTU级比特分配 |
3.6 实验结果与分析 |
3.6.1 实验设置 |
3.6.2 使用PWMSE度量标准比较R-D性能 |
3.6.3 使用不同质量指标比较R-D性能 |
3.6.4 比特率精度比较 |
3.7 本章小结 |
第4章 基于时空域视觉感知失真的码率控制 |
4.1 基于时空域视觉感知的码率与失真模型 |
4.1.1 时空域视觉感知失真的测量 |
4.1.2 时空域视觉感知失真与码率的关系模型 |
4.2 感知权重因子的确定及比特分配 |
4.2.1 感知权重的确定 |
4.2.2 比特分配 |
4.3 基于时空域视觉感知的码率控制算法 |
4.4 实验结果与分析 |
4.4.1 实验设置 |
4.4.2 不同质量指标下的性能比较 |
4.4.3 比特率误差分析 |
4.5 本章小结 |
第5章 基于感兴趣区域的视频编码方法 |
5.1 相关研究 |
5.2 基于感兴趣区域的病理切片图编码方法 |
5.2.1 感兴趣区域的提取 |
5.2.2 基于感兴趣区域的编码方法 |
5.3 感兴趣和非感兴趣区域的量化参数选择 |
5.3.1 全遍历量化参数选取 |
5.3.2 快速量化参数选取 |
5.4 实验结果与分析 |
5.5 本章小节 |
第6章 总结与展望 |
6.1 本文工作总结 |
6.2 未来工作展望 |
参考文献 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
四、视频编码算法的研究与标准的实现(论文参考文献)
- [1]基于HEVC的超高清视频压缩算法研究[D]. 孙海超. 中国科学院大学(中国科学院长春光学精密机械与物理研究所), 2021(08)
- [2]基于H.266视频编码的帧间预测技术研究[D]. 周德登. 西南科技大学, 2021(08)
- [3]基于VVC的视频帧内预测编码技术研究[D]. 陶浩然. 西南科技大学, 2021(08)
- [4]基于机器学习的分布式视频编码研究[D]. 姜天勇. 电子科技大学, 2021(01)
- [5]面向智能视频监控场景的感知优化与内容分析算法研究[D]. 曹莹. 南京邮电大学, 2020(03)
- [6]基于视觉显着性的HEVC快速帧间预测算法研究[D]. 姜晓鹏. 南京邮电大学, 2020(03)
- [7]面向3D-HEVC的低复杂度编码方法研究[D]. 张儒依. 北京工业大学, 2020
- [8]基于H.265/HEVC的高压缩率与低复杂度编码技术研究[D]. 段堃. 北京工业大学, 2020
- [9]基于感兴趣区域的高性能视频编码算法优化研究[D]. 张元东. 东北电力大学, 2020(01)
- [10]基于视觉感知的高效视频编码优化方法[D]. 刘晓燕. 中国科学院大学(中国科学院深圳先进技术研究院), 2020(07)