一、基于四叉树分割视频对象的可伸缩编码算法(论文文献综述)
汪富康[1](2021)在《基于可伸缩高性能视频编码SHVC的快速算法研究》文中研究说明随着视频压缩编码技术的高速发展,视频在日常生活中的应用越来越广泛。为了适应变化的网络环境和不同的终端需求,国际标准化组织推出了可伸缩视频编码技术标准。可伸缩的视频编码器根据网络带宽的变化和不同的终端需求能够自适应地调整视频码流的大小,从而针对不同的网络状态传输不同质量的视频。最新的可伸缩高性能视频编码标准(Scalable High Efficiency Video Coding,SHVC)的压缩效率比上一代可伸缩编码标准(Scalable Advance Video Coding,SVC)提高了近50%。但是相比于SVC,SHVC增加了数倍的计算复杂度。由于递归的编码单元划分和复杂的预测单元划分,SHVC编码的复杂度主要集中在帧内编码和帧间编码过程中。由此,本文针对质量可伸缩的SHVC分别提出了快速帧内编码算法和快速帧间编码算法。首先,本文针对SHVC的帧内编码提出了一种基于深度相关性和残差检验的快速算法。本文从深度划分、层间参考模式的选择和深度提前终止三个方面进行编码优化。(1)利用空间、时间和层间多相关性,并结合相关性程度预测深度的范围,排除概率较小的深度;(2)对预测的深度采用层间预测模式进行编码,并对编码后的残差进行Jarque-Bera检验判断该模式是否为最优模式从而跳过帧内模式;(3)对划分后的编码单元的残差进行上下和左右划分,并采用假设检验判断每种划分是否具有显着性差异从而提前终止深度编码。然后,本文针对SHVC帧间编码提出了一种基于Laplace边缘特征的预测单元模式的快速决策方法。本文通过研究编码单元的边缘特征信息和帧间预测单元模式的相关性,利用不同的预测单元模式的Laplace边缘特征值和预设的临界值进行比较,进而预测最优的模式。最后,通过实验结果表明:与未修改的参考编码器SHM12.0相比,本文提出的快速帧内编码算法和快速帧间编码算法分别能减少约80%和60%的增强层编码时间。与此同时,本文算法的编码效率损失几乎很小并且具有良好的率失真性能。
王叶斐[2](2021)在《多模型联合优化的图像视频编码关键技术研究》文中研究说明随着如4K直播,远程会议,监控视频系统等应用的快速发展,图像视频数据量的爆炸式增长,海量图像视频数据的高效存储和传输给编码压缩技术带来前所未有的挑战。因此,探索更高效的图像视频压缩技术,进一步提升压缩的效率,是图像视频编码的根本目标。而编码问题本质是一个率失真优化问题。传统的编码方法主要采用了混合编码框架,这种方法依据图像处理以及计算机视觉的相关经验,通过人工设计算法如预测编码算法,变换编码算法,以及熵编码算法等一步步去除视频图像中的信息冗余,从而实现压缩。并在每一步通过多个不同压缩模式的优选来解率失真优化问题。但这种方法存在两个问题,一方面它首先高度依赖人工设计算法和参数调优,由于人工经验的局限性,在一些复杂或特殊场景下,算法的效率往往较低。另一方面不同模块的优化都是独立的,而没有考虑每个模块之间的联动,理论上会导致率失真优化处于局部最优。本文针对过去编码框架中多模型应用过程中存在的问题,首先研究在传统编码框架下的精准模型设计与多模型组合优选算法;然后将端到端压缩方法和传统框架结合,研究基于集成学习的端到端压缩算法;最后在此基础上将多模型编码代价也引入多模型训练,研究多模型率失真的联合优化。论文主要的研究工作与贡献如下:(1)本文针对传统编码框架下多模型精度差的问题,研究面向复杂场景的精准模型设计和多模型组合优化算法。对全景视频中存在的复杂运动畸变,首先从数学理论推导的角度设计一种基于球坐标变换的帧间预测运动模型,该运动模型可以更好刻画全景视频中的运动畸变。随后设计新运动模型的帧间编码算法,包括运动补偿算法和运动估计算法,并通过一些巧妙的方法简化算法并将其集成到现有编码框架。最后将新模型与现有框架中的多种运动模型相互融合,实现多运动模型的组合和快速优选算法。实验表明新运动模型和多模型组合优化方法可以有效提升帧间预测精度,提高对全景视频的压缩率,并降低解码复杂度。(2)本文针对传统编码框架中模块间无法联合优化问题,尝试进一步突破传统框架,将端到端网络压缩方法与传统框架相结合,并借助传统框架多模型优选的率失真优化方法的思想,解决端到端网络模型自适应差,复杂度高的问题,从而提出一种基于集成学习的端到端图像压缩框架。该框架采用分块自适应模型优选,本文为此框架的模型设计了多种模型生成算法,并采用如改进的提升方法,几何自集成等模型生成方法解决模型训练代价过高的问题,并同时保证模型的多样性。实验表明,基于集成学习的端到端图像压缩方法可以在不增加解码复杂度的情况下,有效提升压缩效率,反过来也可以在保证压缩效率情况下,减小解码复杂度。进一步的实验还证明了本文的方法具有良好的泛化能力。(3)本文针对多模型训练中并没有考虑多模型编码代价的问题,尝试将模型编码代价引入多模型训练,提出一种多模型率失真的联合优化方法,应用场景面向深度神经网络图像环路滤波。首先采用一种多模型联合训练的方法训练多个滤波网络,随后设计了一种在不同码率约束下控制模型的编码码率的方法。并通过基于退火的训练方法,解决模型训练中的坍缩问题。进一步地,设计了依据失真幅度的模型组优选+模型优选的两步优选方法,从而实现了比仅仅采用模型优选更优的率失真性能。在解码端通过图像块级自适应的两步模型优选,完成整个深度神经网络环路滤波的框架的构建。实验表明,该方法可以有效实现对多模型的编码码率控制,并且有效抑制模型坍缩,提高多模型深度神经网络滤波的率失真性能。
段堃[3](2020)在《基于H.265/HEVC的高压缩率与低复杂度编码技术研究》文中研究说明随着视频应用不断向高清及超高清迈进,激增的视频数据不断挑战着有限信道带宽和存储容量的下的视频传输与存储能力,使得目前广泛应用的H.264/AVC视频编码标准逐渐难以应对视频的高效存储与传输需求。基于此,视频编码联合专家组于2013年正式发布了新一代国际视频编码标准H.265/HEVC。虽然H.265/HEVC凭借其先进的编码工具实现了视频压缩效率的又一次飞跃,但H.265/HEVC标准在实现大规模普及的道路上,编码性能与编码复杂度之间的矛盾依旧存在。本文立足于第三代高效视频编码标准H.265/HEVC,力求在高压缩率编码与低复杂度编码的理论研究取得新的进展。本文主要开展的研究内容如下:1.提出了一种基于局部亮度直方图的场景切换检测算法。以局部亮度直方图对于帧间内容变化的优秀表征能力为依据,以视频中场景切换的高效检测为目标,设计了帧间内容变化测度与基于场景切换检测窗的场景切换检测策略。所提出的基于局部亮度直方图的场景切换检测算法可以实现超低计算成本下的高效场景切换检测,实现场景切换检测准确度与视频压缩效率提升。2.提出了一种基于局部亮度直方图的自适应帧类型决策算法。以局部亮度直方图对于视频时序特性的良好表征能力为依据,以视频中帧类型的高效自适应决策为出发点,设计了一种兼容性更好的固定帧类型决策算法与基于相邻帧间整体差异的自适应帧类型决策流程。所提出的基于局部亮度直方图的自适应帧类型决策算法可以实现在几乎不引入额外计算开销前提下的高效自适应帧类型决策,有效提升视频压缩效率。3.提出了一种自适应四叉树深度预测机制。以编码单元划分深度间的时空相关性为依据,以H.265/HEVC标准中的四叉树划分方式作为入手点,设计了相似编码区域标志位、相似编码区域深度范围预测算法与非相似编码区域深度范围预测算法。所提出的自适应四叉树深度预测机制可以在有效保证编码质量的前提下,显着加速编码过程。
刘宇洋[4](2020)在《视频编码率失真优化技术及其应用研究》文中进行了进一步梳理作为视觉信息的载体,图像视频数据呈现出高分辨率、高维度的发展趋势,使得人们能够获得更加优质的视觉体验。尤其是近期人工智能的飞速发展,人们对智能化生活的需求日益迫切,以数据驱动的多媒体应用必然造成图像视频数据的爆炸式增长,进而带来巨大的数据存储压力和传输带宽需求,极大阻碍了多媒体应用的发展。为了满足多媒体应用的需求,国际标准组织先后发展了多代图像视频编码标准,不断提升图像视频的压缩效率。然而,随着高清、超高清视频及具有沉浸感的三维视频的普及,视频编码效率仍有待进一步提高。为了提升编码效率,大多视频编码技术以增加编码复杂度为代价,极大地降低了视频编码器的实用性。另外,现有视频编码工具大都针对传统图像视频数据格式设计,对于数据格式迥异的图像视频往往无法高效压缩。尤其是近年来逐渐兴起的光场图像数据,现有编码工具已无法取得良好的编码性能。最后,为了达到较高的压缩效率,视频压缩大都采用有损压缩的方式,从而造成不可恢复的压缩失真,对以内容分析为主体的多媒体应用造成难以预计的影响。本文从率失真优化及其应用的角度出发,开展视频编码优化方面的研究工作,主要创新及贡献如下:1.在视频编码变换过程中,可通过增加变换核数量的方式提升编码效率,但编码时间复杂度也随之增高。为了取得编码性能和编码时间复杂度之间更好的平衡,本文分析了最新发展的帧内预测方法,充分考虑了相邻帧内角度预测模式的夹角较小这一特点,从率失真优化角度阐述了帧内预测模式判决、变换核数量和编码时间复杂度三者的关系,提出了对偶互换机制,使得相邻帧内预测模式采用不同的水平和垂直变换核;根据帧内预测残差分布及变换核选择的统计实验结果设计了帧内预测模式依赖变换核查找表,结合对偶互换机制,提出了相邻帧内预测模式的变换核选择方法。实验结果表明,与视频编码参考软件JEM-7.0相比,虽然最新发展的自适应多核变换方法在亮度和色度分量上可分别取得3.38%、0.69%和0.75%的BD-rate节省,但编码时间增加了78%;本文所提算法在亮度分量和色度分量上可取得2.15%、2.55%和2.60%的BD-rate节省,在4K视频序列上,本文算法在亮度分量和色度分量上最高可取得3.97%、3.75%和4.59%的BD-rate节省,平均编码时间仅增加6%,能够在编码效率和编码时间复杂度之间取得更好的平衡。2.为了提升光场图像的压缩效率,本文采用基于伪视频序列的光场图像压缩框架,首先将光场图像转化为多幅子视点图像,然后将子视点图像按照一定的视点扫描顺序生成伪视频序列,最后利用现有视频编码器对伪视频序列进行压缩。在基于伪视频序列的光场图像压缩框架下,伪视频序列中编码帧的排序对编码性能起着至关重要的作用。本文充分考虑了编码过程中编码帧之间的时域依赖性,从视差和视点间的质量差异两点因素出发,提出了新的视点扫描方式,使得生成的伪视频序列中相邻帧之间具有更强的相关性。实验结果表明,与之字形排序方式相比,本文所提算法平均可达16.4%的BD-rate节省。为了进一步提升编码性能,将时域依赖率失真优化方法引入到编码过程中,同时提出了I帧的QP调节策略。实验结果表明,与之字形排序方式相比,改进算法平均可达21.8%的BD-rate节省。3.视频压缩失真会对目标检测性能造成影响,使得编码前后视频的检测结果不一致。本文首先将编码前后视频的检测差异定义为分析失真,然后将分析失真引入到编码的率失真优化过程中,使得在有限带宽限制下压缩失真和分析失真最小。获取分析失真需要反复多次编码并运行目标检测算法,为了避免该过程,本文提出了基于二次编码的优化方法,采用二次编码获得压缩失真,然后构建线性模型利用压缩失真对分析失真进行预测;通过大量统计实验拟合了分析失真和码率之间的函数关系,构建了率失准模型;最终通过求解拉格朗日乘子实现码率、压缩失真和分析失真的联合优化,有效降低了视频编码造成的分析失真。为了进一步降低编码时间复杂度,本文提出了基于一次编码的改进算法,利用时域层级间参考关系对高时域层的压缩失真进行预测,降低了编码时间。实验结果表明,与视频编码标准HEVC(High Efficient Video Coding)相比,本文所提的两种算法最高可降低40%的分析失真。
杜盼盼[5](2020)在《3D-HEVC标准中基于SKIP模式快速帧间编码》文中研究说明数字视频应用的多样性和高清化,人们愈加迫切需要更高的视频压缩效率。新一代视频编码标准H.265/HEVC应运而生。由于引入了一些新的编码技术,3D-HEVC能够在原来的基础上使压缩效率提高1倍。这些新技术对编码效率的提高具有重要意义,例如四叉树递归划分的CU技术来说,也造成了编码计算的复杂度的极大增加。因此,本文主要研究3D-HEVC中基于SKIP模式的帧间编码的快速算法,并致力于优化深度图像编码的计算复杂度。深度图像联合编码帧中,针对当前第一个附属CU为帧间跳过模式(Skipmode)最优编码的情形,提出了一种3D-HEVC中基于SKIP模式的深度视图的帧间编码快速决策算法。鉴于SKIP作为最优预测模式所具有的特性,本文以第一个附属CU的率失真函数值的4倍作为编码结构决策式一侧的下界,并基于此提出决策帧间编码结构划分的判定式。此外,本文还选取3D-HEVC中深度图像对应纹理图像编码块的,提出了在3D-HEVC中基于SKIP模式纹理视图的快速帧间编码方法。本文采用联合视频工作组官方推荐的测试环境参数进行参数设置,及视频测试序列进行算法测试。实验证明上述算法能够在确保合成视点视频质量前提下,降低深度图像帧间编码复杂度,减少编码时间。
薛雅利[6](2019)在《基于内容特性的屏幕内容编码优化》文中指出随着互联网、云计算等技术的高速发展,移动设备、远程桌面、虚拟桌面、无线显示等场景中的屏幕内容视频的应用得到广泛普及。为了满足带宽的需求,屏幕内容视频(Screen Content Video,SCV)的高效编码压缩变得非常重要。目前,国际标准组织已在高效视频编码(High Efficiency Video Coding,HEVC)编码标准基础上,针对屏幕内容视频的内容特性,制定了屏幕内容编码标准(Screen Content Coding,SCC)。针对屏幕内容视频中具有的帧内内容重复,编码块内颜色个数有限,边缘锐化等特点,屏幕内容编码中新增了帧内块复制、调色板模式、自适应颜色变换以及自适应运动向量分解等编码工具,进而提高了编码效率。然而,由于实时系统的编码资源有限,面向屏幕内容视频的编码器设计需要考虑编码复杂度和资源分配等关键优化问题。本文针对屏幕内容编码,从编码低复杂度优化和码率控制优化两个方面开展了相关研究,具体包括:(1)本文提出了基于集成学习的帧内编码单元深度快速决策算法,该算法将编码单元中的深度决策问题看作一个三层二分类问题。为了避免分类器预测引入过大的计算量,本文采用线性分类器作为基础分类器。同时,由于屏幕内容视频中编码单元的数据具有类别分布不均衡的特性,单一的弱分类器预测性能有限。故本文设计集成两个弱分类器得到三输出的分类器,以提高分类器预测的准确率,提升算法的性能。实验结果表明,本文提出的算法在相同视频质量下,相对未优化编码方案平均可节省30%的编码时间,只增加1.6%的码率。此外,本文还提出了基于最优停止理论的预测模式快速决策算法。该算法根据预测模式遍历的过程和模式为最佳模式的占比,将预测模式分为Intra、IBC-Merge、IBC、PLT四类,通过多类分类器预测每种模式成为最佳模式的概率,按照概率降序排序构建模式候选列表,使用最佳停止点提前终止候选列表的遍历,实现编码低复杂度优化。在视频质量相同的情况下,该算法可以节省11%的编码时间。(2)针对SCC中采用的码率控制模型,本文探索了SCV图像特征,量化参数等因素与码率之间的关系,提出了基于支持向量回归的初始量化参数预测算法。该算法以码率,灰度共生矩阵的能量、熵、对比度、相关性四个统计量,共五个特征作为输入,预测初始帧的量化参数,相较于SCC参考软件(SCM8.0)的码率控制算法,本文提出的算法在相同码率下,BDPSNR平均提升0.47dB。同时,本文也提出了基于二次编码的帧级码率分配优化算法。该算法通过预编码和分析当前GOP,以完成GOP内的各帧的码率分配权重预测。实验结果表明,针对桌面、网页等有场景切换类型的序列,该类方法效果提升明显。
陈晓爱[7](2019)在《基于SHVC空间可伸缩的视频加密算法研究》文中研究说明高性能视频编码标准(High Efficiency Video Coding,HEVC)具备显着的压缩性能,在高分辨视频应用中大力推广。其可伸缩扩展版本(Scalable Extensions of the HEVC,SHVC)由于可动态地适应不同的网络环境和用户终端设备,在流媒体服务、视频会议、公共监控等领域备受重视。现有的基于可伸缩视频的加密算法研究成果较少。因此针对SHVC压缩编码标准展开了相应的加密算法研究工作,提出了适用于高清资源版权保护和个人隐私信息管理的可伸缩视频加密算法。1、针对SHVC增强层(Enhancement Layer,EL)视频保护存在的视觉安全性不足等问题,提出了基于层间处理的可伸缩视频加密算法,在层内纹理或运动信息加密的基础上,将加密算法与层间预测过程相结合,大幅度地降低了EL的视频质量,同时保留了码流格式的兼容特性。SHVC的编码框架中包含了三种不同的层间处理模块,为了对比和分析其分别具备的加密性能分别提出了三种加密算法。实验结果表明,算法均具备较高的安全性、稳定性和抗攻击性能,平均降低的峰值信噪比(Peak Signal to Noise Ratio,PSNR)值均大于20dB,SESHVC-C和SE-SHVC-M分别引入的压缩负载均不超过1%。2、基于压缩域提出了SHVC的EL视频加密算法,具备压缩比不变性和格式兼容特性。算法在分析SHVC码流结构的基础上,解复用出待加密的EL数据,从中提取适用于加密的Slice负载,对部分熵解码后的编码单元(Coding Unit,CU)划分模式、帧间预测中候选列表和参考图像索引信息、运动矢量残差(Motion Vector Differences,MVD)和非零量化变换系数(Quantized Transform Coefficients,QTC)的绝对值及其符号进行了加密,最后采取了冲突避免处理。实验结果证实,算法可有效置乱EL视频,稳定性强,可抵御穷举和明文攻击,不引入压缩负载,每帧平均加密时间约为0.17s。3、为了提高公共监控中隐私保护的安全性,提出了基于人脸检测的SHVC感兴趣区域(Region Of Interest,ROI)加密算法。通过椭圆模型肤色检测算法定位到人脸区域,映射至划分后的Tile单元中,对其执行加密处理,使得人脸出现严重的纹理失真,采用限制性的运动估计和运动预测处理防止ROI出现漂移,最后将已加密的Tile单元索引信息嵌入到Slice片段头部扩充数据中,实现了解码端ROI的正确检测。算法可满足ROI的加密要求,具备较高的安全性和鲁棒性,复杂度低,有效地抑制了错误扩散现象,引入了约12.54%的压缩负载。
丰泽琪[8](2019)在《基于HEVC的低复杂度与强网络适应性编码技术研究》文中研究表明随着高清及超高清视频应用的日益普及,视频数据量呈现“井喷式”增长。在有限信道带宽和存储容量的限制下,目前广泛应用的H.264/AVC视频编码标准已逐渐无法满足视频高效存储与传输的需求。因此,着眼于“更高压缩效率”和“更高重建质量”的新一代视频编码标准HEVC应运而生。作为H.264/AVC的继承与发展,HEVC引进了许多先进的编码技术并将压缩效率提高了一倍,但在HEVC向实用化、普及化迈进的征途中其编码速度及网络适应能力仍有待提升。本文以HEVC标准为研究平台,以低复杂度帧内编码和码率控制优化技术为切入点,力求在低复杂度编码和强网络适应性编码的理论研究及应用实践上取得新突破。主要研究内容和成果如下:1.提出一种基于卷积神经网络的帧内编码单元深度快速选择算法。以编码单元深度与其纹理复杂度间的关联关系为依据,以实现编码单元深度范围的预测与灵活选择为研究目标,设计了面向HEVC帧内编码单元深度范围决策的卷积神经网络构建策略。基于该策略设计实现的快速算法与HEVC标准测试模型HM-16.9相比较,可在保证编码单元划分准确度的同时,加速帧内编码过程。2.提出一种基于时空相关性的帧内预测单元模式快速决策算法。以当前预测单元最优模式与其时空相邻预测单元最优模式间的关联关系为依据,以合理简化预测单元的候选模式集为出发点,设计了基于空间相关性的粗模式决策候选模式集简化和基于时间相关性的率失真优化候选模式集简化策略。基于该策略设计实现的快速算法与HEVC标准测试模型HM-16.9相比较,可在保证编码重建质量的前提下,降低帧内编码复杂度。并实现了帧内编码单元深度快速选择算法和预测单元模式快速决策算法的融合,进一步节省了编码时间。3.提出一种基于模型参数自适应预测的码率控制优化算法。通过探究帧间内容相似性,确定与当前编码帧内容差异最小且已编码的最佳关联帧,并依据码率控制模型参数与视频内容的相关性,设计了基于最佳关联帧中已有编码信息的最大编码单元层码率控制模型参数自适应预测机制,以避免原有算法采用依赖于经验值的模型参数更新方式,而引起编码初期码率控制误差较大的不足。基于该机制设计实现的码率控制优化算法与HEVC标准测试模型HM-16.9相比较,能够在不以编码时间为代价的前提下,实现码率控制精度与率失真性能的同步提升。
王钊[9](2019)在《自适应划分预测编码研究》文中认为在信息时代,数字多媒体在人们日常生活中发挥着越来越重要的作用。数字视频,作为多媒体内容的最重要载体,也是人类获取信息、感知世界的最主要途径。由于人们对视觉质量和媒体交互的不断追求,数字视频的分辨率和帧率不断提高,新的视频形式,如虚拟现实、点云、全息等,也在逐渐兴起。视频数据量的爆发增长与新媒体形式的出现对视频编码技术也提出了更高的要求和新的挑战。然而,目前的视频编码技术并不能灵活适应数字视频在数据量、内容特性、媒体形式上的变化,相对固定的编码规则限制了编码效率的进一步提高。因此,本文以自适应决策为出发点,对视频编码中的划分和预测展开深入地研究。本文的创新点主要包括以下几个方面:·基于局部约束的自适应划分树结构。最新视频编码标准采用了多类型划分树组合结构,包括四叉树划分、三叉树划分和二叉树划分等。但组合划分树固定的层次与结构使得在一些图像内容上划分形状不足、在另一些图像内容上划分模式又过多。针对这一问题,本文提出了基于局部约束的自适应划分树结构算法。一方面,利用时空域已编码块信息,解码端自行导出划分参数,可以根据图像内容特性自适应调整划分树使用范围与划分层次,尤其对简单内容能显着约束不必要的划分形状。另一方面,根据不同划分树之间存在的冗余,分析划分对子块编码次序的影响,并依此约束部分划分树类型,消除划分冗余。·基于置信区间的划分决策算法。多类型划分树结构在每层划分时均需要迭代多种划分模式,复杂度极高。为了加速划分决策过程,首先从运动差异场入手,建立率失真模型,能够快速估计率失真代价。然后,将最优划分模式与率失真估计代价之间的关系映射到概率区间,并提出了基于置信区间的划分决策算法。将在置信区间内的划分模式归为可靠模式,在置信区间外的划分模式归为不可靠模式,在保留有效划分的同时显着降低了编码复杂度。·面向内容的自适应预测单元划分。多类型划分树结构的划分灵活性有了一定提高,但在运动物体的边界附近依然不能获得良好的预测效果。本文提出了面向内容的自适应预测单元划分算法,首先通过一个运动矢量指向提供边界信息的参考块的位置。然后,对参考块进行自适应分割,并对每个分割区域使用不同的运动补偿机制。前景区域使用隐式多假设预测,背景区域从局部运动场中导出运动矢量,边界区域进行加权预测。该方法既实现了面向视频内容的自适应划分预测,又不增加过多额外码率开销,对客观压缩效率与主观质量均有提升。·基于率失真优化的自适应运动矢量精度预测。划分是为了更好地预测,而预测性能还依赖于对运动信息的描述准确度。运动矢量精度越高,运动描述越精确,同时自身编码码率也增大。为了在预测质量与运动矢量码率之间达到更好的平衡,本文在预测失真-运动矢量精度、运动矢量码率-运动矢量精度之间建立率失真模式。模型揭示运动矢量精度预测与视频内容的纹理特性和运动特性相关,同时还受到编码环境的影响。基于此,将影响运动矢量精度选择的因素提取为特征,并训练成决策树对每帧图像的最优运动矢量精度进行预测。该方法在预测质量与运动矢量码率之间达到了更好的平衡,提高了压缩效率。综上,本文针对视频编码中的划分和预测,从率失真优化的角度分析了视频内容特性产生的影响,提出了自适应划分树结构、基于置信区间的划分决策算法、自适应预测单元划分以及自适应运动矢量精度预测算法,探索了自适应机制在划分预测编码中的潜力,显着提高了编码效率、降低编码复杂度,对学术研究和实际应用提供了新的思路。
蒋昊[10](2019)在《基于深度学习的增强型视频编码的研究与应用》文中指出随着互联网的发展,视频应用需求急速增长,形式更加多样化,同时也为网络带宽和存储带来了巨大压力。虽然如HEVC等当前流行的视频压缩编码标准已经较为成熟,但面对日益增长的视频数据量和越来越灵活多变的应用场景,其压缩效率仍有进一步提升的空间和需求。与此同时,以卷积神经网络为代表的深度学习算法从2012年以来发展迅速,在图像处理、分类识别等多个领域内获得了引人注目的成果。如何将深度学习工具灵活应用于视频编解码系统中从而提升编码器压缩效率,成为了一个颇受关注的研究领域。另一方面,传统编码框架对于可编码视频的形式限制严格,在面对如虚拟现实、可交互视频等新兴应用场景时适应能力差,往往为了实现特殊功能而牺牲了压缩效率。如何运用诸如可分级编码等扩展编码标准方案对视频编码技术的应用场景进行有效扩充,也是一个值得关注的问题。基于以上背景,本文将从常规视频编码标准和可分级扩展编码标准两个方面,探究如何利用图像修复、超分辨率等深度神经网络对现有编码系统进行改进和增强,以提升视频压缩效率,并在此基础上对其实际应用进行尝试。对于常规视频编码标准,本文提出了基于神经网络在线学习的高效视频编解码系统,利用一个帧图像修复卷积神经网络(FRCNN)对解码图像进行修复,提升解码图像质量。由于在进行网络训练时,仅使用当前正在编码的视频作为数据集,FRCNN能够充分拟合该视频,即便在低码率下依旧能够达到很好的修复效果。在此基础上,我们将网络中的参数经过位宽缩减、哈夫曼编码压缩后作为编码码流的一部分传输到解码端,保证编解码一致性。与HEVC相比,我们提出的基于FRCNN的新编码系统可以实现3.8%-14.0%的BD-Rate下降。同时,FRCNN作为标准编码器的一个外挂模块,不会对原本编码器做任何修改,与HEVC是完全兼容的。针对分辨率可分级编码,我们设计了图像修复-超分辨率综合卷积神经网络来代替标准中原生的图像插值器用于处理基本层的重建图像,从而为增强层提供更加精准的层间参考,大大提升了增强层的编码效率。该网络包含修复子网络、超分子网络前后两个部分并分别设置了不同的目标函数,可以加快网络训练、提升处理效果。实验证明,使用该定制网络可以使增强层比特率减少最高40%,总码流平均减少5.3%。在此增强可分级编码器的基础上,我们还设计了全景视频应用场景下的高效在线可伸缩编码解决方案,希望为现有编码标准灵活应用于新兴视频应用场景提供新的思路。
二、基于四叉树分割视频对象的可伸缩编码算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于四叉树分割视频对象的可伸缩编码算法(论文提纲范文)
(1)基于可伸缩高性能视频编码SHVC的快速算法研究(论文提纲范文)
摘要 |
abstract |
注释表 |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 视频编码技术的发展历程 |
1.3 视频编码快速算法的国内外研究现状 |
1.3.1 HEVC帧内快速算法的研究现状 |
1.3.2 HEVC帧间快速算法的研究现状 |
1.3.3 SHVC快速算法的研究现状 |
1.4 本文主要研究内容 |
1.5 本文的结构及安排 |
第2章 SHVC可伸缩视频编码标准的概述 |
2.1 HEVC编码标准分析 |
2.1.1 HEVC的编码框架 |
2.1.2 HEVC的关键技术 |
2.1.3 HEVC的编码结构 |
2.2 可伸缩视频编码SHVC标准分析 |
2.2.1 SHVC可伸缩视频编码框架 |
2.2.2 SHVC可伸缩编码的类型 |
2.3 SHVC性能评价指标 |
2.4 本章小结 |
第3章 QSHVC帧内编码的快速算法 |
3.1 概述 |
3.1.1 帧内快速算法 |
3.1.2 算法详细流程 |
3.2 编码单元深度范围预测 |
3.3 层间参考模式的提前决策 |
3.4 编码单元划分提前终止 |
3.5 实验结果与分析 |
3.6 本章小结 |
第4章 QSHVC帧间编码的快速算法 |
4.1 概述 |
4.1.1 帧间快速算法 |
4.1.2 算法详细流程 |
4.2 预测单元划分模式决策过程 |
4.3 预测单元提前决策算法 |
4.4 实验结果与分析 |
4.5 本章小结 |
第5章 总结与展望 |
5.1 全文总结 |
5.2 工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间从事的科研工作及取得的成果 |
(2)多模型联合优化的图像视频编码关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 简介 |
1.1 研究背景和意义 |
1.2 研究历史与现状 |
1.3 论文主要工作和内容安排 |
第2章 视频图像编码与深度学习基础 |
2.1 图像与视频编码的概念与框架 |
2.2 传统图像视频编码框架 |
2.2.1 JPEG |
2.2.2 JPEG 2000 |
2.2.3 HEVC标准 |
2.3 深度学习编码 |
2.3.1 深度学习基础 |
2.3.2 深度学习编码 |
2.4 集成学习基础 |
2.4.1 提升法 |
2.4.2 装袋法 |
第3章 面向全景视频的多运动模型联合优化 |
3.1 全景视频压缩概述 |
3.1.1 全景视频压缩概述 |
3.1.2 现有方法 |
3.1.3 本章贡献 |
3.2 算法框架 |
3.3 基于球坐标变换的运动模型 |
3.3.1 经纬图投影格式与球坐标变换 |
3.3.2 球坐标变换运动模型的推导与构建 |
3.4 球坐标变换运动模型的帧间预测算法 |
3.4.1 运动补偿算法 |
3.4.2 运动估计算法 |
3.4.3 合并模式算法 |
3.5 组合优化加速算法 |
3.6 编码与语法设计 |
3.7 实验 |
3.7.1 实验配置 |
3.7.2 测试结果分析 |
3.7.3 实验总结 |
3.8 本章小结 |
第4章 基于集成学习的端到端图像压缩 |
4.1 端到端图像压缩概述 |
4.1.1 动机 |
4.1.2 现有方法 |
4.1.3 本章贡献 |
4.2 框架 |
4.3 基于改进提升法的多模型训练 |
4.3.1 模型的多样性 |
4.3.2 基于改进提升法的模型生成方法 |
4.4 几何自集成 |
4.5 四叉树块划分 |
4.6 多概率分布模型 |
4.7 集成融合和模式选择 |
4.8 实验 |
4.8.1 实验设置 |
4.8.2 总体性能 |
4.8.3 消融实验 |
4.8.4 简化模型实验 |
4.8.5 计算复杂度分析 |
4.8.6 讨论 |
4.8.7 实验总结 |
4.9 本章小结 |
第5章 多模型率失真联合优化的深度神经网络图像环路滤波 |
5.1 研究背景 |
5.1.1 动机 |
5.1.2 现有方法 |
5.1.3 本章贡献 |
5.2 框架 |
5.3 多模型联合训练方法 |
5.4 基于退火思想的模型训练 |
5.5 基于残差幅度块级自适应模型组优选 |
5.6 实验 |
5.6.1 实验设置 |
5.6.2 实验结果与分析 |
5.7 本章小结 |
第6章 总结与展望 |
6.1 本文总结 |
6.2 未来展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(3)基于H.265/HEVC的高压缩率与低复杂度编码技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 研究现状 |
1.2.1 视频编码标准研究现状 |
1.2.2 高压缩率与低复杂度算法研究现状 |
1.3 本文的研究内容及主要贡献 |
1.4 论文的章节安排 |
第2章 高效视频编码标准H.265/HEVC简介 |
2.1 H.265/HEVC标准的发展历程 |
2.1.1 H.265/HEVC标准的提出 |
2.1.2 H.265/HEVC扩展标准 |
2.2 H.265/HEVC标准编码架构与关键技术 |
2.2.1 H.265/HEVC标准编码架构 |
2.2.2 H.265/HEVC关键技术 |
2.2.3 H.265/HEVC标准的编码结构 |
2.3 基于H.265/HEVC标准的编码器 |
2.3.1 x265简介 |
2.3.2 HM简介 |
2.4 本章小结 |
第3章 基于局部亮度直方图的场景切换检测算法 |
3.1 I Slice分析与视频的场景切换 |
3.1.1 I Slice对视频编码效率的影响 |
3.1.2 视频中的场景切换 |
3.2 算法提出动机 |
3.2.1 动机一:计算复杂度过高 |
3.2.2 动机二:全局亮度直方图性能较差 |
3.3 基于局部亮度直方图的场景切换检测算法 |
3.3.1 局部亮度直方图的获取 |
3.3.2 帧间内容变化测度 |
3.3.3 场景切换检测策略 |
3.3.4 算法流程图 |
3.4 实验结果及分析 |
3.4.1 测试条件与测试序列 |
3.4.2 算法性能评估 |
3.5 本章小结 |
第4章 基于局部亮度直方图的自适应帧类型决策算法 |
4.1 固定帧类型决策算法 |
4.1.1 Mini-GOP与标准兼容性拓展 |
4.1.2 基于Mini-GOP的帧类型决策流程 |
4.2 视频时序特性与帧类型 |
4.3 基于局部亮度直方图的自适应帧类型决策算法 |
4.4 实验结果及分析 |
4.4.1 测试条件与测试序列 |
4.4.2 算法性能评估 |
4.5 本章小结 |
第5章 面向H.265/HEVC的自适应四叉树深度预测机制 |
5.1 基于四叉树结构的CTU划分过程复杂度分析 |
5.1.1 最优CTU划分方式决策 |
5.1.2 编码复杂度分析 |
5.2 算法提出动机:CTU间时空相关性分析 |
5.3 自适应四叉树深度预测机制 |
5.3.1 相似区域标志 |
5.3.2 相似区域深度范围预测算法 |
5.3.3 非相似区域深度范围预测算法 |
5.3.4 算法流程图 |
5.4 实验结果及分析 |
5.4.1 测试条件与测试序列 |
5.4.2 算法性能评估 |
5.5 本章小结 |
总结与展望 |
参考文献 |
攻读硕士期间科研成果及科研工作 |
致谢 |
(4)视频编码率失真优化技术及其应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外研究现状 |
1.2.1 视频编码标准发展过程 |
1.2.2 视频变换编码研究现状 |
1.2.3 光场图像压缩研究现状 |
1.2.4 面向内容分析的视频编码 |
1.3 本文的主要贡献与创新 |
1.4 本论文的结构安排 |
第二章 视频编码关键技术 |
2.1 混合编码框架 |
2.2 预测编码 |
2.2.1 编码单元 |
2.2.2 帧内预测 |
2.2.3 帧间预测 |
2.3 变换编码 |
2.3.1 变换单元 |
2.3.2 自适应多核变换 |
2.3.3 信号依赖变换 |
2.3.4 二次变换 |
2.4 视频编码中的误差度量 |
2.5 率失真优化 |
2.5.1 独立率失真优化 |
2.5.2 全局率失真优化 |
2.6 本章小结 |
第三章 低复杂度帧内多核变换 |
3.1 问题描述 |
3.2 相邻帧内预测模式下变换核对偶互换机制 |
3.3 相邻帧内预测模式变换核选择 |
3.3.1 模式依赖变换核选择 |
3.3.2 基于对偶互换机制的亮度分量变换核选择 |
3.3.3 色度分量变换核选择 |
3.4 实验结果 |
3.4.1 实验设置 |
3.4.2 对比方法描述 |
3.4.3 算法性能对比 |
3.5 本章小结 |
第四章 基于伪视频序列的光场图像压缩 |
4.1 光场表示与数据采集 |
4.1.1 光场表示 |
4.1.2 光场数据采集 |
4.1.3 光场图像数据 |
4.2 基于伪视频序列的光场图像压缩 |
4.2.1 子视点扫描方式设计 |
4.2.2 算法流程 |
4.3 算法改进 |
4.3.1 时域传播链 |
4.3.2 拉格朗日乘子求解 |
4.3.3 量化参数调节 |
4.3.4 算法流程 |
4.4 实验结果 |
4.4.1 实验数据 |
4.4.2 对比算法 |
4.4.3 算法性能对比 |
4.4.4 讨论与分析 |
4.5 本章小结 |
第五章 面向目标检测的视频编码优化 |
5.1 问题的提出 |
5.2 分析失真度量 |
5.3 率失准优化 |
5.3.1 率失准模型构建 |
5.3.2 率失准优化问题求解 |
5.4 基于二次编码的优化方法 |
5.4.1 分析失真估计 |
5.4.2 加权因子估计 |
5.4.3 率失准模型参数估计 |
5.4.4 算法流程 |
5.5 基于一次编码的优化方法 |
5.5.1 压缩失真预测 |
5.5.2 量化参数自适应调节 |
5.5.3 基于一次编码的算法流程 |
5.6 实验结果 |
5.6.1 实验数据 |
5.6.2 算法性能对比 |
5.6.3 讨论与分析 |
5.7 本章小结 |
第六章 全文总结与展望 |
6.1 全文总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
(5)3D-HEVC标准中基于SKIP模式快速帧间编码(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究的目的和意义 |
1.2 视频编码标准 |
1.3 国内外研究现状 |
1.3.1 HEVC算法研究 |
1.3.2 3D-HEVC算法研究 |
1.4 论文内容及结构 |
2 3D-HEVC视频编码 |
2.1 HEVC编码标准 |
2.1.1 HEVC编码框架 |
2.1.2 编码树的划分 |
2.2 HEVC编码结构 |
2.2.1 编码单元 |
2.2.2 预测单元 |
2.2.3 变换单元 |
2.3 HEVC关键技术 |
2.3.1 帧内预测 |
2.3.2 帧间预测 |
2.3.3 变换量化 |
2.3.4 环路滤波 |
2.3.5 熵编码 |
2.4 HEVC的3D延续—3D-HEVC |
2.4.1 多视点视频加深度图 |
2.4.2 3D-HEVC编码框架 |
2.4.3 深度图编码技术 |
2.4.4 非独立视点编码技术 |
2.4.5 虚拟视点合成技术 |
2.5 本章小结 |
3 3D-HEVC中基于SKIP模式的快速帧间编码—深度视频 |
3.1 编码模式选择算法研究 |
3.1.1 深度图像编码模式选择 |
3.1.2 深度图像最优编码模式分布 |
3.2 基于SKIP模式的深度图帧间编码快速算法 |
3.2.1 深度图帧间编码快速决策条件 |
3.2.2 深度图帧间编码快速方法的具体流程 |
3.3 实验结果与分析 |
3.3.1 实验设计和评价标准 |
3.3.2 实验结果与分析 |
3.4 本章小结 |
4 3D-HEVC中基于SKIP模式的快速帧间编码—纹理视频 |
4.1 纹理图像的模式选择算法研究 |
4.1.1 纹理图像的模式选择算法研究 |
4.1.2 纹理图像最优编码模式研究 |
4.1.3 纹理图像和深度图像的区别 |
4.2 基于SKIP模式的纹理图快速帧间编码 |
4.2.1 附属CU中都选择SKIP最优编码(Case A) |
4.2.2 附属CU中至少有一个未选择SKIP最优编码(Case B) |
4.3 实验结果与分析 |
4.3.1 实验环境设计与评估准则 |
4.3.2 实验结果与分析 |
4.4 本章小结 |
5 总结和展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
附录 |
(6)基于内容特性的屏幕内容编码优化(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究的目的及意义 |
1.1.1 视频编码技术概况 |
1.1.2 屏幕内容视频编码技术概况 |
1.2 课题研究的国内外现状 |
1.2.1 SCC编码低复杂度优化 |
1.2.2 SCC码率控制优化 |
1.3 拟解决的问题 |
1.4 主要研究内容和结构 |
1.4.1 主要研究内容 |
1.5 论文结构 |
第2章 SCC技术概述 |
2.1 HEVC关键技术 |
2.1.1 HEVC块分割技术 |
2.1.2 预测编码 |
2.2 屏幕内容编码技术 |
2.2.1 帧内块复制 |
2.2.2 调色板模式 |
2.2.3 自适应颜色变换 |
2.2.4 自适应运动矢量分解 |
2.3 本章小结 |
第3章 SCC帧内编码快速算法设计 |
3.1 SCC编码计算复杂度分配 |
3.2 问题模型化 |
3.2.1 线性分类 |
3.2.2 最优停止理论 |
3.2.3 特征提取与分析 |
3.3 算法设计 |
3.3.1 快速编码单元深度决策算法 |
3.3.2 快速预测模式决策算法 |
3.4 仿真实验 |
3.4.1 实验设计 |
3.4.2 结果及分析 |
3.5 总结 |
第4章 码率控制优化 |
4.1 SCC标准码率控制模型 |
4.1.1 SCC码率控制简述 |
4.1.2 SCC码率控制存在的问题 |
4.2 SCC码率控制算法设计 |
4.2.1 初始量化参数预测算法 |
4.2.2 帧级目标码率分配优化 |
4.3 仿真实验 |
4.3.1 实验设计 |
4.3.2 结果及分析 |
4.4 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间的研究成果 |
(7)基于SHVC空间可伸缩的视频加密算法研究(论文提纲范文)
论文摘要 |
abstract of thesis |
引言 |
1 绪论 |
1.1 选题背景及研究意义 |
1.2 国内外研究现状分析 |
1.2.1 基于编码过程的加密研究进展 |
1.2.2 基于压缩域的加密研究进展 |
1.2.3 基于感兴趣区域的加密研究进展 |
1.3 本文研究内容及创新点 |
1.4 本文结构安排 |
2 可伸缩视频编码及视频加密相关 |
2.1 空间可伸缩性 |
2.2 SHVC视频编解码系统 |
2.3 视频编码中的加密域分析 |
2.4 AES算法及密钥序列发生器 |
2.5 视频加密算法评价指标 |
2.6 本章小结 |
3 基于层间处理的SHVC增强层视频加密算法 |
3.1 SHVC层间预测技术分析 |
3.1.1 纹理重采样分析 |
3.1.2 颜色映射分析 |
3.1.3 运动域映射分析 |
3.2 层间处理过程加密方案 |
3.3 增强层层内加密方案 |
3.4 实验结果及分析 |
3.4.1 有效性验证和主观视觉分析 |
3.4.2 客观质量和稳定性分析 |
3.4.3 加密空间和抗攻击能力分析 |
3.4.4 时间和压缩负载分析 |
3.5 本章小结 |
4 基于格式兼容的SHVC增强层压缩域加密算法 |
4.1 可伸缩视频码流分析 |
4.2 基于格式兼容的增强层压缩域加密方案 |
4.2.1 NALU分割及负载提取 |
4.2.2 负载数据处理及选择性加密过程 |
4.2.3 输出比特流格式修正 |
4.3 实验结果及分析 |
4.3.1 主观视觉分析 |
4.3.2 加密空间和客观质量分析 |
4.3.3 穷举和明文攻击分析 |
4.3.4 压缩比和计算复杂度分析 |
4.3.5 综合对比分析 |
4.4 本章小结 |
5 基于SHVC的人脸感兴趣区域加密算法 |
5.1 独立编码单元Tile分析 |
5.2 人脸区域提取及Tile分割 |
5.2.1 基于椭圆模型的肤色检测 |
5.2.2 人脸感兴趣区域分割 |
5.3 感兴趣区域加密处理 |
5.3.1 错误扩散的抑制 |
5.3.2 感兴趣区域索引传递 |
5.4 实验结果及分析 |
5.4.1 主观视觉分析 |
5.4.2 客观质量分析 |
5.4.3 抗攻击能力分析 |
5.4.4 时间和压缩负载分析 |
5.4.5 综合对比分析 |
5.5 本章小结 |
6 总结与展望 |
6.1 本文工作总结 |
6.2 下一步研究方向 |
参考文献 |
在学研究成果 |
致谢 |
(8)基于HEVC的低复杂度与强网络适应性编码技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 HEVC低复杂度帧内编码与码率控制优化算法的研究现状 |
1.2.1 帧内编码单元深度快速选择算法研究现状 |
1.2.2 帧内预测单元模式快速决策算法研究现状 |
1.2.3 面向HEVC的码率控制优化算法研究现状 |
1.3 本文的研究内容及主要贡献 |
1.4 论文的章节安排 |
第2章 高效视频编码标准HEVC简介 |
2.1 HEVC标准的发展历程 |
2.1.1 HEVC标准的提出 |
2.1.2 HEVC的拓展标准 |
2.2 HEVC标准的编码原理与关键技术 |
2.2.1 HEVC标准的编码原理 |
2.2.2 HEVC所涉及的关键技术 |
2.2.3 HEVC标准的编码结构 |
2.3 HEVC标准的测试模型HM |
2.3.1 HM简介 |
2.3.2 HM的下载及使用 |
2.4 本章小结 |
第3章 基于卷积神经网络的帧内编码单元深度快速选择算法 |
3.1 HEVC帧内编码复杂度分析 |
3.1.1 最优帧内编码单元划分方式 |
3.1.2 最优帧内预测模式选择 |
3.1.3 帧内编码复杂度分析 |
3.2 算法提出动机:编码单元深度、纹理复杂度与编码时间关系分析 |
3.3 帧内编码单元深度快速选择算法 |
3.3.1 面向帧内编码单元深度选择的卷积神经网络架构 |
3.3.2 算法流程 |
3.4 实验结果及分析 |
3.4.1 编码环境配置及数据来源 |
3.4.2 客观性能评价 |
3.4.3 编码单元划分结果分析 |
3.5 本章小结 |
第4章 基于时空相关性的帧内预测单元模式快速决策算法 |
4.1 算法提出动机分析 |
4.1.1 动机1:视频序列的空间相关性分析 |
4.1.2 动机2:视频序列的时间相关性分析 |
4.2 帧内预测单元模式快速决策算法 |
4.2.1 基于空间相关性的低复杂度粗模式决策过程 |
4.2.2 基于时间相关性的低复杂度率失真优化过程 |
4.2.3 算法流程 |
4.3 实验结果及分析 |
4.3.1 测试条件及编码环境配置 |
4.3.2 算法性能评价 |
4.4 帧内编码单元深度快速选择与预测单元模式快速决策的融合算法 |
4.4.1 融合算法原理 |
4.4.2 融合算法性能评价 |
4.5 本章小结 |
第5章 基于模型参数自适应预测的码率控制优化算法 |
5.1 最大编码单元层码率控制模型参数更新方式分析 |
5.1.1 最大编码单元层码率控制过程 |
5.1.2 HEVC基准算法中模型参数更新方式的不足 |
5.2 算法提出动机:模型参数的相关猜想与帧间内容相似度分析 |
5.3 面向最大编码单元层的码率控制优化算法 |
5.3.1 模型参数预测 |
5.3.2 算法流程 |
5.4 实验结果及分析 |
5.4.1 测试条件及编码环境配置 |
5.4.2 算法性能评价 |
5.5 本章小结 |
总结与展望 |
参考文献 |
攻读硕士期间科研成果及科研工作 |
致谢 |
(9)自适应划分预测编码研究(论文提纲范文)
摘要 |
abstract |
第一章 序言 |
1.1 研究背景 |
1.1.1 视频编码原理 |
1.1.2 视频编码标准 |
1.1.3 视频编码框架 |
1.2 划分预测编码 |
1.3 课题的提出与本文的主要贡献 |
1.4 论文的组织 |
第二章 相关研究综述 |
2.1 率失真优化 |
2.2 最新编码标准进展 |
2.3 编码单元划分 |
2.4 划分模式决策 |
2.5 运动信息表达 |
第三章 自适应编码单元划分决策 |
3.1 编码单元划分结构 |
3.2 自适应划分参数算法 |
3.3 受约束的二叉树划分算法 |
3.4 基于置信区间的划分决策算法 |
3.4.1 率失真模型 |
3.4.2 基于置信区间的划分决策 |
3.5 实验结果与分析 |
3.5.1 基于局部约束的四叉树二叉树划分算法性能 |
3.5.2 置信区间参数设置 |
3.5.3 基于置信区间的划分决策算法性能与对比分析 |
3.5.4 划分决策算法整体性能表现 |
3.6 本章小结 |
第四章 自适应预测单元划分 |
4.1 自适应预测单元划分框架 |
4.2 自适应划分与运动补偿 |
4.2.1 应用于参考块的图像分割 |
4.2.2 基于局部内容特性的背景区域运动补偿 |
4.2.3 基于多假设预测的前景区域运动补偿 |
4.2.4 基于加权预测的边界区域运动补偿 |
4.2.5 优化决策与语法设计 |
4.3 实验结果与分析 |
4.3.1 模型参数取值 |
4.3.2 算法性能与对比分析 |
4.4 本章小结 |
第五章 自适应运动矢量精度预测 |
5.1 运动矢量精度分析 |
5.2 率失真模型 |
5.2.1 预测失真-运动矢量精度模型 |
5.2.2 运动矢量码率-运动矢量精度模型 |
5.3 自适应运动矢量精度预测 |
5.3.1 分阶运动矢量精度 |
5.3.2 运动矢量精度预测 |
5.4 实验结果与分析 |
5.4.1 率失真模型验证 |
5.4.2 算法性能与对比分析 |
5.5 本章小结 |
第六章 全文总结 |
6.1 本文工作总结 |
6.2 未来研究计划 |
参考文献 |
附录 A 攻读博士学位期间的科研成果 |
致谢 |
(10)基于深度学习的增强型视频编码的研究与应用(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 引言 |
1.2 视频编码基本原理及其发展 |
1.2.1 视频编码标准发展概况 |
1.2.2 通用视频编解码的基本原理 |
1.3 深度学习技术简介 |
1.4 主要研究工作及论文结构安排 |
第二章 视频编解码与深度学习介绍 |
2.1 视频编码 |
2.1.1 HEVC编码框架 |
2.1.2 帧内预测 |
2.1.3 帧间预测 |
2.1.4 变换、量化、熵编码与环路滤波 |
2.2 可分级编码 |
2.3 深度学习在图像领域的应用 |
2.3.1 几种常见网络结构介绍 |
2.3.2 CNN用于图像超分辨率与修复 |
2.3.3 网络压缩 |
2.4 本章小结 |
第三章 基于深度学习的增强型通用视频编码系统 |
3.1 增强编码器设计 |
3.1.1 相关工作 |
3.1.2 基于深度在线学习帧图像修复网络的增强视频编码器 |
3.2 帧修复网络的选取与定制 |
3.2.1 图像修复网络的选取 |
3.2.2 损失函数定制 |
3.2.3 BN层选取 |
3.2.4 网络参数压缩 |
3.2.5 最终网络结构 |
3.3 实验结果及分析 |
3.3.1 性能对比 |
3.3.2 超参数设置 |
3.4 本章小结 |
第四章 基于深度学习的增强型可分级编码系统及其应用 |
4.1 方案设计 |
4.2 应用于视频图像的超分辨率网络设计 |
4.2.1 通用超分辨率网络在视频图像领域的适应性分析 |
4.2.2 高效视频图像修复和超分辨率网络的构建 |
4.3 实验结果及分析 |
4.4 可分级编码应用于VR全景视频 |
4.4.1 问题描述 |
4.4.2 方案设计 |
4.4.3 实验结果 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 研究工作总结 |
5.2 未来工作展望 |
参考文献 |
致谢 |
作者简介 |
四、基于四叉树分割视频对象的可伸缩编码算法(论文参考文献)
- [1]基于可伸缩高性能视频编码SHVC的快速算法研究[D]. 汪富康. 重庆邮电大学, 2021
- [2]多模型联合优化的图像视频编码关键技术研究[D]. 王叶斐. 中国科学技术大学, 2021(09)
- [3]基于H.265/HEVC的高压缩率与低复杂度编码技术研究[D]. 段堃. 北京工业大学, 2020
- [4]视频编码率失真优化技术及其应用研究[D]. 刘宇洋. 电子科技大学, 2020(07)
- [5]3D-HEVC标准中基于SKIP模式快速帧间编码[D]. 杜盼盼. 南京理工大学, 2020(01)
- [6]基于内容特性的屏幕内容编码优化[D]. 薛雅利. 深圳大学, 2019(09)
- [7]基于SHVC空间可伸缩的视频加密算法研究[D]. 陈晓爱. 宁波大学, 2019(06)
- [8]基于HEVC的低复杂度与强网络适应性编码技术研究[D]. 丰泽琪. 北京工业大学, 2019
- [9]自适应划分预测编码研究[D]. 王钊. 北京大学, 2019(09)
- [10]基于深度学习的增强型视频编码的研究与应用[D]. 蒋昊. 西安电子科技大学, 2019(02)