一、WAVELET-BASED FINE GRANULARITY SCALABLE VIDEO CODING(论文文献综述)
石武祯[1](2020)在《图像和视频的深度压缩感知》文中指出压缩感知(compressed sensing,CS)理论为信号采集和重建提供了一种新的模式,其同时实现了信号的采样和压缩过程。具体地,CS理论表明,当信号在某个域中是稀疏的,则可以从比奈奎斯特-香农采样定理所要求的更少的测量值中正确地恢复原来的信号。CS理论从提出开始就一直是研究的热点问题,并且已经给信号处理和通信领域带来了巨大的变革。经过十多年的发展,CS技术得到了进一步的完善,如分布式CS和贝叶斯CS等相继被提出。CS技术也在许多领域得到应用,如磁共振成像和无线广播等领域。然而,CS虽然从理论和应用方面都得到了巨大的发展,但是这几年CS的研究出现了瓶颈。传统的基于稀疏正则模型的CS重建方法要么信号重建质量差,要么具有较高的计算复杂度。因此,研究低复杂度但高重建质量的CS方法是一个迫切的任务。近年来,深度学习在各个领域都取得了突破性的应用,并且能够以较低的计算复杂度获得较好的性能。本文使用深度学习来解决CS研究中的若干挑战性问题,提出图像和视频的深度压缩感知(称之为Deep CS)方法。具体而言,本文主要包括以下四个方面的工作:(1)提出了一种基于卷积神经网络的图像压缩感知框架(称之为CSNet)。CS研究中关注的两个挑战性问题分别是采样矩阵的设计和信号重建方法。一方面,常用的随机采样矩阵与信号无关,忽略了信号的特性。另一方面,主流的图像CS方法虽然取得了很好的重建性能,但却有较高的计算复杂度。为了解决这两个问题,CSNet联合地优化一个采样网络和一个重建网络。其中,采样网络自适应地从训练图像中学习一个采样矩阵,其使得采集到的CS测量值保留更多的图像结构化信息,从而可以更好地进行图像重建。具体地,本文提出学习三种类型的采样矩阵,即浮点矩阵、{0,1}-二值矩阵和{-1,+1}-两极矩阵。后两种采样矩阵是专门为便于存储和硬件实现而设计的。重建网络包括一个线性初始重建网络和一个非线性深度重建网络,其学习一个CS测量值到重建图像之间的端到端映射。实验结果表明,CSNet提供了领先的图像重建质量,同时能够实现快速运行。此外,CSNet使用学习得到的{0,1}-二值矩阵和{-1,+1}-两极矩阵作为采样矩阵依然能够获得与现有的基于深度学习的使用浮点采样矩阵的图像CS方法相当的图像重建质量,并且优于传统图像CS方法使用浮点采样矩阵获得的图像重建质量。另外,实验结果进一步表明,学习得到的采样矩阵能够显着地改进传统的图像CS方法的重建图像质量。(2)提出了一种应用于图像压缩感知的可伸缩卷积神经网络(称之为SCSNet)。SCSNet是CSNet的可伸缩拓展版本,其只需要训练一个模型就可以实现任意采样率下的可伸缩图像采样和重建。特别地,SCSNet同时提供了粗粒度和细粒度的可伸缩性。为了获得粗粒度的可伸缩性,SCSNet被设计为一个单一的采样矩阵加上一个层次化的重建网络。SCSNet的重建网络包含一个基本重建层和多个增强重建层。基本重建层提供基本的图像重建质量,而增强重建层参考较低的重建层并逐步提高图像重建质量。为了获得细粒度的可伸缩性,SCSNet采用贪婪方法选择测量基,从而实现任意采样率的图像采样和重建。与现有的基于深度学习的图像CS方法相比,SCSNet只需要一个模型就可以实现任意采样率下的可伸缩采样和高质量的可伸缩重建。实验结果表明,SCSNet在保持与现有的基于深度学习的图像CS方法相当的运行速度的同时,具有领先的图像重建质量。(3)提出了一种适用于彩色图像压缩感知成像的可迭代卷积神经网络(称之为ICSNet)。ICSNet联合地学习一个稀疏采样矩阵和一个可迭代的多通道联合重建网络。学习得到的稀疏采样矩阵既减少了计算量和存储空间又使得ICSNet能够更好地适用于彩色图像压缩感知成像。可迭代的重建网络进行多通道联合重建,有效地利用彩色图像通道间的相关信息,提高了重建图像的质量。ICSNet是一个轻量级的迭代网络,通过训练得到的迭代器的多次迭代,可以显着地提高重建图像的质量。实验结果表明,ICSNet在保持与现有的基于深度学习的图像CS方法运行速度相当的同时,具有领先的图像重建质量。(4)提出了一种基于卷积神经网络的视频压缩感知框架(称之为VCSNet)。VCSNet是前三个工作在视频域的拓展,其有效地利用视频的帧内和帧间相关性来改善重建视频的质量。具体地,VCSNet将视频序列划分为多个图片组,其中第一帧为关键帧,其采样率将高于其他非关键帧。在一个图片组中,VCSNet使用一个卷积层实现基于块的逐帧采样,这使得采样矩阵可以被自适应地优化。在重建过程中,VCSNet首先使用一个能够有效利用帧内信息的线性卷积神经网络实现逐帧视频重建,然后使用多层次深度特征补偿来用关键帧的信息有效地提升非关键帧的重建质量。这种多层次深度特征补偿方法使得VCSNet更好地利用帧内和帧间相关性来提升视频的重建质量。在6个基准视频上的大量实验表明,与目前主流的视频CS方法和基于深度学习的图像CS方法相比,具有多层次深度特征补偿的VCSNet在客观和主观指标上都显示出更好的视频重建质量。
刘本建[2](2011)在《基于Wyner-Ziv构架的可扩展视频编码的错误恢复研究》文中研究表明随着网络技术和各种计算技术的不断发展,视频服务的需求已多样化。为了提高编码效率和服务质量,可扩展视频编码应运而生。论文从视频传输的实际要求出发,以Wyner-Ziv架构为基础,对可扩展视频编码的鲁棒性传输进行了研究。主要的工作包括以下几个方面:(1)针对异构网络环境,研究了视频编码及其传输中所面临的问题,综述了可扩展视频编码的基本概念、主要理论基础及其不同技术条件下的编码方法,分析了各种可扩展编码结构的优缺点,基于小波变换技术条件下所自然具有的多样可扩展性,选择了可扩展视频编码结构MC-EZBC作为错误恢复设计结构的基础。(2)从Wyner-Ziv视频编码框架出发,综述了其所依赖的理论依据及其来源,在总结现有的Wyner-Ziv视频编码基础上,分析了Wyner-Ziv视频编码的适用性及其在可扩展视频编码中使用所面临的问题,以期能更好地将其应用到本文所设计的错误恢复结构中去。(3)本文设计了一种基于MC-EZBC的新的恢复突发错误的可扩展视频编码系统。在该系统中,视频信号采用MC-EZBC编码的同时利用Wyner-Ziv结构来进行错误恢复编码。在解码端,用MC-EZBC解码器获得的错误版本作为边信息输入到Wyner-Ziv解码器中用辅助信道中的有意义的奇偶校验位来进行错误恢复。仿真结果表明与前向纠错码相比,Wyner-Ziv描述位能有效纠正错误,提高最终重构帧的质量。
魏卓[3](2011)在《含GPU环境高清视频图像处理算法研究与实现》文中指出随着网络技术的发展以及多媒体技术的逐步成熟,多媒体技术已经广泛应用于社会的各个领域。高清视频图像信息量巨大,其应用对现有视频图像处理、存储、以及网络传输提出了新的要求。为了提高高清视频图像的处理效率,降低延时,新的运算体系结构和高性能计算方法层出不穷。在现有计算机系统体系结构中,发展趋势之一是多核CPU系统结构;另一个发展趋势是包含有图像处理器的异构多核结构(CPU+GPU)。研究了在后者结构环境里,从理论上如何提高高清视频图像处理中转码、编码的并行性,提出了相应的并行性算法,给出详细的测试数据和对比结果。主要研究和创新工作如下:1,分别对HARR和5/3小波变换,提出了基于异构多核平台下并行整数小波变换方法。依据HARR小波变换的原理,以四个相邻位置的像素为单位做并行计算。根据5/3整数小波变换原理,以行为单位对其做并行计算。与CPU结构整数小波变换计算时间相比较,在GPU多核结构平台下采用5/3小波处理高清图像的计算时间减少了90%左右。2,提出了一种MPEG-2/H.264帧内并行快速转码算法PFIT,算法包含三个并行计算环节:以解码过程中的DCT因子为研究对象,并行统计图像各个宏块的平滑性,预判H.264帧内编码的宏块模式选择;对DCT信息做并行IDCT计算,使其解码到像素域;在像素域对图像做SOBEL边缘检测,并行统计和分析了4×4,8×8和16×16内的方向性,最终确定H.264帧内编码预测模式。通过OpenMP在双GPU平台上对前两个步骤同时并行计算。实验结果表明,在牺牲较小PSNR条件下,PFIT算法降低帧内转码的时间复杂度,与标准级联算法运算时间相比较减少了50%左右。3,提出了一种MPEG-2/H.264帧间并行快速转码算法PFPT,算法包含三个并行环节:通过对MPEG-2帧间解码信息再利用,并行预判宏块运动强度,进一步预判Intra模式选择或Inter模式分割,将MPEG-2宏块的1/2精度运动矢量指定为H.264帧间宏块编码的预测运动矢量PMV,根据PMV变化动态调整H.264运动估计的搜索窗口;并行计算H.264七种分割模式的预测差SAD(Sum of Absolute Difference);对帧间编码并行计算运动估计。通过OpenMP在双GPU平台上对前两个步骤同时并行计算。实验表明与标准级联转码算法运算时间相比较减少了90%左右。4,在2,3的算法基础上,提出了一种MPEG-2/H.264分辨率并行快速转码算法PFRT。首先,分析帧内分辨率转码算法,利用邻近四个宏块预判模式,预估重构宏块的模式选择,预测模式选择仍然采用3中SOBLE边缘检测来进行预判。其次,分析帧间分辨率转码算法,利用邻近四个宏块的解码信息分析各个宏块的运动复杂度,对重构宏块做模式分割选择以及预测运动矢量的估计。实验表明,在与标准级联算法在时间复杂度上比较中,帧内分辨率转码算法计算时间减少了50%,帧间分辨率转码算法计算时间减少了90%。5,在以上算法的基础上,提出了含双GPU环境下高清视频图像处理的框架结构,提出了基于上述框架的眼科远程医疗系统,该系统能有效对高清视频图像做并行处理。
李文静[4](2010)在《空间可伸缩视频编码中上采样技术研究》文中研究指明随着网络技术和多媒体技术的迅猛发展,基于网络的多媒体获得了十分广泛的应用。当前的媒体应用环境具有网络形式的异构性、终端设备的多样性以及多媒体应用的复杂性等特点,从而造成了目前多媒体应用面临的困难和挑战。可伸缩性视频编码技术提供内嵌多层子码流来提供不同时间、空间、质量等各种尺度的可伸缩功能,从而摆脱传统的单层视频编码而具有良好的适应能力。空间可伸缩视频编码可为同一比特流提供各种分辨率的视频序列,而各种分辨率需通过对低图像分辨率序列上采样得到。首先,本文结合人眼视觉系统的特点,提出了一种简单高效的用于空间可伸缩视频编码中的层间上采样滤波方案。基于人眼对图像亮度信息的变化比色度信息的变化要敏感的多这一特性,该方案通过简化图像色度分量的上采样滤波器来减少上采样插值运算量,以提高编码效率。其次,我们又提出了一种分类上采样滤波算法,该方法将图像分为边缘区域和平滑区域,在该方案中,我们对边缘处采用维纳滤波器而非边缘处采用传统上采样滤波器,以更好的恢复上采样图像序列的边缘信息。实验结果表明,方案一在大幅度减少色度分量的上采样插值运算量的情况下,能够保持编码码率和PSNR’性能几乎不变,方案二在不增加太多运算量的情况下有效的降低了编码码流提高了PSNR性能。
任巨[5](2010)在《基于流计算模型的视频编码关键技术研究》文中提出数字视频,是信息时代中获取信息的重要途径,它广泛应用于视频会议、远程医疗、远程教学、网络视频点播、高清数字电视广播、数字电影以及数字视频存储等领域。视频压缩编码是数字视频应用的核心,计算量大、算法复杂,是典型的计算密集型应用。随着视频逐渐向高清发展,视频压缩编码对计算性能的需求越来越高,已经达到每秒万亿次级。现有的运行于通用处理器上的串行结构编码器已经不能满足高性能视频编码的需求,而专用硬件实现的编码器又具有灵活性差、开发周期长、成本高等缺点。因此在高性能视频压缩编码领域,可编程处理器上基于并行计算模型的编码器成为新的研究方向。流计算模型是近年来新兴的一种并行计算模型,已经在包括视频编码在内的媒体处理、信号处理、科学计算等密集计算应用的加速领域获得了成功。流计算模型通过对计算密集性、多级并行性、多层次局域性的充分挖掘,使视频编码应用获得显着的性能提升。然而,在视频向高清甚至未来超高清的发展过程中,视频图像分辨率的增大、编码实时性和压缩率要求的提高、视频编码本身固有的特征都向基于流计算模型的视频编码提出了一系列新的问题,包括流计算视频编码的扩展性问题、编码过程中广泛存在的相关性问题和高分辨率视频编码的计算性能问题等等。在此背景下,本文选择了“基于流计算模型的视频编码关键技术研究”作为博士研究课题。针对基于流计算模型的视频编码所面临的扩展性、相关性和计算性能问题,本文在视频编码的并行计算流框架、高效并行流算法、相关性约束消除、流化视频编码器的高效执行等四个方面,完成了以下创新性研究工作:1、提出一种基于流计算模型的具有扩展性的视频编码框架——视频编码的可扩展流框架VSSF。VSSF旨在解决视频编码器面临的并行粒度扩展、并行度扩展、图像规模扩展和编码模块扩展等四个方面的问题。VSSF以流计算模型为基础,将视频编码中的计算和访存解耦合,计算部分封装在多个独立的计算核心引擎中,以数据带的形式进行访存。VSSF通过向片外存回数据的方式割裂了不同计算核心引擎之间在并行实现方式上的联系,从而支持并行粒度扩展;VSSF具有灵活的数据组织机制,通过修改数据带的组织方式支持并行度扩展;VSSF的设计与视频图像分辨率无关,因此可以通过修改每个计算核心引擎所处理数据带的数目来支持图像规模扩展;VSSF是一种开放性的并行框架,各个计算核心引擎之间属于松散耦合关系,从而支持视频编码模块扩展。2、提出一种基于流的计算量低、计算和访存规则的帧间预测算法——多分辨率多窗口帧间预测MRMW。针对帧间预测计算量大、计算不规则的问题,本文提出多分辨率多窗口帧间预测算法MRMW,同时满足计算量降低和计算规则两个方面的需求。MRMW通过将帧间预测划分为降分辨率全搜索、多窗口精化搜索、运动补偿等三个独立的搜索步骤,降低了帧间预测中非规则问题的影响。MRMW通过在多个不同级别分辨率的图像中搜索候选运动矢量的方法有效降低计算量。MRMW的多窗口精化搜索则能够获得更加精确的运动矢量。另外,针对多窗口的选择问题,本文基于运动矢量预测原理提出双向相关运动矢量选择法,综合利用当前宏块周围各方向相邻宏块的相关性,使预测更为准确。3、提出相关性约束对并行限制的消除方法,解决视频编码中各种相关性问题。针对视频编码模块中存在的数据相关、控制相关、码流存储的优先约束等多种相关性问题,分别提出解决方案来消除它们对基于流计算的SIMD并行的限制:针对码流存储过程中的优先约束,创新性地提出了基于数据并行的CAVLC方法,割裂了计算与访存紧密耦合引起的串行路径,使具有典型串行特征的CAVLC打破了优先约束的限制,实现了并行的CAVLC。针对帧内预测的块间数据相关,基于对相关关系的分析,采用分阶段块级并行方法,提高帧内预测并行度和数据吞吐率。针对去块滤波中的多层次双向数据相关问题,提出分组并行法,实现细粒度的数据并行。4、提出一种通过提高异构核协同效率来加速视频编码执行的方法——软硬结合的异构核协同方法。针对流化视频编码核心程序在经典流体系结构中执行性能低的问题,提出了软硬结合的异构核协同方法。该方法避免了单纯使用软件方法进行异构核协同导致效率低下问题,在硬件结构、软件模块、指令集和编译等多个层次上进行设计和扩展,共同完成标量处理核和流处理核间的协同工作:在硬件结构层次设计了异构核协同单元,负责完成对性能需求较高的协同任务;在软件层次设计了软件协同模块,并提供相对应的编译扩展支持,负责灵活性较高而复杂的协同任务。实验结果表明,软硬结合的异构核协同方法使异构核间的协同性能提升2个量级,而在硬件开销方面只增加整个流处理器芯片面积的2%左右。本文还在流处理器、GPU、多核CPU和DSP等多个并行计算平台上实现了H.264 VSSF编码器。使用高清视频序列HD-VideoBench测试的结果显示,VSSF编码器对1920x1080视频的H.264编码在上述平台获得了十分显着的性能提升,并且在流处理器上达到了实时编码的性能需求。
刘娜[6](2010)在《可伸缩视频编码算法研究与优化》文中研究表明近年来面向网络应用的视频服务飞速增长,视频越来越多地被各种应用所采用。由于用户使用的设备具有多样性,视频应用环境差异性很大,加上网络带宽的时变性,使得传统的只有单一速率的视频码流很难满足终端设备多样化、网络异构以及带宽变化的特性,因此视频业务系统需要一种能够适应于各种不同的网络环境和用户终端的编码系统。可伸缩视频编码由于具有单次编码多次解码的特性,为解决视频码流的适应性问题提供了新的思路,成为目前研究的热点。本文对基于H.264和基于小波变换的可伸缩视频编码算法进行了深入研究,分析两种方法的编码原理和实现框架,比较了两者在性能上的差异。在此基础上,论文对优势明显的H.264 SVC编码方案进行了优化,主要包括以下两个方面:(1) H.264 SVC的编码优化。原始编码算法在宏块编码模式的判决时,采用率失真优化全遍历策略对不同分块进行运动估计来选取最优模式,极大增加了编码器的计算复杂度。SVC与AVC最大的差异就是多层编码,各空间层图像之间具有相关性,论文利用编码过程中的层间预测信息,提出了一种基于层间统计的快速模式决策算法,大大缩短了宏块编码模式判决时间,提高了编码效率。(2) H.264 SVC的解码优化。由于SVC码流具有空间、时间和质量可分级特性,因此解码算法的复杂度比较高,很难满足实时应用的需要。论文对H.264 SVC解码算法进行了优化,综合使用程序代码优化、处理器优化和算法改进多种手段,提高了解码速度。经过优化,SVC编码端速度提高了一倍,解码端可实现在普通PC平台上4CIF视频的实时解码,取得了较好的优化效果。
王文答[7](2009)在《小波视频编码与动态码率传输技术研究》文中认为本课题从不可控网络下的视频传输应用出发,针对在带宽波动情况下为用户提供最优化视频体验这一目标,对比分析了现有各种小波视频编码算法并选定最符合要求的编码框架,在该框架基础上进行编码算法的优化研究,从编码、传输、解码等环节综合考虑给出了动态码率传输控制算法。它能够提高视频应用对网络状况变化的适应能力,提升用户的视频体验。本文提出了一种改进的多帧预测无更新杠铃提升运动补偿时域滤波算法,给出了基于块运动模型的多帧预测快速运动估计方法,在提高编码效率。在该算法中,提出的层次化参考帧集合选择方法充分考虑了时域可伸缩性,能够支持视频传输时的帧率动态调节,为动态码率传输和控制提供了条件。本文在上下文模型嵌入零块编码算法基础上提出了基于位长四叉树和上下文模型的嵌入零块编码算法。该算法继承了上下文模型嵌入零块编码算法编码效率高、质量可伸缩性好等优良特性,同时解决了原算法占用内存较大的问题。小波视频编码算法一般内存消耗较大,因而一定程度上制约其应用,本文提出的改进算法相比原算法节省了编码过程中80%的主要内存消耗,在小波编码算法领域具有通用性,有较大的应用推广价值。本文结合基于位长四叉树和上下文模型的嵌入零块编码算法提出了一种带描述的流打包方法。编码器在编码过程中预先产生对二次码流提取起辅助作用的流描述信息,流媒体服务器通过解析流描述信息即可根据目标码率大小快速完成二次码流的动态提取和分发,并使得该码流接近率失真准则的最优值,因而大大降低了流媒体服务器在二次码流提取时的运算量,该方法在并发用户数高的大规模视频业务系统中具有较高的应用价值。本文在对小波视频编码方案进行优化和改进的基础上提出了一种改进的动态码率传输控制算法,通过编解码算法和传输控制算法的有效结合,大大减少了不可控网络下视频播放过程中出现的停顿、缓冲、中断,视频画面中出现的马赛克、拖影等严重影响用户体验的现象,显着提升用户视频体验。基于本文优化后的小波视频编码方案,流媒体服务器利用本文提出的动态码率传输控制算法可以很方便地进行二次码流提取和分发。与直接将编码器集成到流媒体服务器进行动态码率调整的方案相比,本文提出的方案大大降低了流媒体服务器的性能消耗,适用于大规模的视频业务应用。
向友君[8](2009)在《可伸缩视频编码关键技术研究》文中指出近年来,由于Internet固有的网络异构性、用户终端设备的显示能力和处理能力存在差异,给多媒体信息的广泛传播和应用提出了巨大的挑战。视频编码的目标从面向存储转到了面向传输,编码的目的从产生适合存储的固定尺寸的码流发展到产生适合一定的传输码率的可伸缩性码流。可伸缩视频编码(Scalable Video Coding,SVC)技术(通常又称为可扩展或可分级视频编解码技术)因其能较好地解决这些问题而得到广泛的关注,其核心思想已被目前几种主流的国际视频标准接纳。本文在对基于小波变换的可伸缩视频编码框架和基于传统的混合编码结构的可伸缩视频编码框架进行分析的基础上,重点研究了两类可伸缩视频编码方案都涉及的几个关键技术:运动补偿时域滤波、运动估计以及差错掩盖。具体来讲,本论文的主要研究工作如下:首先,介绍了视频编码标准的发展状况,对可伸缩视频编码技术进行了详细说明,并给出了各项技术的编解码架构框图。其次,详细研究了运动补偿时域滤波技术及基于运动补偿时域滤波的可伸缩视频编码残差图像的特性。运动补偿时域滤波技术的研究主要包括3个方面:一是为了更好地利用相邻帧之间的相关信息,研究了不同长度滤波器系数的小波基实现MCTF的提升过程,以达到更好的滤波效果;二是根据视频序列的运动特征,研究运动补偿时域滤波的帧组结构,使之能够根据视频序列的运动剧烈程度自适应确定帧组大小;三是为增强时间滤波的灵活性,充分利用人眼视觉系统特性,根据具体情况优化小波提升中的滤波操作。在改进运动补偿时域滤波技术的基础上,本文实现了一种完全可伸缩视频编码系统,改进后的系统不仅能将时间、空间、质量这3个方面的伸缩性有机地结合起来,实现了完全可伸缩性能,还显着提高了编码效率和视频序列的重建质量。论文对运动补偿时域滤波残差图像能量的非平稳特性、时空相关特性和频率特性进行了大量实验,对实验数据进行了较详细地分析,并讨论了不同特性视频序列在编码中应该注意的问题。再次,改变运动估计模式,降低运动补偿复杂度,研究高效率的运动估计算法和有效的评价准则。利用序列图像的相邻块运动矢量的高度相关性和运动矢量的中心偏移特性,提出一种基于运动方向预测的快速运动估计算法。算法根据参考运动矢量预测出图像块的运动情况,然后根据不同的运动方向选择对应的方向性模板进行搜索。匹配的准确性是运动估计的核心问题。论文在对传统匹配准则分析的基础上,提出了一种利用图像差值分布情况作为匹配准则的方法,即图像差值均方差匹配准则,获得了比较高的编解码质量。最后,针对传输误码导致视频图像块和整帧丢失的情况,研究了视频图像后处理技术中的差错掩盖,并提出了以下三种差错掩盖算法。第一种是基于帧间信息的视频传输丢失差错掩盖算法。该算法根据丢失块周围已正确接收的图像块的运动矢量信息把丢失块分成低活动块和高活动块两类。对于低活动块,用平均运动矢量法来恢复丢失块;对于高活动块,根据前后帧图像具有空间结构相似性,利用凸集投影的原理来恢复丢的图像块。第二种是空-时边界匹配差错掩盖算法,算法中引入一种同时利用视频图像空域和时域平滑特性的边界匹配失真函数,通过最小化这个失真函数来找到每个丢失宏块的运动矢量,进而恢复丢失的图像块。第三种是基于人类视觉系统特性的偏微分方程差错掩盖方法,在上一种方法的基础上,将重建图像的优化问题看成一个各向异性扩散的平滑图像问题,该方法直接提高了重构宏块与周围像素的匹配程度。
吴云[9](2009)在《新一代视频编码标准关键算法的研究与优化》文中研究表明随着多媒体和计算机网络技术的发展,数字视频编码在许多领域中得到了广泛的应用,包括可视电话、视频会议、IPTV和数字电视等。为了满足不断发展的应用需求,近几年来,许多国际标准组织相继制定发布了一系列新的视频编码标准。其中以H.264、AVS为代表的编码标准,由于具有比以往标准更出色的性能,被人们称为新一代视频编码标准,它们是目前的研究热点。本文研究的内容是新一代视频编码标准(H.264、AVS)关键算法的研究与优化,主要从变换编码、预测编码、分级编码等方面进行算法研究和原理上的优化,以及将编码算法移植到DSP平台上进行的算法代码级优化。在变换编码方面:提出了一种n阶整数DCT变换基的通用生成算法。通过对DCT变换原理的研究,发现了变换基系数取值个数与阶数的关系,并结合余弦函数的性质对其进行了证明。以此为基础,提出了一种n阶整数DCT变换基(n=2k,k>0)的通用生成算法(本算法无需对相应的浮点基进行具体分析)。通过巧妙排列系数的序号使得生成的中间多项式具有极强的规律性,最后设计了一个N位M进制数来实现N重循环用以穷举所有可能解,成功对任意N元多项式组进行了求解。实验结果表明,只要计算机的能力足够强大,应用此算法便可以发现任意n×n(n=2k,k>0)整数DCT变换的所有可用基。在预测编码方面:首先分析了预测编码中帧内预测和帧间预测的流程,找出其中可能的改进优化点。通过在阅读大量文献和实践的基础上,对帧间预测和帧内预测模块都广泛适用的全零块阈值问题进行了深入的研究。利用数学和统计相结合的方法分析出了目前利用全零块进行提前终止时的阈值的不足,进而提出了基于量化参数的全零块检测算法,并建立了不同代价函数和不同块划分模式下所对应的全零块阈值模型。与Yang的算法进行比较分析得出:当量化参数较低时,计算性能有稍微下降,但PSNR有0.05db左右的提高;当量化参数较高时,在计算性能提高10%-18%的同时,PSNR也提高大约0.04db。对帧内预测部分,我们依据最可能的模式和最佳模式之间的相关性获得一个最可能模式与最佳模式矩阵。在帧内预测模式判决时,结合全零块提前终止算法,利用得出的这个模式矩阵来遍历各模式在无任何PSNR下降的前提下可以节省9%-15%的计算周期;如果使用精简模式矩阵,则在PSNR下降大约0.03db的情况下可以获得33%-48%左右的计算性能提升。在分级编码方面:提出了一种按频谱进行视频分级编码的方法。MPEG-2中的数据分割就是一种最早的频谱分级编码,但其分级粒度较大,实用性不高,本文的算法能实现较细粒度的分级(9级)。按频谱进行分级的编码方法具有比较灵活的分级性、计算复杂度低且编码效率较高,但在帧间预测时存在严重的误差积累问题,因为只传输部分频段上的DCT系数,会引起解码器的参考图像与编码器的参考图像的不一致,从而造成误差积累。本文通过设置变换域的参考图像,很好地解决了这一问题。AVS-P2是我国具有知识产权的新一代视频压缩编码标准,并已经通过审批成为国家标准。本文将提出的分级编码算法与AVS-P2相结合,在AVS-P2编解码的框架下,实现本文提出的基于DCT频谱分级编码算法。最终,在AVS-P2的软件编解码模型rm52j版本的基础上,实现了本文的算法,并给出了实验的结果。在算法代码级优化方面:我们成功的将AVS编码算法移植到基于达芬奇(DaVinci)技术的TMS320DM6446平台上;并对编码算法进行项目级优化、Cache性能优化、数据传输优化(EDMA)、线性汇编优化等一系列优化技术,在每一个阶段给出相关的性能测试。本文优化的最终结果,算法的性能在没有损失图像质量的前提下把帧率从最初移植后的3.8fps提高到了93.6fps,达到CIF实时。
王镇道[10](2008)在《视频压缩的运动估计与小波方法研究》文中研究表明图像是人类获取信息的主要途径,而图像压缩在数字图像的处理、存储和传输中起着十分重要的作用。运动估计和运动补偿是消除视频信号时间冗余的主要方法,是视频压缩编码的关键技术。本文在空间域运动估计方法、小波域运动估计方法,以及小波变换在图像压缩中的应用等方面进行了研究和探讨。主要工作与贡献如下:(1)提出了一种空间域物体运动特征自适应的运动估计算法,主要包括搜索起点预测模型和自适应搜索方法两部分。基于物体的整体性和运动的连续性,搜索起点预测模型随相邻块运动相关性的变化调整模型参数,预测结果更加接近最佳运动矢量。根据绝对误差和的梯度和物体的运动特征,自适应搜索调整模板的大小和形状,从而加快搜索速度。实验结果表明,该算法在峰值信噪比(PSNR)和搜索速度以及重建图像的主观质量方面优于其它快速运动估计对比算法。(2)提出了一种小波域的初始运动矢量预测方法和交叉搜索运动估计方法。初始运动矢量预测方法利用小波变换的多分辨率特性,以及块的时间和空间关联性,并结合低频子带全搜索方法,在运算复杂度增加极小的情况下,得到更准确的初始运动矢量。根据小波子带系数的特点,在低频子带平移后,交叉搜索沿水平和垂直方向进行,通过调整交叉搜索中心,逐步逼近最优的运动矢量。运动估计按小波变换级数进行,在每个分辨率层次,搜索范围局限于参考帧对应变换级数下的4个平移子带,得到的是当前分辨率下的最优运动矢量,保证了解码图像是已接收数据下的最佳图像。仿真结果验证了初始矢量预测和交叉搜索方法的有效性。(3)通过分析运动补偿时间滤波(MCTF)更新算法对重构图像PSNR的影响,研究了一种内容自适应的MCTF反向运动补偿算法。根据简单量化独立信源编码的平均绝对误差和计算方法,分析了更新步骤缺省时编码端高、低频子带的能量增益系数的变化,并得出更新步骤是否缺省时,因能量归一化所导致的解码端奇、偶数帧之间的PSNR变化。基于预测和更新步骤的运动矢量互为反向的原则,提出了一种反向运动补偿矢量的获取方法。仿真实验表明该方法可以改善重构图像的PSNR。根据小波变换的子带系数特性,建立了图像平坦区域的估算模型;根据运动估计后的高频子带能量,建立了运动估计准确程度的估算模型,从而实现了具有内容自适应特性的MCTF反向运动补偿算法,减小了ghosting伪影,克服了由于运动估计的不准确以及更新步骤可能导致的低频子带反向补偿误差。仿真实验证明了该方法的有效性。(4)设计了一种高效低功耗的二维小波变换器VLSI结构,提出了采用该小波变换器的视频压缩系统方案和系统优化方法。二维小波变换器采用基于提升算法的可分离二维变换结构,对行、列小波处理器的数据调度方法进行了优化。采用Z形扫描方法,用少量暂存器缓冲列滤波结果,实现了行、列处理器并行工作,提高了数据处理速度和硬件利用率。通过优化列处理器的数据调度,处理每个点只需读取或存储一次数据,将存储器访问带宽降低了50%,从而用单口RAM替代了双口RAM,大大减少了存储器所占芯片面积和功耗。整个设计进行了FPGA验证,并采用HJTC 0.18μm工艺库完成了综合与版图设计,设计的芯片通过了流片验证。(5)针对氧化铝熟料烧结回转窑生产过程,提出了一个视频压缩系统设计方案。该系统包括多媒体专用DSP、二维离散小波变换器、摄像头以及网络传输等部分。通过回转窑火焰图像的压缩进行了仿真实验,实现了黑把子图像在不同空间分辨率、时间分辨率和不同PSNR条件下的压缩与重构,完成了在极低码率下黑把子的准确识别,说明了该系统可有效应用于回转窑火焰图像的压缩。
二、WAVELET-BASED FINE GRANULARITY SCALABLE VIDEO CODING(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、WAVELET-BASED FINE GRANULARITY SCALABLE VIDEO CODING(论文提纲范文)
(1)图像和视频的深度压缩感知(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究的目的和意义 |
1.1.1 课题研究背景 |
1.1.2 课题研究意义 |
1.2 压缩感知 |
1.2.1 压缩感知理论概述 |
1.2.2 压缩感知研究中的挑战性问题 |
1.2.3 压缩感知和信源编码的异同 |
1.3 课题来源及主要研究内容 |
1.3.1 课题来源 |
1.3.2 研究内容及主要贡献 |
1.3.3 论文结构与章节安排 |
第2章 国内外研究现状 |
2.1 压缩采样矩阵的设计 |
2.2 基于优化的压缩感知重建 |
2.2.1 稀疏信号的压缩感知重建 |
2.2.2 基于优化的图像压缩感知重建 |
2.3 基于优化的视频压缩感知重建 |
2.3.1 基于 3D稀疏正则的视频重建 |
2.3.2 基于运动估计的视频重建 |
2.4 基于深度学习的压缩感知重建 |
2.4.1 卷积神经网络介绍 |
2.4.2 深度网络作为后处理的压缩感知方法 |
2.4.3 基于端到端优化深度网络的压缩感知方法 |
2.4.4 基于可解释深度网络的压缩感知方法 |
2.5 重建质量的评价方法 |
2.5.1 主观评价方法 |
2.5.2 客观评价方法 |
2.6 图像和视频压缩感知的应用 |
2.6.1 压缩成像 |
2.6.2 基于压缩感知的信源编码 |
2.6.3 基于压缩感知的无线广播 |
2.7 本章小结 |
第3章 基于卷积神经网络的图像压缩感知 |
3.1 问题描述 |
3.2 提出的方法CSNet |
3.2.1 CSNet的概述 |
3.2.2 采样网络 |
3.2.3 重建网络 |
3.2.4 学习二值和两极采样矩阵 |
3.2.5 损失函数 |
3.3 实验和分析 |
3.3.1 数据集和执行细节 |
3.3.2 CSNet与主流的图像CS方法的比较 |
3.3.3 CSNet学到的采样矩阵的分析 |
3.3.4 传统方法使用学到的采样矩阵 |
3.3.5 基于CSNet的彩色图像压缩采样和重建 |
3.4 本章小结 |
第4章 基于可伸缩卷积神经网络的图像压缩感知 |
4.1 问题描述 |
4.2 提出的方法SCSNet |
4.2.1 SCSNet的概述 |
4.2.2 粗粒度可伸缩 |
4.2.3 细粒度可伸缩 |
4.3 实验和分析 |
4.3.1 数据集和执行细节 |
4.3.2 SCSNet与主流的图像CS方法的比较 |
4.3.3 细粒度可伸缩分析 |
4.3.4 SCSNet与CSNet学到的采样矩阵的比较 |
4.4 本章小结 |
第5章 基于可迭代卷积神经网络的彩色图像压缩感知 |
5.1 问题描述 |
5.2 提出的方法ICSNet |
5.2.1 ICSNet的概述 |
5.2.2 基于稀疏矩阵的压缩采样 |
5.2.3 迭代的多通道联合重建 |
5.2.4 损失函数 |
5.3 实验和分析 |
5.3.1 数据集和执行细节 |
5.3.2 ICSNet与主流的图像CS方法的比较 |
5.3.3 消融实验和讨论 |
5.4 本章小结 |
第6章 基于卷积神经网络的视频压缩感知 |
6.1 问题描述 |
6.2 提出的方法VCSNet |
6.2.1 VCSNet的概述 |
6.2.2 基于单关键帧的VCSNet-1 |
6.2.3 基于双关键帧的VCSNet-2 |
6.2.4 损失函数和训练方法 |
6.3 实验和分析 |
6.3.1 数据集和执行细节 |
6.3.2 VCSNet与主流的图像和视频CS方法的比较 |
6.3.3 多层次深度特征补偿和逐像素残差补偿的比较 |
6.4 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(2)基于Wyner-Ziv构架的可扩展视频编码的错误恢复研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景和意义 |
1.2 可扩展视频编码的研究现状 |
1.3 Wyner-Ziv编码研究现状 |
1.4 本文的研究目标和内容 |
2 可扩展视频编码技术 |
2.1 可扩展视频编码的基本概念 |
2.2 可扩展视频编码的理论基础 |
2.3 可扩展视频编码的编码方法 |
2.4 可扩展视频编码的结构分析 |
2.5 小结 |
3 Wyner-Ziv视频编码技术 |
3.1 Wyner-Ziv视频编码的理论基础 |
3.2 Wyner-Ziv视频编码的编码结构 |
3.3 Wyner-Ziv视频编码的适用性分析 |
3.4 小结 |
4 基于Wyner-Ziv的可扩展视频编码错误恢复结构设计 |
4.1 可扩展视频编码结构MC-EZBC介绍 |
4.2 Wyner-Ziv信道编码技术介绍 |
4.3 MC-EZBC错误恢复结构设计 |
4.4 实验仿真结果及分析 |
4.5 小结 |
5 总结与展望 |
5.1 论文工作总结 |
5.2 未来工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间发表的论文 |
(3)含GPU环境高清视频图像处理算法研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 视频图像及视频图像编码概述 |
1.2 MPEG-2 与H.264 视频编码及视频转码技术 |
1.3 视频图像并行处理技术 |
1.4 论文研究内容 |
1.5 论文的结构安排 |
2 GPU 并行快速整数小波变换算法 |
2.1 总线周期与指令周期、时钟周期的关系 |
2.2 一种 GPU 并行 HARR 小波变换快速算法 |
2.3 一种 GPU 并行5/3 小波变换快速算法 |
2.4 实验结果及分析 |
2.5 本章小结 |
3 GPU 并行 MPEG‐2/H.264 快速帧内转码算法 |
3.1 H.264 帧内编码概述 |
3.2 帧内转码研究现状 |
3.3 GPU 并行MPEG-2/H.264 快速帧内模式确定算法 |
3.4 实验结果与分析 |
3.5 本章小结 |
4 GPU 并行 MPEG‐2/H.264 快速帧间转码算法 |
4.1 H.264 帧间编码概述 |
4.2 帧间转码研究现状 |
4.3 GPU 并行MPEG-2/H.264 快速帧间模式分割确定算法 |
4.4 实验结果及分析 |
4.5 本章小结 |
5 GPU 并行 MPEG‐2/H.264 快速分辨率转码算法 |
5.1 分辨率转码的研究现状 |
5.2 GPU 并行MPEG-2/H.264 快速分辨率转码 |
5.3 实验结果与分析 |
5.4 本章小结 |
6 含GPU 环境高清视频图像处理系统框架 |
6.1 视频图像传输系统研究现状 |
6.2 含双 GPU 环境高清视频图像传输系统框架 |
6.3 一种典型的高清视频图像传输系统 |
6.4 本章小结 |
7 全文总结 |
7.1 结论 |
7.2 未来的研究方向 |
8 致谢 |
9 参考文献 |
附录1 攻读博士学位期间发表论文 |
附录2 攻读博士学位期间参加课题目录 |
(4)空间可伸缩视频编码中上采样技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与研究意义 |
1.2 国内外研究现状 |
1.3 论文研究内容及章节安排 |
第二章 可伸缩视频编码 |
2.1 视频编码标准的发展 |
2.1.1 MPEG系列标准 |
2.1.2 H.26x系列标准 |
2.1.3 AVS标准 |
2.2 可伸缩视频编码技术的发展 |
2.2.1 空间可伸缩 |
2.2.2 时间可伸缩 |
2.2.3 质量/信噪比可伸缩 |
2.2.4 频率可伸缩 |
2.2.5 细粒度可伸缩 |
2.3 本章小结 |
第三章 空间可伸缩编码上采样技术 |
3.1 信号采样与SINC函数插值 |
3.2 传统插值算法分析 |
3.2.1 最近邻插值 |
3.2.2 双线性插值 |
3.2.3 三次卷积插值 |
3.2.4 多项式插值 |
3.2.5 样条插值 |
3.2.6 高斯插值 |
3.3 自适应插值技术 |
3.3.1 双信道插值 |
3.3.2 分形插值算法 |
3.3.3 小波插值算法 |
3.3.4 定向插值 |
3.3.5 偏微分插值算法 |
3.3.6 混合插值算法 |
3.4 本章小结 |
第四章 空间可伸缩编码中的上采样滤波方案 |
4.1 上采样滤波器分析与设计 |
4.1.1 相邻空间层分辨率分析 |
4.1.2 上采样滤波器设计 |
4.2 基于亮色分量的上采样滤波方案设计与实现 |
4.2.1 人眼视觉系统特性 |
4.2.2 滤波方案设计 |
4.2.3 实验结果 |
4.3 基于边缘区域的上采样滤波方案设计与实现 |
4.3.1 维纳滤波器 |
4.3.2 滤波方案设计 |
4.3.3 实验结果 |
4.4 本章小结 |
第五章 结束语 |
致谢 |
参考文献 |
研究成果 |
(5)基于流计算模型的视频编码关键技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题背景 |
1.1.1 视频编码 |
1.1.2 流计算和流应用 |
1.2 研究现状 |
1.2.1 视频编码相关研究 |
1.2.2 基于流计算的视频编码相关研究 |
1.3 课题研究内容 |
1.4 论文工作与创新 |
1.5 论文结构 |
第二章 流计算与视频编码 |
2.1 流计算 |
2.1.1 流计算模型 |
2.1.2 流计算模型的体系结构支持 |
2.1.3 流程序的执行 |
2.2 视频编码框架及并行流化潜力 |
2.3 基于流计算模型的视频编码面临的问题 |
2.4 小结 |
第三章 视频编码的可扩展流框架:提供扩展性支持 |
3.1 视频编码的可扩展流框架 |
3.1.1 视频编码流框架 |
3.1.2 可扩展流框架 |
3.2 视频编码程序结构转换 |
3.2.1 程序结构特征分析 |
3.2.2 程序结构转换方法 |
3.3 H.264 编码可扩展流框架 |
3.3.1 H.264 编码器设置 |
3.3.2 H.264 编码的可扩展流框架设计 |
3.4 小结 |
第四章 多分辨率多窗口帧间预测:提高流计算性能 |
4.1 帧间预测 |
4.2 运动估计算法计算量和并行性分析 |
4.3 多分辨率多窗口帧间预测 |
4.3.1 MRMW 总体结构 |
4.3.2 降分辨率全搜索 |
4.3.3 多窗口精化搜索和可变块大小运动补偿 |
4.4 帧间预测引擎 |
4.5 量化分析与讨论 |
4.6 小结 |
第五章 基于流计算的帧内预测、熵编码和去块滤波:解决相关约束对流计算的限制 |
5.1 基于流计算的帧内预测与变换量化 |
5.1.1 帧内预测与变换量化 |
5.1.2 帧内预测与变换量化相关性分析 |
5.1.3 分阶段块并行帧内预测与变换量化流算法 |
5.1.4 量化分析与讨论 |
5.2 基于流计算的熵编码 |
5.2.1 熵编码算法 |
5.2.2 CAVLC 的多种相关性问题分析 |
5.2.3 并行计算与并行码流存储的CAVLC 流算法 |
5.2.4 量化分析与讨论 |
5.3 基于流计算的去块滤波 |
5.3.1 去块滤波 |
5.3.2 去块滤波的多层次双向相关问题分析 |
5.3.3 分组并行去块滤波流算法 |
5.3.4 量化分析与讨论 |
5.4 小结 |
第六章 软硬结合的异构核协同:加速流程序执行 |
6.1 流化视频编码器执行特征与异构核协同 |
6.2 软硬结合的异构核协同 |
6.2.1 异构核协同硬件模块 |
6.2.2 异构核协同软件模块 |
6.2.3 异构核协同任务的实现 |
6.3 性能评测和分析 |
6.3.1 数据传输 |
6.3.2 计算核心执行 |
6.4 小结 |
第七章 H.264 可扩展流化编码器的实现与评测 |
7.1 H.264 VSSF 编码器 |
7.2 评测环境 |
7.2.1 硬件测试平台 |
7.2.2 视频测试序列 |
7.3 性能评测与分析 |
7.3.1 编码性能 |
7.3.2 视频质量和压缩率 |
7.3.3 流程序结构指标 |
7.4 小结 |
第八章 结论与展望 |
8.1 工作总结 |
8.2 未来研究方向 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(6)可伸缩视频编码算法研究与优化(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究的背景和意义 |
1.2 视频编码的基本原理 |
1.3 国际标准和发展现状 |
1.3.1 H.261视频编码标准 |
1.3.2 H.263视频编码标准 |
1.3.3 H.264视频编码标准 |
1.3.4 可伸缩视频编码 |
1.4 本论文所完成的工作 |
第二章 基于小波的可伸缩视频编码研究 |
2.1 小波变换的基本原理 |
2.1.1 傅立叶变换 |
2.1.2 短时傅立叶变换 |
2.1.3 连续小波变换 |
2.1.4 离散小波变换 |
2.2 小波视频编码的基本理论 |
2.2.1 小波视频编码的原理 |
2.2.2 小波变换的多分辨率分析 |
2.2.3 小波变换的实现方法 |
2.3 小波变换视频可伸缩编码的原理 |
2.3.1 可伸缩视频编码技术 |
2.3.2 基于小波变换的视频编码算法分类 |
2.3.3 小波变换视频可伸缩编码的实现过程 |
2.4 小波视频编码的优势和特点 |
2.5 本章小结 |
第三章 基于H.264 SVC编码算法研究 |
3.1 H.264标准的介绍 |
3.1.1 H.264的分级结构 |
3.1.2 H.264编码器和解码器 |
3.1.3 H.264的帧间预测 |
3.1.4 H.264的帧内预测 |
3.1.5 H.264的整数DCT变换 |
3.2 H.264可伸缩编码的实现方法 |
3.2.1 空间可伸缩 |
3.2.2 时间可伸缩 |
3.2.3 质量可伸缩 |
3.3 H.264 SVC和基于小波可伸缩视频编码的比较 |
3.3.1 比较模型的简介 |
3.3.2 变换编码差异 |
3.3.3 空域可分级实现的差异 |
3.3.4 时域可分级实现的差异 |
3.3.5 质量可分级实现的差异 |
3.4 实验结果 |
3.5 本章小结 |
第四章 H.264 SVC编码算法优化 |
4.1 JSVM编码器的介绍 |
4.1.1 JSVM模型结构 |
4.1.2 编码的配置文件 |
4.1.3 JSVM代码分析 |
4.2 率失真优化与模式决策 |
4.2.1 率失真优化 |
4.2.2 全遍历模式决策算法 |
4.2.3 层间预测对编码复杂度的影响 |
4.3 基于层间统计的快速模式决策算法 |
4.3.1 优化算法的原理 |
4.3.2 实验结果 |
4.4 本章小结 |
第五章 H.264 SVC解码算法优化 |
5.1 解码器分析 |
5.1.1 解码流程 |
5.1.2 程序热点分析 |
5.1.3 解码复杂度分析 |
5.2 程序设计代码优化 |
5.2.1 编译优化 |
5.2.2 代码优化 |
5.3 处理器优化 |
5.3.1 指令优化 |
5.3.2 优化结果 |
5.4 解码算法优化 |
5.4.1 Intel IPP库介绍 |
5.4.2 IPP库AVC解码器的加入 |
5.4.3 去除冗余操作 |
5.4.4 实验结果 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 可伸缩视频编码的展望 |
参考文献 |
致谢 |
作者攻读学位期间发表的学术论文目录 |
(7)小波视频编码与动态码率传输技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景、目的及意义 |
1.2 国内外发展现状及进展 |
1.2.1 分层可伸缩视频编码 |
1.2.2 FGS/PFGS 可伸缩视频编码 |
1.2.3 基于H.264 扩展的可伸缩视频编码 |
1.2.4 基于小波变换的可伸缩视频编码 |
1.2.5 动态码率传输控制技术 |
1.3 本文的研究内容 |
第2章 小波视频编码方案对比分析和框架选择 |
2.1 现有各种小波视频编码方案分析 |
2.1.1 帧内二维小波视频编码 |
2.1.2 闭环二维小波视频编码 |
2.1.3 纯三维小波视频编码 |
2.1.4 全局运动补偿三维小波视频编码 |
2.1.5 MCTF“T+2D”三维小波视频编码 |
2.1.6 MCTF“2D+T”三维小波视频编码 |
2.2 本文小波视频编码框架和总体方案 |
2.2.1 本文小波视频编码框架 |
2.2.2 本文小波视频编码总体方案和优化改进点 |
2.3 本章小结 |
第3章 改进的MPNUBL-MCTF 算法 |
3.1 杠铃提升运动补偿时域滤波算法适用性分析 |
3.1.1 杠铃提升运动补偿时域滤波算法原理 |
3.1.2 杠铃提升运动补偿时域滤波算法分析 |
3.2 改进的MPNUBL-MCTF 算法原理 |
3.3 MPNUBL-MCTF 算法实现 |
3.3.1 层次化参考帧集合选择方法 |
3.3.2 多帧预测快速运动估计方法 |
3.3.3 MPNUBL-MCTF 预测过程 |
3.4 实验结果 |
3.5 本章小结 |
第4章 改进的嵌入零块编码算法BLQ-NLEZBC |
4.1 EZBC 算法分析 |
4.1.1 EZBC 的算法原理 |
4.1.2 子带小波系数的幅值四叉树 |
4.1.3 EZBC 算法的位平面编码过程 |
4.1.4 EZBC 上下文模型 |
4.2 改进的嵌入零块编码算法BLQ-NLEZBC |
4.2.1 位长四叉树 |
4.2.2 BLQ-NLEZBC 位平面编码过程 |
4.3 算法示例与对比分析 |
4.3.1 EZBC 算法的编码过程 |
4.3.2 NLEZBC 算法编码过程 |
4.3.3 BLQ-NLEZBC 算法编码过程 |
4.4 实验结果与分析 |
4.5 本章小结 |
第5章 带描述的流打包方法 |
5.1 现有码流封装结构分析对比 |
5.1.1 动态码率传输码流封装结构特点分析 |
5.1.2 基于H.264 扩展的可伸缩视频编码码流封装结构分析 |
5.1.2 基于杠铃提升的三维小波视频编码码流封装结构分析 |
5.2 MPNUBL-MCTF“T+2D”小波视频编码码流封装结构 |
5.3 带描述的流打包方法 |
5.3.1 流描述原理 |
5.3.2 流描述实体结构 |
5.3.3 流描述信息生成流程 |
5.4 实验结果与分析 |
5.5 本章小结 |
第6章 动态码率传输控制算法及端到端系统实现 |
6.1 流媒体传输技术 |
6.1.1 流媒体协议 |
6.1.2 流媒体系统组成 |
6.2 动态码率传输控制算法原理 |
6.2.1 用户网络状况实时监测 |
6.2.2 动态码率计算 |
6.2.3 二次码流提取和分发算法 |
6.3 动态码率视频传输端到端系统实现 |
6.4 实验测试与结果分析 |
6.4.1 动态码率传输控制算法有效性验证 |
6.4.2 动态码率传输控制与固定码率传输对比测试 |
6.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文和取得的科研成果 |
致谢 |
(8)可伸缩视频编码关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与研究意义 |
1.2 国内外研究现状 |
1.3 论文的主要研究内容和章节安排 |
1.4 课题来源 |
第二章 可伸缩视频编码的发展 |
2.0 引言 |
2.1 视频编码标准的发展 |
2.2 可伸缩视频编码技术的发展 |
2.2.1 空域可伸缩 |
2.2.2 时域可伸缩 |
2.2.3 质量/信噪比可伸缩 |
2.2.4 频率可伸缩 |
2.2.5 细粒度可伸缩 |
2.2.6 对象可伸缩 |
2.3 本章小结 |
第三章 运动补偿时域滤波技术研究 |
3.0 引言 |
3.1 运动补偿时域滤波(MCTF) |
3.1.0 MCTF 简介 |
3.1.1 小波提升基本原理 |
3.1.2 MCTF 提升过程 |
3.1.3 自适应GOP 结构 |
3.1.4 小波提升更新技术的优化 |
3.1.5 自适应时域分解级数和小波滤波器 |
3.2 基于MCTF 的可伸缩视频编码的实现与改进 |
3.2.0 引言 |
3.2.1 可伸缩视频编码的实现框图 |
3.2.2 可伸缩视频编码的改进 |
3.2.3 实验结果和分析 |
3.2.4 结论 |
3.3 本章小结 |
第四章 运动补偿时域滤波残差图像的特性研究 |
4.0 引言 |
4.1 基于提升的运动补偿时域滤波 |
4.2 运动补偿时域滤波残差图像的统计特性 |
4.2.1 残差图像能量的非平稳特性 |
4.2.2 残差图像的时空相关特性 |
4.2.3 残差图像的频率特性 |
4.3 实验结果与分析 |
4.3.1 残差图像能量的非平稳特性 |
4.3.2 残差图像的时空相关特性 |
4.3.3 残差图像的频率特性 |
4.4 本章小结 |
第五章 快速运动估计算法研究 |
5.0 引言 |
5.1 算法原理 |
5.2 典型算法研究 |
5.2.1 全搜索法 |
5.2.2 二维对数法 |
5.2.3 三步搜索法 |
5.2.4 直角搜索法 |
5.2.5 新三步法 |
5.2.6 四步搜索法 |
5.2.7 基于块的梯度下降搜索法 |
5.2.8 菱形搜索法 |
5.2.9 非对称十字型多层次六边形格点搜索算法 |
5.3 一种基于运动方向预测的快速运动估计算法 |
5.3.0 引言 |
5.3.1 运动矢量的相关性和中心偏移性 |
5.3.2 MDP 快速运动估计算法 |
5.3.3 实验结果与分析 |
5.3.4 结论 |
5.4 运动估计匹配准则研究 |
5.4.0 引言 |
5.4.1 匹配准则理论分析 |
5.4.2 实验结果与分析 |
5.4.3 结论与展望 |
5.5 本章小结 |
第六章 视频图像差错掩盖算法研究 |
6.0 引言 |
6.1 几种经典差错掩盖算法描述 |
6.1.1 空间域差错掩盖算法 |
6.1.2 时间域差错掩盖算法 |
6.2 一种基于帧间信息的视频传输丢失差错掩盖算法 |
6.2.0 引言 |
6.2.1 AVMV 算法 |
6.2.2 基于POCS 的差错掩盖算法 |
6.2.3 组合型差错掩盖算法 |
6.2.4 实验结果 |
6.2.5 结论 |
6.3 一种有效的时-空边界匹配差错掩盖算法 |
6.3.0 引言 |
6.3.1 ESTBMA 算法 |
6.3.2 实验结果 |
6.3.3 结论 |
6.4 基于人类视觉系统的扩散差错掩盖算法 |
6.4.0 引言 |
6.4.1 人类视觉系统特性 |
6.4.2 扩散差错掩盖 |
6.4.3 仿真和实验结果分析 |
6.4.4 结论 |
6.5 可伸缩视频编码中整帧丢失差错掩盖算法研究 |
6.5.0 前言 |
6.5.1 整帧丢失差错掩盖算法 |
6.5.2 结论 |
6.6 本章小结 |
结论与展望 |
参考文献 |
攻读博士学位期间取得的研究成果 |
致谢 |
(9)新一代视频编码标准关键算法的研究与优化(论文提纲范文)
目录 |
图目录 |
表目录 |
摘要 |
Abstract |
第一章 绪论 |
1.1 视频编码技术的发展和现状 |
1.2 视频编码算法优化简介 |
1.3 本文的组织结构 |
第二章 视频编码的理论基础 |
2.1 引言 |
2.2 视频编码的理论依据 |
2.3 视频编码的基本流程 |
2.4 视频质量的评价标准 |
2.5 本章小结 |
第三章 整数DCT变换基的通用生成算法 |
3.1 引言 |
3.2 整数DCT的相关知识 |
3.2.1 整数DCT变换原理 |
3.2.2 整数变换基需要满足的特性 |
3.3 变换基的系数取值个数与阶数的关系 |
3.4 提出的整数变换基生成算法 |
3.4.1 生成变换基系数变量矩阵C_i |
3.4.2 计算多项式矩阵P=C_iC_i~T |
3.4.3 解矩阵P中各多项式组 |
3.5 实验结果 |
3.6 本章小结 |
第四章 预测编码算法研究 |
4.1 引言 |
4.2 帧内预测编码 |
4.2.1 概述 |
4.2.2 帧内预测编码模式 |
4.2.3 帧内预测编码基本流程 |
4.3 帧间预测编码 |
4.3.1 概述 |
4.3.2 运动补偿基本流程 |
4.3.3 亚像素运动矢量 |
4.4 几个关键问题 |
4.4.1 失真函数与匹配准则 |
4.4.2 率失真函数 |
4.4.3 拉格朗日代价函数 |
4.5 基于量化参数的全零块检测算法 |
4.5.1 引言 |
4.5.2 传统的全零块检测算法 |
4.5.3 提出的全零块检测方法 |
4.5.4 仿真实验结果 |
4.5.5 实验结论 |
4.6 基于概率的帧内预测模式判决快速算法 |
4.6.1 引言 |
4.6.2 传统的帧内预测快速算法 |
4.6.3 提出的快速算法 |
4.6.4 仿真实验结果 |
4.6.5 实验结论 |
4.7 本章小结 |
4.8 本章附录 |
第五章 分级编码算法研究 |
5.1 引言 |
5.2 精细粒度可分级视频编码 |
5.2.1 精细粒度可分级视频编码基本原理 |
5.2.2 精细粒度可分级视频编码的改进 |
5.3 基于小波的视频可分级编码 |
5.3.1 小波变换 |
5.3.2 小波分解和小波重构 |
5.3.3 视频的小波编码 |
5.4 基于DCT的频域分级编码 |
5.4.1 传统DCT频域分级编码算法 |
5.4.2 本文提出的算法 |
5.4.3 AVS框架中的DCT频域分级编码实现 |
5.5 本章小结 |
第六章 编码算法的DSP移植与优化 |
6.1 编码算法的移植 |
6.1.1 具体的DSP移植 |
6.1.2 DSP移植后的验证 |
6.2 编码算法的优化 |
6.2.1 优化概述 |
6.2.2 编码算法的封装 |
6.2.3 编码算法的项目级优化 |
6.2.4 Cache性能优化 |
6.2.5 数据传输优化(EDMA) |
6.2.6 线性汇编优化 |
6.2.7 优化工作总结 |
6.3 本章小结 |
第七章 总结 |
7.1 本文所作的主要工作 |
7.2 进一步研究的问题 |
致谢 |
参考文献 |
附录 |
1. 攻读博士学位期间发表的论文 |
2. 攻读博士学位期间参加的科研项目 |
(10)视频压缩的运动估计与小波方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 引言 |
1.2 信号变换与图像压缩 |
1.3 运动估计研究概况 |
1.3.1 空间域运动估计 |
1.3.2 小波域运动估计 |
1.4 论文研究意义 |
1.5 论文主要成果与结构安排 |
第2章 空间域的自适应运动估计算法 |
2.1 引言 |
2.2 基于块匹配的运动估计算法 |
2.2.1 块匹配与运动估计 |
2.2.2 基于块匹配的运动估计算法 |
2.3 基于运动特征的自适应运动估计算法 |
2.3.1 算法步骤 |
2.3.2 搜索起点预测 |
2.3.3 自适应运动估计算法 |
2.4 仿真试验与结果 |
2.4.1 搜索起点预测性能仿真 |
2.4.2 自适应搜索算法性能仿真 |
2.4.3 主观效果比较 |
2.5 结论 |
第3章 小波变换与图像压缩 |
3.1 引言 |
3.2 小波变换的基本理论 |
3.2.1 小波变换定义 |
3.2.2 离散小波变换 |
3.2.3 图像信号的二维小波变换 |
3.3 完全重构条件与双正交小波构造 |
3.3.1 双正交小波的构造方法 |
3.3.2 滤波器长度和消失矩的约束条件 |
3.3.3 双正交小波的构造 |
3.4 提升算法 |
3.5 结论 |
第4章 二维小波域的交叉搜索运动估计方法 |
4.1 引言 |
4.2 低频子带平移 |
4.2.1 小波变换的移变性 |
4.2.2 低频子带平移方法 |
4.3 基于LBS 的交叉搜索运动估计方法 |
4.3.1 初始矢量的确定方法 |
4.3.2 LBS 方法的改进 |
4.3.3 基于LBS 的交叉搜索算法 |
4.4 运算复杂度分析 |
4.5 仿真试验结果 |
4.6 结论 |
第5章 内容自适应的MCTF 更新算法 |
5.1 引言 |
5.2 可扩展视频编码方法 |
5.2.1 基于分层编码的可扩展视频编码 |
5.2.2 基于三维小波的可扩展视频编码 |
5.3 基于提升算法的MCTF |
5.4 更新步骤对MCTF 的影响 |
5.5 更新步骤的运动矢量确定 |
5.6 内容自适应反向运动补偿方法 |
5.7 仿真结果 |
5.7.1 不同MV 预测方法的仿真 |
5.7.2 更新步骤允许和缺省时的比较 |
5.7.3 运动补偿方法仿真 |
5.8 结论 |
第6章 二维小波变换器及视频压缩系统设计 |
6.1 二维小波变换器的VLSI 设计 |
6.1.1 引言 |
6.1.2 小波变换器的数据调度方法 |
6.1.3 一维小波变换器的VLSI 结构 |
6.1.4 二维DWT 并行处理的体系结构 |
6.1.5 小波系数的存储 |
6.2 多级小波变换的实现方法 |
6.3 二维小波变换器的仿真结果与硬件实现 |
6.3.1 软件仿真 |
6.3.2 硬件仿真和FPGA 综合结果 |
6.3.3 版图 |
6.4 视频压缩系统方案设计 |
6.4.1 视频压缩系统的总体设计 |
6.4.2 DSP 与小波变换器接口设计 |
6.4.3 DSP 的视频接口 |
6.4.4 DSP 的网络接口 |
6.4.5 优化策略 |
6.5 仿真试验结果 |
6.5.1 不压缩时的黑把子仿真 |
6.5.2 降空间分辨率的黑把子仿真 |
6.5.3 不同码率下的黑把子仿真 |
6.6 结论 |
结论与展望 |
1 结论 |
2 展望 |
参考文献 |
致谢 |
附录 攻读博士学位期间发表的相关论文及参与课题 |
四、WAVELET-BASED FINE GRANULARITY SCALABLE VIDEO CODING(论文参考文献)
- [1]图像和视频的深度压缩感知[D]. 石武祯. 哈尔滨工业大学, 2020
- [2]基于Wyner-Ziv构架的可扩展视频编码的错误恢复研究[D]. 刘本建. 山东科技大学, 2011(06)
- [3]含GPU环境高清视频图像处理算法研究与实现[D]. 魏卓. 华中科技大学, 2011(07)
- [4]空间可伸缩视频编码中上采样技术研究[D]. 李文静. 西安电子科技大学, 2010(02)
- [5]基于流计算模型的视频编码关键技术研究[D]. 任巨. 国防科学技术大学, 2010(08)
- [6]可伸缩视频编码算法研究与优化[D]. 刘娜. 北京邮电大学, 2010(03)
- [7]小波视频编码与动态码率传输技术研究[D]. 王文答. 哈尔滨工程大学, 2009(01)
- [8]可伸缩视频编码关键技术研究[D]. 向友君. 华南理工大学, 2009(10)
- [9]新一代视频编码标准关键算法的研究与优化[D]. 吴云. 贵州大学, 2009(12)
- [10]视频压缩的运动估计与小波方法研究[D]. 王镇道. 湖南大学, 2008(08)