位置:51电子网 » 技术资料 » 通信网络

基于ADSP-21535的MPEG-4视频编解码实现

发布时间:2008/5/29 0:00:00 访问次数:468

  摘??? 要:本文在分析blackfin结构的基础上,设计实现了mpeg-4编解码器,详细介绍了基于adsp-21535的硬件和软件的设计,同时对软件进行了优化。
  关键词:mpeg-4;dsp;代码优化
引言
  数字视频的大数据量给信息的存储和传输造成了相当大的困难,成为数字视频应用的瓶颈之一,数字视频压缩编码是解决这一问题的有效途径,但在一些对实时性要求较高的场合,要求快速实现数字视频的编解码。采用dsp器件集成的视频采集压缩卡能快速实现视频压缩算法,提高处理速度,满足实时性要求。

  本文采用blackfin系列的dsp芯片adsp-21535来实现mpeg-4视频编解码,详细介绍了硬件和软件的设计方案。
硬件设计
  整个系统包括视频采集单元、mpeg-4编解码单元、数据存储单元、逻辑控制单元和视频显示单元等。采用conexant公司的bt829实现视频信号采集,数据存储采用cypress公司的sram芯片cy7c104133,视频显示单元采用adi公司的adv7175,逻辑控制部分采用altera公司的max7000芯片。
软件设计
  mpeg-4视频编码是根据图像的内容将其分割成不同的视频对象vo(video object),然后进行编码。其编码过程可由3步来完成,即vo的形成、编码和复合。它提供了灵活的框架和开放的工具集。
  基于vop(video object plane)的编码,vo是场景中的某个物体,是由时间上连续的帧画面序列组成的,而vop是某一时刻某一帧画面的vo,vop编码是针对某一时刻该帧画面vo的形状、运动、纹理等三类信息进行编码。从类型上看包括帧内ivop(intra vop)、帧间前向因果预测pvop(inter prediction vop)、帧间双向非因果预测bvop(inter biderctional prediction vop)和全息灵影svop(sprite vop)。从空间上看它由若干个16×16的宏块组成,又可分成4个8×8的亮度块和2个8×8的色差块。它采用位图法对vop的形状进行编码。
  在本文设计的编解码器中,对于352×288的vop图像数据编码采用y:u:v=4:2:0的格式,即每采样4个亮度样本,对应采样两个色差样本。然后,分离不同的帧格式,分别对它们进行编码和解码。
?
基于adsp-21535的
mpeg-4编码优化
  adsp-21535采用双mac的结构,具有正交的类似risc的微处理器集,主频可达300mhz,有专门的视频处理指令、灵活的sram和cache结构,是一款在多媒体处理与网络传输应用中极具特色的芯片。因此,在编码的过程中,应充分考虑芯片的结构和指令特点,实现程序的优化。
使用硬件结构提高处理速度
  adsp-21535内部有两块ram,即l1ram和l2ram。l1ram是核内的高速ram,可以按照需要定义为cache或sram,或者一部分数据cache,一部分数据sram。它可分成16kb指令cache和指令sram,也可分成32kb数据cache和数据ram。相对来说l2ram离核较远,如果程序或数据放在l2ram中直接执行,速度会比较慢。因此如果程序的数据量较小,可以把程序和数据直接放入l1ram中执行。但是对于数据量较大的程序来说,有时还有可能把数据放在外部存储器中,如视频采集数据,这时就应该设置好cache允许的数据地址和程序地址,然后启动cache,这样程序和数据就会自动调入l1ram中执行。
运动估值搜索算法的并行处理
  视频压缩的关键是去除时间与空间的冗余,考虑到帧间的时间相关性强的特点,为了满足随机存储和高压缩比的要求,一般采用帧间和帧内的编码技术。在mpeg-4运动搜索算法中是使用条块匹配算法,需要进行vop范围内点的搜索。匹配使当前的图像与预测图像的绝对差值和,即sad最小。
  sad的计算是运动估值中最重要的一个环节,它直接影响整个运动搜索的速度,这也是图像数据实时压缩的瓶颈。blackfin提供了一个极好的硬件指令,可以取出8个单元数据同时做4组video单元的绝对差和。adsp-21535提供了两种指令形式来完成这个操作,即saa(r1:0)和saa(r1:0,r3:2)(r代表寄存器组高低寄存器互换),将结果放在a0和a1中(a0和a1为两个乘法器和累加器,r1和r0、r2和r3为配对的两个寄存器,一般称为寄存器组0和寄存器组1)。
由于作绝对差和是针对字节而言,所以起始字节地址不一定是以4的整数倍开始,但是每次运算却必须要取出4个字节作运算。对于此,blackfin巧妙地根据地址的末两位来确定运算所取的字节。其地址指针为i0和i1,由i0和r1:0、i1和r3:2来确定运算的8个点。
  用adsp-21535计算当前块与目标宏块的sad值的程序在此就不再赘述。
结语
  整个系统使用visual dsp++3.0进行开发,通过jtag口仿真,在cif格式下(352×288)进行测试。采集的帧率

  摘??? 要:本文在分析blackfin结构的基础上,设计实现了mpeg-4编解码器,详细介绍了基于adsp-21535的硬件和软件的设计,同时对软件进行了优化。
  关键词:mpeg-4;dsp;代码优化
引言
  数字视频的大数据量给信息的存储和传输造成了相当大的困难,成为数字视频应用的瓶颈之一,数字视频压缩编码是解决这一问题的有效途径,但在一些对实时性要求较高的场合,要求快速实现数字视频的编解码。采用dsp器件集成的视频采集压缩卡能快速实现视频压缩算法,提高处理速度,满足实时性要求。

  本文采用blackfin系列的dsp芯片adsp-21535来实现mpeg-4视频编解码,详细介绍了硬件和软件的设计方案。
硬件设计
  整个系统包括视频采集单元、mpeg-4编解码单元、数据存储单元、逻辑控制单元和视频显示单元等。采用conexant公司的bt829实现视频信号采集,数据存储采用cypress公司的sram芯片cy7c104133,视频显示单元采用adi公司的adv7175,逻辑控制部分采用altera公司的max7000芯片。
软件设计
  mpeg-4视频编码是根据图像的内容将其分割成不同的视频对象vo(video object),然后进行编码。其编码过程可由3步来完成,即vo的形成、编码和复合。它提供了灵活的框架和开放的工具集。
  基于vop(video object plane)的编码,vo是场景中的某个物体,是由时间上连续的帧画面序列组成的,而vop是某一时刻某一帧画面的vo,vop编码是针对某一时刻该帧画面vo的形状、运动、纹理等三类信息进行编码。从类型上看包括帧内ivop(intra vop)、帧间前向因果预测pvop(inter prediction vop)、帧间双向非因果预测bvop(inter biderctional prediction vop)和全息灵影svop(sprite vop)。从空间上看它由若干个16×16的宏块组成,又可分成4个8×8的亮度块和2个8×8的色差块。它采用位图法对vop的形状进行编码。
  在本文设计的编解码器中,对于352×288的vop图像数据编码采用y:u:v=4:2:0的格式,即每采样4个亮度样本,对应采样两个色差样本。然后,分离不同的帧格式,分别对它们进行编码和解码。
?
基于adsp-21535的
mpeg-4编码优化
  adsp-21535采用双mac的结构,具有正交的类似risc的微处理器集,主频可达300mhz,有专门的视频处理指令、灵活的sram和cache结构,是一款在多媒体处理与网络传输应用中极具特色的芯片。因此,在编码的过程中,应充分考虑芯片的结构和指令特点,实现程序的优化。
使用硬件结构提高处理速度
  adsp-21535内部有两块ram,即l1ram和l2ram。l1ram是核内的高速ram,可以按照需要定义为cache或sram,或者一部分数据cache,一部分数据sram。它可分成16kb指令cache和指令sram,也可分成32kb数据cache和数据ram。相对来说l2ram离核较远,如果程序或数据放在l2ram中直接执行,速度会比较慢。因此如果程序的数据量较小,可以把程序和数据直接放入l1ram中执行。但是对于数据量较大的程序来说,有时还有可能把数据放在外部存储器中,如视频采集数据,这时就应该设置好cache允许的数据地址和程序地址,然后启动cache,这样程序和数据就会自动调入l1ram中执行。
运动估值搜索算法的并行处理
  视频压缩的关键是去除时间与空间的冗余,考虑到帧间的时间相关性强的特点,为了满足随机存储和高压缩比的要求,一般采用帧间和帧内的编码技术。在mpeg-4运动搜索算法中是使用条块匹配算法,需要进行vop范围内点的搜索。匹配使当前的图像与预测图像的绝对差值和,即sad最小。
  sad的计算是运动估值中最重要的一个环节,它直接影响整个运动搜索的速度,这也是图像数据实时压缩的瓶颈。blackfin提供了一个极好的硬件指令,可以取出8个单元数据同时做4组video单元的绝对差和。adsp-21535提供了两种指令形式来完成这个操作,即saa(r1:0)和saa(r1:0,r3:2)(r代表寄存器组高低寄存器互换),将结果放在a0和a1中(a0和a1为两个乘法器和累加器,r1和r0、r2和r3为配对的两个寄存器,一般称为寄存器组0和寄存器组1)。
由于作绝对差和是针对字节而言,所以起始字节地址不一定是以4的整数倍开始,但是每次运算却必须要取出4个字节作运算。对于此,blackfin巧妙地根据地址的末两位来确定运算所取的字节。其地址指针为i0和i1,由i0和r1:0、i1和r3:2来确定运算的8个点。
  用adsp-21535计算当前块与目标宏块的sad值的程序在此就不再赘述。
结语
  整个系统使用visual dsp++3.0进行开发,通过jtag口仿真,在cif格式下(352×288)进行测试。采集的帧率
相关IC型号
版权所有:51dzw.COM
深圳服务热线:13692101218  13751165337
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式


 复制成功!