位置:51电子网 » 技术资料 » D S P

数字音频技术与杜比AC-3

发布时间:2008/5/27 0:00:00 访问次数:842

        

    

    

     摘要:介绍了杜比公司开发的ac-3数字音频压缩码技术的原理和编解码过程。 关键词:数据压缩 感知型编码 ac-3编码 ac-3解码 随着人们对多媒体图像和声音的要求越来越高,在高清晰数字电视(hdtv)和数字电影中不仅应有高质量的图像,也应当具有cd质量的立体声。因为用数字方法记录声音比用模拟方法记录声音具有更强的优势,例如传输时抗噪声能力强、增加音频动态范围、多次翻录没有信号衰减等。但是数字声音最大的缺陷是记录的数据量大,表现在两个方面:其一是在传输过程中,传输数字声音需要占用很宽的传输带宽;其二是在存储过程中,需要占用大量的存储空间。所以在数字音频中需要采用数字音频压缩技术,对音频数据进行压缩。 杜比ac-3提供的数字音频压缩编码技术具有较高的编码效率;而由5个全频域声道和1个超低音声道组成的ac-3环绕声系统能完美再现高质量的立体声。 1 数字音频编码的原理 目前,高品质声音的主流是cd音质,其采样频率为48khz或44.1khz,以每个采样点16bit的精度进行编码,其比特率将达到每个通道768kbps(48khz采样率)和705.6kbps(44.1khz采样率),双声道立体声分别需要1.54mbps和1.41mbps的码率。而如果采用新的音频编码技术,则可以在保持同等音质的前提下,实现64kbps~128kbps速率编码。以44.1k样本/秒计算,相当于每个采样点1.5bit,以如此低的平均信息量能达到接近于cd的高音质,这就是高品质数字音频编码要达到的目的。 一般来说,数据压缩有两种方法。一种方法是利用信号的统计性质,完全不丢失信息的高效率编码法,称为平均信息量编码或熵编码(entropy coding)。第二种方法是利用接收信号人的感觉特性,省略不必要的信息,压缩信息量,称为感觉编码(perceptual coding)。 音频信号的感觉编码是以心理声学原理为基础,利用听觉心理特性,只记录那些能被人的听觉所感知的声音信号,从而达到减少数据量而又降低音质的目的。一般而言,人耳的听觉像20hz~20khz带通滤波器,它对不同频率的信号有不同的感知辨别率。相对于高频而言,低频的声音更易新人耳感知,其中尤以对2khz~4khz的信号最为敏感,因而形成了图1中的绝对可闻阈曲线。绝对可闻阈是指寂静地听觉可听到的各频段的最低音量。遮蔽效应对于听觉特性有着很大的影响。遮蔽分为同时性的遮蔽和非同时性的遮蔽。前者是频域下的一种现象,指在相近的频率下,强度较大的信号会遮蔽较小的信号。后者也称时间的遮蔽性,是指在短暂的时间间隔内,强度大的信号遮蔽较小的信号,它又分为前遮蔽和后遮蔽。前遮蔽是指强度大的信号遮蔽发生较早的小信号,后遮蔽则是强度大的信号遮蔽发生较晚的小信号。通常前遮蔽的持续时间为20ms,对再前的声音的影响几乎可以忽略;而后遮蔽所产生的效应相对大而且持久,一般可达100~200ms,所以应用更为广泛。典型的听觉心理特性如图1所示的频率特性(左)和时间特性(右)。 图1中,噪声a因在绝对可闻阈以上而可闻,但噪声c因在绝对可闻阈以下,故听不到。如左图所示,当有黑线所示的某频率信号存在时,靠近它的本来可以听见的噪声b就变得听不见了,这种现象就是同时性遮蔽效应。而如右图所示,当某时刻有黑线所示的信号存在时,位于其后面的比它小一些的本来可听见的噪声e也变得听不见了,这种现场称为非同时性遮蔽效应。两种效应合成的结果形成了实际的可闻阈。 杜比ac-3就是一种感知型编码方式,它把整个音频频带分割成若干个较窄的频段,因为人类的听觉对不同频率的声音具有不同的灵敏度,各频段的宽度并不完全一样。由于有用的信号被划分成狭窄的频频,编码噪声的滤降总是就比较容易。因为对于每个频段来说,该频率以外的所有信号可以全部被滤除掉而不会损伤有用信号。而频段内,剩余噪声信号的频率与有用信号的频率非常接近,这正是遮蔽效应发挥最大作用的区域。从这种意义上说,象ac-3这样的感知型编码系统是一种非常有效的减噪系数。这些被分割成狭窄频段的多路数字音频信号最终还需要被合成一路完整的全频带信号,但每一个频段所占有的数据量并不是平均分配的,编码器内部有一个“听觉遮蔽模块”,可以模拟人的听觉遮蔽效应,它能根据信号的动态特性来决定在某一时刻的数据用量应当如何分配给各频段才是最合适的。频谱密集、音量大的声音元素应该获得较多的数据占有量,那些由于遮蔽效应而听不到的声音则少占用或不占用数据量。 2 ac-3的编解码技术简介 ac-3是在ac-1和ac-2基础上发展起来的多通道编码技术,保留了原ac-2中如窗函数处理、指数变换编码、自适应比特分配等许多特点,还新增了运用立体声多声道的编码技术策略的coupling和rematrix算法。一般而言,

        

    

    

     摘要:介绍了杜比公司开发的ac-3数字音频压缩码技术的原理和编解码过程。 关键词:数据压缩 感知型编码 ac-3编码 ac-3解码 随着人们对多媒体图像和声音的要求越来越高,在高清晰数字电视(hdtv)和数字电影中不仅应有高质量的图像,也应当具有cd质量的立体声。因为用数字方法记录声音比用模拟方法记录声音具有更强的优势,例如传输时抗噪声能力强、增加音频动态范围、多次翻录没有信号衰减等。但是数字声音最大的缺陷是记录的数据量大,表现在两个方面:其一是在传输过程中,传输数字声音需要占用很宽的传输带宽;其二是在存储过程中,需要占用大量的存储空间。所以在数字音频中需要采用数字音频压缩技术,对音频数据进行压缩。 杜比ac-3提供的数字音频压缩编码技术具有较高的编码效率;而由5个全频域声道和1个超低音声道组成的ac-3环绕声系统能完美再现高质量的立体声。 1 数字音频编码的原理 目前,高品质声音的主流是cd音质,其采样频率为48khz或44.1khz,以每个采样点16bit的精度进行编码,其比特率将达到每个通道768kbps(48khz采样率)和705.6kbps(44.1khz采样率),双声道立体声分别需要1.54mbps和1.41mbps的码率。而如果采用新的音频编码技术,则可以在保持同等音质的前提下,实现64kbps~128kbps速率编码。以44.1k样本/秒计算,相当于每个采样点1.5bit,以如此低的平均信息量能达到接近于cd的高音质,这就是高品质数字音频编码要达到的目的。 一般来说,数据压缩有两种方法。一种方法是利用信号的统计性质,完全不丢失信息的高效率编码法,称为平均信息量编码或熵编码(entropy coding)。第二种方法是利用接收信号人的感觉特性,省略不必要的信息,压缩信息量,称为感觉编码(perceptual coding)。 音频信号的感觉编码是以心理声学原理为基础,利用听觉心理特性,只记录那些能被人的听觉所感知的声音信号,从而达到减少数据量而又降低音质的目的。一般而言,人耳的听觉像20hz~20khz带通滤波器,它对不同频率的信号有不同的感知辨别率。相对于高频而言,低频的声音更易新人耳感知,其中尤以对2khz~4khz的信号最为敏感,因而形成了图1中的绝对可闻阈曲线。绝对可闻阈是指寂静地听觉可听到的各频段的最低音量。遮蔽效应对于听觉特性有着很大的影响。遮蔽分为同时性的遮蔽和非同时性的遮蔽。前者是频域下的一种现象,指在相近的频率下,强度较大的信号会遮蔽较小的信号。后者也称时间的遮蔽性,是指在短暂的时间间隔内,强度大的信号遮蔽较小的信号,它又分为前遮蔽和后遮蔽。前遮蔽是指强度大的信号遮蔽发生较早的小信号,后遮蔽则是强度大的信号遮蔽发生较晚的小信号。通常前遮蔽的持续时间为20ms,对再前的声音的影响几乎可以忽略;而后遮蔽所产生的效应相对大而且持久,一般可达100~200ms,所以应用更为广泛。典型的听觉心理特性如图1所示的频率特性(左)和时间特性(右)。 图1中,噪声a因在绝对可闻阈以上而可闻,但噪声c因在绝对可闻阈以下,故听不到。如左图所示,当有黑线所示的某频率信号存在时,靠近它的本来可以听见的噪声b就变得听不见了,这种现象就是同时性遮蔽效应。而如右图所示,当某时刻有黑线所示的信号存在时,位于其后面的比它小一些的本来可听见的噪声e也变得听不见了,这种现场称为非同时性遮蔽效应。两种效应合成的结果形成了实际的可闻阈。 杜比ac-3就是一种感知型编码方式,它把整个音频频带分割成若干个较窄的频段,因为人类的听觉对不同频率的声音具有不同的灵敏度,各频段的宽度并不完全一样。由于有用的信号被划分成狭窄的频频,编码噪声的滤降总是就比较容易。因为对于每个频段来说,该频率以外的所有信号可以全部被滤除掉而不会损伤有用信号。而频段内,剩余噪声信号的频率与有用信号的频率非常接近,这正是遮蔽效应发挥最大作用的区域。从这种意义上说,象ac-3这样的感知型编码系统是一种非常有效的减噪系数。这些被分割成狭窄频段的多路数字音频信号最终还需要被合成一路完整的全频带信号,但每一个频段所占有的数据量并不是平均分配的,编码器内部有一个“听觉遮蔽模块”,可以模拟人的听觉遮蔽效应,它能根据信号的动态特性来决定在某一时刻的数据用量应当如何分配给各频段才是最合适的。频谱密集、音量大的声音元素应该获得较多的数据占有量,那些由于遮蔽效应而听不到的声音则少占用或不占用数据量。 2 ac-3的编解码技术简介 ac-3是在ac-1和ac-2基础上发展起来的多通道编码技术,保留了原ac-2中如窗函数处理、指数变换编码、自适应比特分配等许多特点,还新增了运用立体声多声道的编码技术策略的coupling和rematrix算法。一般而言,

相关IC型号

热门点击

 

推荐技术资料

业余条件下PCM2702
    PGM2702采用SSOP28封装,引脚小而密,EP3... [详细]
版权所有:51dzw.COM
深圳服务热线:13751165337  13692101218
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式


 复制成功!