位置:51电子网 » 技术资料 » 消费类电子

Internet音频技术概述

发布时间:2007/9/11 0:00:00 访问次数:506

Internet音频产业

    随着Internet的普及,Internet也迅速成为一个音乐发行渠道。消费者可以从Internet上把他们最喜欢的歌曲或新近发行的歌曲下载到便携式播放器中。固态音频压缩技术不断推进的里程和具有庞大容量的各种便携式存储媒体的出现,使Internet音频产业呈现欣欣向荣的景象。

    一些音像公司,如BMG、EMI和华纳,均向Internet内容提供商提供音乐,而Internet内容提供商则将音乐内容提供给消费者下载。这便产生了一个重要的问题,即如何保护Internet发行渠道中的版权。于是,一些在Internet上提供数字权利管理(DRM)的软件公司,如Liquid Audio、Intertrust、Microsoft和Verence便跻身进入这一领域。这种业务的成功在很大程度上取决于SDMI(安全数字音乐倡议组织),该机构联手录音公司、消费电子公司、器件 (半导体芯片)供应商及DRM公司,建立安全方针,确保Internet音乐发行得到保护并具有合法性。以上是这一快速发展领域的总体状况。

MPEG 音频

    MPEG是高保真音频压缩的一个国际标准(采用于1992年)。这个标准分为3个层面:II层、III层和I层。流行的MP3是MPEG-1的III层。AAC(高级音频编码)是MPEG的第二阶段(MPEG-2),MPEG-2是MPEG-1的改进。这个新标准采用于1997年。在同样的压缩比率下,AAC比MP3提供更佳的音频质量。MPEG-2和MPEG-3的采样频率高达44.1kHz 或48kHz,比特率在32kbps至128kbps之间。 这些音频压缩标准全都利用了人类听觉系统的直觉特征心理声学。

心理声学

    通过将心理声学模型应用到音频比特流中,可以消除大量无关的音频数据。这一模型使用了频域和时域中强信号的屏蔽效果。

频率域屏蔽

    当一个强信号(屏蔽信号)出现时,与它同时产生的一个较弱信号(被屏蔽信号)就可能被我们的听觉系统所忽略,前提是在频率域中的被屏蔽信号与屏蔽信号十分相近。这称为频率屏蔽效果(如图1所示)。480Hz将被较强的500Hz信号所屏蔽。通过采集这些频率域在屏蔽效果下的有声和无声的音频水平,可以获得屏蔽阈值。任何振幅比阈值低的信号人耳都听不见,因此可以去除。这将大幅度减少用于对音频信号进行编码的数据量。

    当这个屏蔽信号变弱时,阈值曲线也随着降低,直到一个水平,到了这个水平后,无论屏蔽信号是否继续减弱,阈值曲线都将保持不变。只要信号大于3 dB,人耳就能听到音频内容。

时间域屏蔽(当时屏蔽)

    这种屏蔽效果不仅在频域发生,而且也在时域发生。当出现一个强信号,并在极短的间隔内跟随一个弱信号时,这个弱信号就几乎被人耳忽略了。这是人类听觉反应系统的感知效果。

    这种信号屏蔽能力取决于其频率位置和响度。音频编码器将使用这一信息(信号屏蔽比率SMR),利用允许的编码比特数对输入声频信号进行编码。

算法

    基于以上的屏蔽技术,典型的音频编码过程如下所示:

    1.使用滤波器带将音频信号分流入频率子带中,大约有32个关键(critical)子带-->子带滤波。

    2.使用心理声学模型确定每个子带的屏蔽阈值。

    3.计算每个子带的信号屏蔽比率(SMR),信号与屏蔽阈值的比率。

    4.如果一个子带中的功率低于屏蔽阈值,就可以去除这个子带。

    5.如果比屏蔽阈值高,应确定用来对采样进行量化的比特数量,使量化噪音低于屏蔽阈值动态比特分配。

    6.集合全部量化采样,把它们放入比特流帧中。

    最终的音频质量主要取决于如何在各个子带中分配比特。解码的复杂程度降低

Internet音频产业

    随着Internet的普及,Internet也迅速成为一个音乐发行渠道。消费者可以从Internet上把他们最喜欢的歌曲或新近发行的歌曲下载到便携式播放器中。固态音频压缩技术不断推进的里程和具有庞大容量的各种便携式存储媒体的出现,使Internet音频产业呈现欣欣向荣的景象。

    一些音像公司,如BMG、EMI和华纳,均向Internet内容提供商提供音乐,而Internet内容提供商则将音乐内容提供给消费者下载。这便产生了一个重要的问题,即如何保护Internet发行渠道中的版权。于是,一些在Internet上提供数字权利管理(DRM)的软件公司,如Liquid Audio、Intertrust、Microsoft和Verence便跻身进入这一领域。这种业务的成功在很大程度上取决于SDMI(安全数字音乐倡议组织),该机构联手录音公司、消费电子公司、器件 (半导体芯片)供应商及DRM公司,建立安全方针,确保Internet音乐发行得到保护并具有合法性。以上是这一快速发展领域的总体状况。

MPEG 音频

    MPEG是高保真音频压缩的一个国际标准(采用于1992年)。这个标准分为3个层面:II层、III层和I层。流行的MP3是MPEG-1的III层。AAC(高级音频编码)是MPEG的第二阶段(MPEG-2),MPEG-2是MPEG-1的改进。这个新标准采用于1997年。在同样的压缩比率下,AAC比MP3提供更佳的音频质量。MPEG-2和MPEG-3的采样频率高达44.1kHz 或48kHz,比特率在32kbps至128kbps之间。 这些音频压缩标准全都利用了人类听觉系统的直觉特征心理声学。

心理声学

    通过将心理声学模型应用到音频比特流中,可以消除大量无关的音频数据。这一模型使用了频域和时域中强信号的屏蔽效果。

频率域屏蔽

    当一个强信号(屏蔽信号)出现时,与它同时产生的一个较弱信号(被屏蔽信号)就可能被我们的听觉系统所忽略,前提是在频率域中的被屏蔽信号与屏蔽信号十分相近。这称为频率屏蔽效果(如图1所示)。480Hz将被较强的500Hz信号所屏蔽。通过采集这些频率域在屏蔽效果下的有声和无声的音频水平,可以获得屏蔽阈值。任何振幅比阈值低的信号人耳都听不见,因此可以去除。这将大幅度减少用于对音频信号进行编码的数据量。

    当这个屏蔽信号变弱时,阈值曲线也随着降低,直到一个水平,到了这个水平后,无论屏蔽信号是否继续减弱,阈值曲线都将保持不变。只要信号大于3 dB,人耳就能听到音频内容。

时间域屏蔽(当时屏蔽)

    这种屏蔽效果不仅在频域发生,而且也在时域发生。当出现一个强信号,并在极短的间隔内跟随一个弱信号时,这个弱信号就几乎被人耳忽略了。这是人类听觉反应系统的感知效果。

    这种信号屏蔽能力取决于其频率位置和响度。音频编码器将使用这一信息(信号屏蔽比率SMR),利用允许的编码比特数对输入声频信号进行编码。

算法

    基于以上的屏蔽技术,典型的音频编码过程如下所示:

    1.使用滤波器带将音频信号分流入频率子带中,大约有32个关键(critical)子带-->子带滤波。

    2.使用心理声学模型确定每个子带的屏蔽阈值。

    3.计算每个子带的信号屏蔽比率(SMR),信号与屏蔽阈值的比率。

    4.如果一个子带中的功率低于屏蔽阈值,就可以去除这个子带。

    5.如果比屏蔽阈值高,应确定用来对采样进行量化的比特数量,使量化噪音低于屏蔽阈值动态比特分配。

    6.集合全部量化采样,把它们放入比特流帧中。

    最终的音频质量主要取决于如何在各个子带中分配比特。解码的复杂程度降低

相关IC型号

热门点击

 

推荐技术资料

中国传媒大学传媒博物馆开
    传媒博物馆开馆仪式隆童举行。教育都i国家广电总局等部门... [详细]
版权所有:51dzw.COM
深圳服务热线:13751165337  13692101218
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式


 复制成功!