自适应计算减少QCELP功率
发布时间:2007/8/20 0:00:00 访问次数:812
QCELP(Qualcomm Code Excited Linear Predictive Coding-Qualcomm码受激线性预示编码)话音压缩算法是TIAIS-95北美宽带CDMA数字蜂窝电话标准的TIAIS-96话音蜂窝电话标准的TIAIS-96话音编解码所选的声码器。一个话音编解码器等于一个编码器和解码器对。依此标准进行设计对于便携系统设计人员来讲是个问题,这是因为用通常DSP方法需要异常的功耗。
QCELP是一种向量编码器型话音编解码,在话音编解码分类中被称为CELP(码受激线性预示)编码话音压缩算法。CELP编解码采用话音编码的合成分析方法。
编码器的任务是确定描述话音音频段的小的参量组,话音音频段可以最小的位数表示。编码器发送参量到译码器,译码器用这些参量重建音频段。一旦重建完成,音频段便在扬声器系统播放。
话音产生系统可模拟为声束、声调、周期激励器(声卡)或剩余噪声源。声束用线性预示编码模拟。声调和剩余噪声激励声束并用码簿(codebook)编码。
用码簿索引选择来自码簿的高斯向量(见图1).向量也称之为激励信号,向量与增益值相乘并经2个线性滤波器滤波。第1个滤波器之为长项滤波器,它重建激励信号中语音的长项声调周期数。第2个滤波器(短项滤波器)模拟话音的谱形。短项滤波器的输出是合成语音。
LPC(线性预示编码)滤波器的频谱是语音信号的谱线包络。所以,滤波器产生话音幅度。合成器产生向量或话音取样N长度的子帧(在8KHz取样率时,N为10~40)。合成器参量以帧或子帧速率更新,一般1帧是4个子帧长。
通常,码簿索引(码)、码簿增益和长项预示参量以子帧速率更新。对于IS-96A WCELP-13,码簿参量以最大到16倍帧或4倍子帧速率更新,短项滤波器系数以帧速率传送到合成器,但通常以子帧速率线性内插。
合成分析
CELP编解采用人声音产生系统的模型,它由声束、声卡、送话器嘴和语音组成。此系统可用一个噪声源、一个音调合成滤波器和声束或共振峰合成滤波器进行模拟。话音合成器或解压缩单元的数据流激励音调滤波器(图2)。然后,信号由共振峰合成器或LPC滤波器处理,最后是后滤波。
合成器和分析器把话音分解为段(帧)。在8KHz取样率时(160个取样),帧长度是20ms话音长。对于每帧,分析器确定在多大数据率下可最佳地表示帧。速率为全,半,1/4和1/8四种。噪声源依刺于帧速率。1/4和1/8速率用于伪随机噪声源,全和半速率用于码簿。
分析器的工作是为当前话音帧确定全成器模型参量的最佳匹配。分析器或压缩单元用合成器的简化型式搜寻一帧话音的最佳参量。在数据流框图(图2)中表示为逆向工作过程。
首先用Levinson-Durbin算法求出LPC参量(al…a10),然后求出声调延迟(包括整数和小数延迟)和声调增益。最后求出全速率和半速率下的码簿索引和增益。对于1/4和1/8帧速率,是用不同方法求和伪随机数时序的。但是伪随机数时序的求解是计算不充分的。
用合成分析方法(有时称之为向量量化器)求得音调和码簿参量(见图3)。此过程包括为音调确定或搜索算法选择最佳延迟参量和为码簿搜索选择最佳索引。思想是测量与相关函数匹配的特性,相关函数与目标话音段比较时再现合成信号的误差。根据延迟或索引产生的最小误差信号选择是佳延迟或码簿索引。
对每个延迟和码簿索引,都必须执行通过合成器的数据处理和信号关联。用可编程DSP实现这两种搜索会占用大部分的计算时间和功耗。QCELP算法也需要用32位运算做绝大部分相关测量。
功率消耗程序
有8个主要的内部码环路或程序消耗绝大部分的QCELP功率。它们是码簿和声调搜索,线频谱对(LSP)计算,递归卷积和4个不同的滤波器。在QCELP的分析器/压缩器侧用DSP实现,3个内部码环路占总功耗的80%.其中声调和码簿搜索占
QCELP(Qualcomm Code Excited Linear Predictive Coding-Qualcomm码受激线性预示编码)话音压缩算法是TIAIS-95北美宽带CDMA数字蜂窝电话标准的TIAIS-96话音蜂窝电话标准的TIAIS-96话音编解码所选的声码器。一个话音编解码器等于一个编码器和解码器对。依此标准进行设计对于便携系统设计人员来讲是个问题,这是因为用通常DSP方法需要异常的功耗。
QCELP是一种向量编码器型话音编解码,在话音编解码分类中被称为CELP(码受激线性预示)编码话音压缩算法。CELP编解码采用话音编码的合成分析方法。
编码器的任务是确定描述话音音频段的小的参量组,话音音频段可以最小的位数表示。编码器发送参量到译码器,译码器用这些参量重建音频段。一旦重建完成,音频段便在扬声器系统播放。
话音产生系统可模拟为声束、声调、周期激励器(声卡)或剩余噪声源。声束用线性预示编码模拟。声调和剩余噪声激励声束并用码簿(codebook)编码。
用码簿索引选择来自码簿的高斯向量(见图1).向量也称之为激励信号,向量与增益值相乘并经2个线性滤波器滤波。第1个滤波器之为长项滤波器,它重建激励信号中语音的长项声调周期数。第2个滤波器(短项滤波器)模拟话音的谱形。短项滤波器的输出是合成语音。
LPC(线性预示编码)滤波器的频谱是语音信号的谱线包络。所以,滤波器产生话音幅度。合成器产生向量或话音取样N长度的子帧(在8KHz取样率时,N为10~40)。合成器参量以帧或子帧速率更新,一般1帧是4个子帧长。
通常,码簿索引(码)、码簿增益和长项预示参量以子帧速率更新。对于IS-96A WCELP-13,码簿参量以最大到16倍帧或4倍子帧速率更新,短项滤波器系数以帧速率传送到合成器,但通常以子帧速率线性内插。
合成分析
CELP编解采用人声音产生系统的模型,它由声束、声卡、送话器嘴和语音组成。此系统可用一个噪声源、一个音调合成滤波器和声束或共振峰合成滤波器进行模拟。话音合成器或解压缩单元的数据流激励音调滤波器(图2)。然后,信号由共振峰合成器或LPC滤波器处理,最后是后滤波。
合成器和分析器把话音分解为段(帧)。在8KHz取样率时(160个取样),帧长度是20ms话音长。对于每帧,分析器确定在多大数据率下可最佳地表示帧。速率为全,半,1/4和1/8四种。噪声源依刺于帧速率。1/4和1/8速率用于伪随机噪声源,全和半速率用于码簿。
分析器的工作是为当前话音帧确定全成器模型参量的最佳匹配。分析器或压缩单元用合成器的简化型式搜寻一帧话音的最佳参量。在数据流框图(图2)中表示为逆向工作过程。
首先用Levinson-Durbin算法求出LPC参量(al…a10),然后求出声调延迟(包括整数和小数延迟)和声调增益。最后求出全速率和半速率下的码簿索引和增益。对于1/4和1/8帧速率,是用不同方法求和伪随机数时序的。但是伪随机数时序的求解是计算不充分的。
用合成分析方法(有时称之为向量量化器)求得音调和码簿参量(见图3)。此过程包括为音调确定或搜索算法选择最佳延迟参量和为码簿搜索选择最佳索引。思想是测量与相关函数匹配的特性,相关函数与目标话音段比较时再现合成信号的误差。根据延迟或索引产生的最小误差信号选择是佳延迟或码簿索引。
对每个延迟和码簿索引,都必须执行通过合成器的数据处理和信号关联。用可编程DSP实现这两种搜索会占用大部分的计算时间和功耗。QCELP算法也需要用32位运算做绝大部分相关测量。
功率消耗程序
有8个主要的内部码环路或程序消耗绝大部分的QCELP功率。它们是码簿和声调搜索,线频谱对(LSP)计算,递归卷积和4个不同的滤波器。在QCELP的分析器/压缩器侧用DSP实现,3个内部码环路占总功耗的80%.其中声调和码簿搜索占