ARM的DSP增强型扩展

发布时间:2008/9/1 0:00:00 访问次数:542

　　现在，很多新兴的应用领域涌现了许多新的算法标准，这些算法对于处理器提出了更高的性能和控制要求。信号处理需要处理器提供高峰值性能，但这部分在整个算法中的比例有减少的趋势。对于开发包含高性能算法的大规模应用的设计团队来说，有很多种可供选择的方案。市场竞争的压力使得选择一个对高性能有充分保障的处理器平台来实现高性能的功能变得非常重要。但是选择超出需求性能很多的处理器平台对于系统成本和电源消耗也是有着很大影响的，这会直接导致产品缺乏竞争力。

　　ａｒｍ在提供通用的ｒｉｓｃ处理器架构的同时，为其增添了一些针对特定应用的高性能指令集，以期能够达到软件和硬件的一个优化平衡。这样，一些高度涉及信号处理的应用本来是要借助一块专用ｄｓｐ来完成的，现在由一个ａｒｍ内核就可以实现同样的功能。比较典型的例子就是ｍｐ３音频算法。对于ｍｐ３算法的分析表明，一些关键的前端步骤的处理，包括读入比特流，霍夫曼（ｈｕｆｆｍａｎ）解码和反量化（ｉｎｖｅｒｓｅ　ｑｕａｎｔｉｚａｔｉｏｎ），这时，ａｒｍ　ｒｉｓｃ架构比普通的ｄｓｐ能体现更佳的性能。同时，这个通用处理器还可以处理复杂的任务控制。

　　ａｒｍ为信号处理算法专门发布了ｖ５ｔｅ的架构，在普通的ａｒｍ架构基础上新增了有效的ｄｓｐ指令。ａｒｍ的扩展ｄｓｐ指令集使得ａｒｍ的ｃｐｕ系列能够更好的适应复杂的信号处理，同时还保留了作为高性能ｒｉｓｃ处理器所特有的低功耗特性。ａｒｍ　ｖ５ｔｅ的ｄｓｐ扩展指令集已经在ａｒｍ９４６ｅ－ｓｔｍ　和　ａｒｍ９６６ｅ－ｓｔｍ和ａｒｍ９２６ｅｊ－ｓｔｍ上得到应用。ｉｎｔｅｌ也同时在他们和ａｒｍ架构兼容的ｘｓｃａｌｅ微处理器系列里实现了ｄｓｐ指令集的扩展，并且主频达到了１ｇｈｚ。

　　ａｒｍ的解决方案在解决应用问题而增强了性能的同时，还在性能和功耗，ｃｐｕ核面积的大小等方面达到了均衡。像ａｒｍ９ｅｔｍ这样的单核解决方案，同时满足了任务控制和信号处理方面的需求，比传统的ｄｓｐ内核加通用内核的双核方案，在最终的效率和开发过程方面有了很大的提升。

　　目标应用：

　　ａｒｍ专门为ａｒｍ的各个平台开发了近乎于ｃｄ音质的音频算法，比如ｍｐ３，包括了ｗｍａ和ｍｐｅｇ　ａａｃ标准。总的来说，有着ｄｓｐ增强指令的内核是最适合于应用在以前既需要高性能的ｄｓｐ核同时又要求能够进行有效的任务控制的场合。比如大容量存储器，语音编码器，语音识别合成，网络应用，车控系统，智能手机，发报机和调制解调器。

　　下图列举了ｄｓｐ增强指令。包括单周期１６ｘ１６和３２ｘ１６的乘法指令，增加了饱和运算功能的运算指令。这些指令为开发稳定的操作系统和比特级精确的算法提供了方便。前导零运算指令为算法的标准化和浮点数运算特别是对于除法运算带来了高性能。这些ｄｓｐ增强指令在ａｒｍｖ５ｔｅ中得到了很好的实现。

　　支持ｄｓｐ增强指令的硬件架构是基于现有的ａｒｍ９ｔｄｍｉｔｍｒｉｓｃ核的，也是五级流水线，哈佛结构。ｄｓｐ增强指令集对于整个现有结构的影响被控制到了最小，没有增加另外的寄存器或者ｃｐｕ状态，也没有增加对寄存器使用的限制。如表一所示，ａｒｍ９ｅ架构只增加了有限的部分：　一个快速３２ｘ１６乘法单元，一个ｃｌｚ单元和两个饱和运算单元。

　　因为ｄ　ｓ　ｐ增强功能并没有对现有的架构做太大的修改，所以ａｒｍ９ｅ优于原先的ａｒｍ９架构。ａｒｍ９ｅ内核能达到和ａ　ｒ　ｍ　９内核差不多的主频，在０．１８μｍ工艺下能达到１９５ｍｈｚ，并且只有１．０ｍｍ２的晶圆面积（ｄｉｅ　ａｒｅａ），功耗预计为０．５ｍｗ／ｍｈｚ。

　　ｄｓｐ增强指令集并没有用特别的硬件逻辑来实现诸如ｍｏｄｕｌｏ　ａｄｄｒｅｓｓｉｎｇ，ｂｉｔ－ｗｉｓｅ　ｒｅｖｅｒｓａｌ　ａｄｄｒｅｓｓｉｎｇ和ｚｅｒｏｏｖｅｒｈｅａｄ

　　ｌｏｏｐｉｎｇ的指令。但同时支持这些运算也是很有意义的，所以可以用一些已有的指令组合来实现，尽管这会带来一些性能上的微小的损失。

　　ｂｉｔ－ｗｉｓｅ　ｒｅｖｅｒｓａｌ　ａｄｄｒｅｓｓｉｎｇ在快速傅立叶变换（ｆｆｔ）中是一个很常见的功能需求，是很多ｄｓｐ算法的基础功能。现有的桶位移（ｂａｒｒｅｌ　ｓｈｉｆｔｅｒ）功能提供了实现ｂｉｔ－ｗｉｓｅ　ｒｅｖｅｒｓａｌ的一种仿真方法，和用单指令实现相比只有微小的性能损失。例如，对于一个５１２个样本的ｆｆｔ来说，在ａｒｍ９ｅ核上需要大概２９ｋ的时钟周期，其中只有大概３００个时钟周期是用来仿真ｂｉｔ－ｒｅｖｅｒｓｅｄ　ａｄｄｒｅｓｓｉｎｇ的，只占了整个ｆｆｔ变换的１％。

　　案例分

　　目标应用：

　　ｌｏｏｐｉｎｇ的指令。但同时支持这些运算也是很有意义的，所以可以用一些已有的指令组合来实现，尽管这会带来一些性能上的微小的损失。

　　案例分

上一篇：力控在嵌入HMI系统中的应用

上一篇：嵌入式系统开发：Arm与Linux的完美结合

相关技术资料: 8-11iNEMO系统级封装 (SiP) 6轴单片式解决方案; 8-11增强型模块化输入输出系统 (eMIOS); 8-11最新60和100V器件FERD30H100S; 8-1132位汽车微控制器SPC5系列设计应用; 8-11新一代高性能接近和测距传感器; 8-11新型场效应整流二极管（FERD）技术封装; 8-9MPS 启动器开发板/评估套件（EVKT/PKT）; 8-912V、6A 四路降压电源管理 IC; 8-9数字恒定导通时间控制模式（COT）; 8-9同步降压PWM DC-DC线性电源控制器应用简述; 8-9 ADC 技术参数与应用需求之间关系探究; 8-9反激变换器传导和辐射电磁干扰分析和抑制技术

相关IC型号

ARM的DSP增强型扩展

热门点击

推荐技术资料