【TMS320C6678多核固定和浮点数字信号处理器SPRS691D ， 2013年4月www.ti.】,第18页-TMS320C6678ACYP PDF资料1-51电子网

位置：首页 > IC型号导航 > 首字符T型号页 > 首字符T的型号第322页 > TMS320C6678ACYP > TMS320C6678ACYP PDF资料 > TMS320C6678ACYP PDF资料1第18页

TMS320C6678

多核固定和浮点数字信号处理器

SPRS691D ， 2013年4月

www.ti.com

2.2 DSP内核描述

所述的C66x数字信号处理器（DSP）的延伸的C64x +和C674x的DSP通过性能

改进和新功能。许多新功能的目标增加了矢量处理性能。该

的C64x +和C674x的DSP支持双向SIMD运算16位数据和4路SIMD操作为8位数据。

上的C66x的DSP中，矢量的处理能力是由延伸的SIMD指令的宽度改善。

的C66x的DSP可以执行的128位向量指令操作。例如QMPY32指令能够

每4个32位数据的两个向量之间执行元件到元件乘法。的的C66x DSP还

支持SIMD浮点运算。改进的向量处理能力（每条指令可以处理

并联结合C6000架构的固有指令级并行多数据）（如

执行的每个周期最多8指示）导致了非常高的水平的并行性可以由DSP被利用

通过使用TI的优化C / C ++编译器的程序员。

所述的C66x的DSP包括八个功能单元， 2个寄存器，并且两条数据通路，如图2-1所示。该

两个通用寄存器文件（A和B ），每个包含32个32位寄存器，总共64个寄存器。该

一般用途寄存器可用于数据，或者可以是数据的地址指针。所支持的数据类型包括

填充的8位数据，压缩的16位数据， 32位的数据， 40位数据和64位数据。乘法也支持128位的数据。

40位长或64位长的值被存储在寄存器对，与32个LSB放置在数据的偶数寄存器和

其余8或32个MSB在今后上部寄存器（它始终是一个奇数寄存器）。 128位的数据

值被存储在寄存器中的四胞胎，与32个LSB放入寄存器的数据是4和多

剩下的96个MSB在未来3上的寄存器。

8个功能单元（ .M1 ， .L1 ， .D1 ， .S1 ， .M2 ， .L2 ， .D2 ，和.S2 ）分别能够执行一个指令的

每个时钟周期。该.M功能单元执行所有的乘法运算。该.S和.L单元执行一般

算术，逻辑和分支功能。该.D单位主要从内存中加载数据到寄存器文件和

店内结果从寄存器文件到内存中。

每个的C66x .M单元可以执行以下定点运算之一的每个时钟周期： 4个32 ×32位

乘法， 16个16 × 16位乘法， 4个16 × 32位乘法， 4个8 × 8位乘法， 4个8 × 8位乘法

与添加操作，和四个16 × 16乘法与加法/减法的能力。酒店还为伽罗华域支持

乘法为8位和32位的数据。许多通信算法，如FFT和调制解调器需要

复数乘法。每个的C66x .M单元可以使用或不四舍五入执行一个16 × 16位复数乘法

功能， 2个16 × 16位复数乘法舍入能力，以及32 × 32位复数乘法与

四舍五入的能力。的的C66x还可以执行两个16 × 16位和一个32 × 32位复数乘法指令

该相乘的复数与另一个数字进行舍入能力的复共轭。

通信信号的处理还需要大量使用矩阵运算。每个的C66x .M单元能够

通过在每个周期内[2 × 2]的复数矩阵具有或不具有取整能力乘以[1 ×2 ]复矢量。

一个版本也存在允许[1 × 2 ]向量与[2 × 2 ]复杂基体中的共轭相乘。

每个的C66x .M单元还包括从所述C674x的DSP ，它包括IEEE浮点乘法运算

一个单精度乘以每个周期和一个双精度乘以每4个周期。还有一个

混合精度乘法，其允许单精度值的乘法由一个双精度值和一个

操作允许产生一个双精度数的两个单精度数的相乘。该

的C66x的DSP通过将指令允许提高在C674x双精度乘法的性能

每循环1的双精度乘法，也减少了延迟时隙的数目从10下降到4，每一个的C66x

.M单元也可以执行以下一个浮点运算的每个时钟周期：一个，两个，或四个

单精度乘法或一个复杂的单精度乘法。

该.L和.S单位现在可支持多达64位操作数。这使得许多运算的新版本，

逻辑和数据包装说明，以便每个周期更多的并行操作。附加说明是

加入得到的浮点加法和减法指令的性能的改进，包括在

能够执行一个双精度加法或减法每个周期。转换到/从整数和

单精度值现在可以在两个.L和.S单元上的C66x完成。另外，通过取较大的优点

设备概述

首页

尾页

共242页

深圳市碧威特网络技术有限公司