位置:首页 > IC型号导航 > 首字符T型号页 > 首字符T的型号第322页 > TMS320C6678ACYP > TMS320C6678ACYP PDF资料 > TMS320C6678ACYP PDF资料1第18页

TMS320C6678
多核固定和浮点数字信号处理器
SPRS691D , 2013年4月
www.ti.com
2.2 DSP内核描述
所述的C66x数字信号处理器(DSP)的延伸的C64x +和C674x的DSP通过性能
改进和新功能。许多新功能的目标增加了矢量处理性能。该
的C64x +和C674x的DSP支持双向SIMD运算16位数据和4路SIMD操作为8位数据。
上的C66x的DSP中,矢量的处理能力是由延伸的SIMD指令的宽度改善。
的C66x的DSP可以执行的128位向量指令操作。例如QMPY32指令能够
每4个32位数据的两个向量之间执行元件到元件乘法。的的C66x DSP还
支持SIMD浮点运算。改进的向量处理能力(每条指令可以处理
并联结合C6000架构的固有指令级并行多数据) (如
执行的每个周期最多8指示)导致了非常高的水平的并行性可以由DSP被利用
通过使用TI的优化C / C ++编译器的程序员。
所述的C66x的DSP包括八个功能单元, 2个寄存器,并且两条数据通路,如图2-1所示。该
两个通用寄存器文件(A和B ),每个包含32个32位寄存器,总共64个寄存器。该
一般用途寄存器可用于数据,或者可以是数据的地址指针。所支持的数据类型包括
填充的8位数据,压缩的16位数据, 32位的数据, 40位数据和64位数据。乘法也支持128位的数据。
40位长或64位长的值被存储在寄存器对,与32个LSB放置在数据的偶数寄存器和
其余8或32个MSB在今后上部寄存器(它始终是一个奇数寄存器)。 128位的数据
值被存储在寄存器中的四胞胎,与32个LSB放入寄存器的数据是4和多
剩下的96个MSB在未来3上的寄存器。
8个功能单元( .M1 , .L1 , .D1 , .S1 , .M2 , .L2 , .D2 ,和.S2 )分别能够执行一个指令的
每个时钟周期。该.M功能单元执行所有的乘法运算。该.S和.L单元执行一般
算术,逻辑和分支功能。该.D单位主要从内存中加载数据到寄存器文件和
店内结果从寄存器文件到内存中。
每个的C66x .M单元可以执行以下定点运算之一的每个时钟周期: 4个32 ×32位
乘法, 16个16 × 16位乘法, 4个16 × 32位乘法, 4个8 × 8位乘法, 4个8 × 8位乘法
与添加操作,和四个16 × 16乘法与加法/减法的能力。酒店还为伽罗华域支持
乘法为8位和32位的数据。许多通信算法,如FFT和调制解调器需要
复数乘法。每个的C66x .M单元可以使用或不四舍五入执行一个16 × 16位复数乘法
功能, 2个16 × 16位复数乘法舍入能力,以及32 × 32位复数乘法与
四舍五入的能力。的的C66x还可以执行两个16 × 16位和一个32 × 32位复数乘法指令
该相乘的复数与另一个数字进行舍入能力的复共轭。
通信信号的处理还需要大量使用矩阵运算。每个的C66x .M单元能够
通过在每个周期内[2 × 2]的复数矩阵具有或不具有取整能力乘以[1 ×2 ]复矢量。
一个版本也存在允许[1 × 2 ]向量与[2 × 2 ]复杂基体中的共轭相乘。
每个的C66x .M单元还包括从所述C674x的DSP ,它包括IEEE浮点乘法运算
一个单精度乘以每个周期和一个双精度乘以每4个周期。还有一个
混合精度乘法,其允许单精度值的乘法由一个双精度值和一个
操作允许产生一个双精度数的两个单精度数的相乘。该
的C66x的DSP通过将指令允许提高在C674x双精度乘法的性能
每循环1的双精度乘法,也减少了延迟时隙的数目从10下降到4,每一个的C66x
.M单元也可以执行以下一个浮点运算的每个时钟周期:一个,两个,或四个
单精度乘法或一个复杂的单精度乘法。
该.L和.S单位现在可支持多达64位操作数。这使得许多运算的新版本,
逻辑和数据包装说明,以便每个周期更多的并行操作。附加说明是
加入得到的浮点加法和减法指令的性能的改进,包括在
能够执行一个双精度加法或减法每个周期。转换到/从整数和
单精度值现在可以在两个.L和.S单元上的C66x完成。另外,通过取较大的优点
18
设备概述
版权所有2013德州仪器