【SMJ320C6701浮点数字信号处理器SGUS030B - 2000年4月 - 修订2001年5月】,IC型号SM320C6203W14,SM320C6203W14 PDF资料,SM320C6203W14经销商,ic,电子元器件-51电子网

SMJ320C6701

浮点数字信号处理器

SGUS030B - 2000年4月 - 修订2001年5月

最高性能浮点数字

信号处理器（DSP） SMJ320C6701

- 7- ， 6 ns指令周期时间

- 140- ， 167 - MHz的时钟速率

- 8个32位指令/周期

- 最多1 GFLOPS性能

- 引脚兼容“ C6201定点

DSP

SMJ ： QML处理符合MIL -PRF- 38535

SM ：标准处理

工作温度范围

- 扩展（ W） -55°C至115℃

- 扩展（ S） -40°C至90℃

的VelociTI 高级超长指令

字（ VLIW ） “的C67x CPU核心

- 八个独立的功能

单位：

- 四的ALU （浮点和定点）

- 两个ALU （定点）

- 两个乘法器（浮点和

定点）

- 负载存储架构， 32个32位

通用寄存器

- 指令包装减少代码大小

- 所有指令条件

指令集特点

- 硬件支持IEEE

单精度指令

- 硬件支持IEEE

双精度指令

- 字节寻址（ 8位，16位， 32位数据）

- 32位地址范围

- 8位溢出保护

- 饱和

- 位字段提取，设置，清除

- 位计数

- 规范化

1M位的片上SRAM

- 512K位的内部程序/缓存

（ 16K 32位指令）

- 512K位双访问内部数据

（ 64K字节）

32位外部存储器接口（ EMIF ）

- 无缝连接同步

秋之回忆： SDRAM和SBSRAM

- 无缝连接异步

秋之回忆： SRAM和EPROM

四通道引导加载

直接存储器存取（DMA ）控制器

一个辅助通道

16位主机端口接口（ HPI ）

- 访问整个存储器映射

两个多通道缓冲串行端口

（ McBSP的）

- 直接连接T1 / E1 ， MVIP ， SCSA

成帧器

- ST-总线开关兼容

- 多达256个通道的每

- AC97兼容

- 串行外设接口（ SPI ）

兼容（ Motorola ）

2个32位通用定时器

灵活的锁相回路（ PLL ）时钟

发电机

IEEE- 1149.1 （ JTAG

)

边界扫描兼容

429引脚陶瓷球栅阵列（ CBGA ）

包装（ GLP后缀）

0.18微米/ 5级金属工艺

- CMOS技术

3.3 V的I / O ， 1.9 V内部

请注意，一个重要的通知有关可用性，标准保修，并且在关键的应用程序中使用

德州仪器公司的半导体产品和免责条款及其出现在此数据表的末尾。

的VelociTI是德州仪器的商标。

摩托罗拉是Motorola，Inc.的商标。

IEEE标准1149.1-1990标准试验访问端口和边界扫描结构。

PRODUCTION数据信息为出版日期。

产品符合每德州仪器条款规范

标准保修。生产加工并不包括

所有测试参数。

版权

2001年，德州仪器

关于产品符合MIL PRF 38535 ，所有参数进行测试

除非另有说明。在所有其他产品，生产

加工不一定包括所有参数进行测试。

邮政信箱1443

休斯敦，得克萨斯州77251-1443

SMJ320C6701

浮点数字信号处理器

SGUS030B - 2000年4月 - 修订2001年5月

GLP包装

（底视图）

描述

该SMJ320C67x DSP是浮点DSP系列中的SMJ320C6000平台。该SMJ320C6701

（' C6701 ）器件基于高性能，先进的VelociTI超长指令字（ VLIW ）

建筑德州仪器（ TI ）开发，使该DSP的多通道的最佳选择，并

多功能应用。凭借高达1千兆次浮点运算性能每秒（ GFLOPS ）在

167 MHz的时钟速率， ' C6701提供了具有成本效益的解决方案，以高性能DSP编程

的挑战。在“ C6701 DSP具有高速控制器和数字的业务灵活性

阵列处理器的能力。此处理器有32个通用的32位字长和八个寄存器

高度独立的功能单元。 8个功能单元提供4浮点/定点ALU的两个

定点ALU和2浮点/定点乘法器。的“ C6701可产生两个乘法累加

（MACS ），每个周期总共每秒3.34亿的MAC （ MMACS ）。在“ C6701 DSP还具有

应用程序特定的硬件逻辑，片内存储器，以及额外的片上外设。

在“ C6701包括片上存储器的大银行，拥有强大多样的外设。

程序存储器包括一个64K字节的块是用户可配置为高速缓存或存储器映射方案

空间。数据存储器由内存2 32K字节的块。外设集包括两个多

缓冲串行端口（ McBSP的），两个通用定时器，主机端口接口（ HPI ），以及无缝的外部

存储器接口（EMIF ），能够连接到SDRAM或SBSRAM和异步外围设备。

该“ C6701具有开发工具一整套包括：一个新的C编译器，优化器组件

简化编程和调度，并在Windows 调试器界面的可视性源代码

执行。

TI是德州仪器的商标。

Windows是微软公司的注册商标。

邮政信箱1443

休斯敦，得克萨斯州77251-1443

SMJ320C6701

浮点数字信号处理器

SGUS030B - 2000年4月 - 修订2001年5月

设备特点

表1提供了“ C6701 DSP的概述。该表显示了每个设备的显著功能，包括

片上RAM ，外设，执行时间的能力，并与引脚数封装类型。

表1中的“ C6701处理器的特征

特征

设备号

片上存储器

SMJ320C6701

512 - Kbit的程序存储器

512 - Kbit的数据存储器（如组织2块）

2 Mutichannel缓冲串行端口（ McBSP的）

2个通用定时器

主机端口接口（ HPI ）

外部存储器接口（ EMIF ）

7纳秒，在140兆赫和6毫微秒在167兆赫

27 mm

27毫米， 429引脚BGA （ GLP ）

1.9 V核心

3.3 V的I / O

描述

外设

周期

套餐类型

额定电压

功能和CPU框图

SDRAM

SBSRAM

节目

公共汽车

“ C6701数字信号处理器

节目

交通/高速缓存

调节器

内部程序存储器

1块程序/缓存

（ 64K字节）

SRAM

ROM / FLASH

I / O设备

外部存储器

接口（ EMIF ）

“的C67x CPU

定时器

定时器1

多通道

缓冲串行

端口0

多通道

缓冲串行

端口1

取指令

指令调度

指令译码

数据路径中的

寄存器文件

DMA总线

控制

逻辑

TEST

在电路

仿真

打断

控制

主机连接

MC68360无缝

MPC860无缝

PCI9050桥+逆变器

MC68302 + PAL

MPC750 + PAL

MPC960 （ Jx的/ Rx）的PAL +

主机端口

接口

（ HPI ）

直接内存

门禁控制器

（ DMA）的

（ 4通道）

PLL

(x1, x4)

数据总线

成帧芯片：

H.100 ， MVIP ，

SCSA ，T1，E1

AC97设备，

SPI的设备，

编解码器

数据路径B

B寄存器文件

.L1 .S1 .M1 .D1

.D2 .M2 .S2 .L2

电源 -

下

逻辑

数据

ACCESS

调节器

内部数据

内存

（ 64K字节）

2块8银行

每

这些功能单元执行浮点指令。

邮政信箱1443

休斯敦，得克萨斯州77251-1443

SMJ320C6701

浮点数字信号处理器

SGUS030B - 2000年4月 - 修订2001年5月

CPU说明

CPU获取的VelociTI高级甚长指令字（VLIW）（256位宽度）提供多达八个

32位指令到8个功能单元中的每一个时钟周期。的的VelociTI VLIW架构的特点

控制通过其中所有八个单元不必与指令供给，如果他们还没有准备好来执行。该

每一个32位指令的第1位决定的下一个指令属于同一个执行包

先前指令，或者是否它应该在接下来的时钟作为下一个执行数据组的一部分来执行。

获取的包总是256位宽;然而，在执行包的大小而有所不同。可变长度

执行数据包是一个关键的节省内存的功能，区别于其他的VLIW体系结构“的C67x CPU 。

该CPU拥有两套功能单元。每组包含四个单元和一个寄存器文件。一组包含

功能单元.L1 ， .S1 ， .M1和.D1 ;另一组包含单位.D2 ， .M2 ， .S2和.L2 。这两个寄存器文件

包含16个32位寄存器，每一个用于32个通用寄存器的总数。两套功能单元

以及两个寄存器堆，构成侧面A和CPU的B（参见功能和CPU的框图

和图1）。这四个功能单元上的CPU的每一侧可以自由地共享的16个寄存器属于

那一侧。此外，每个侧设有连接于所有的寄存器在另一侧的单一数据总线，通过它

两套功能单元可以访问在相对侧上从寄存器文件中的数据。虽然寄存器访问

由功能单元上的CPU作为寄存器文件的同一侧可以在一个时钟周期中提供服务的所有单位

使用整个CPU的寄存器文件支持一个读取和每个周期一个写寄存器访问。

在'的C67x CPU执行的所有“与C62x指令。除了'与C62x定点指令，六个，八个

功能单元（ .L1 ， .M1 ， .D1 ， .D2 ， .M2和.L2 ）也执行浮点指令。剩下的两个

功能单元（ .S1和.S2 ）也执行了新的LDDW指令，加载每个CPU侧64位的

总的每个周期为128位。

该“的C67x CPU的另一个重要特点是加载/存储架构，其中所有的指令寄存器进行操作

（相对于数据存储器中）。两套数据寻址单元（ .D1和.D2 ）负责所有数据

寄存器文件和内存之间的传输。由.D单元驱动的数据地址允许数据

要用于从一个寄存器文件生成的地址加载或存储数据或从其他寄存器文件。该

'的C67x CPU支持各种使用或者直链或环状的寻址模式间接寻址模式

用5或15位偏移量。所有的指令都是有条件的，也最能访问的32个寄存器的任何一个。一些

寄存器，然而，被挑选出来，以支持特定的寻址或者保持为条件的条件

指令（如果条件是不会自动“真” ）。两个.M功能单元专用于乘法运算。

这两个.S和.L功能单元执行一般的算术，逻辑和分支的功能与效果

可每个时钟周期。

该处理流程开始时的256位宽的指令取出的数据包是从程序存储器中取出。

目的地为单独的功能单元的32位指令被“链接”在一起，在至少“1”位

的指示显著位（LSB）位置。被“链接”在一起同时进行的说明

执行（最多总计8 ）组成一个执行包。的“0”中的LSB位的指令打破链，

有效地将跟着它在未来的执行数据包中的说明。如果执行数据包穿过

取包边界（ 256位宽），汇编学位在未来获取的数据包，而其余

目前取包填充为NOP指令。执行分组的取数据组内的号

可能从一个到八个。执行分组被调度到它们各自的功能单元的一种的速度

每一个时钟周期，下一个256位的取数据组是不取出的，直到从当前的所有执行分组取

包已经被发送。解码后，将指示同时驱动所有的活性的功能单元

八条指示每个时钟周期的最大执行速率。虽然大多数的结果被存储在32位

寄存器，它们随后可以移动到存储器以字节或半字为好。所有的加载和存储

指令是针对字节，半字或字寻址。

邮政信箱1443

休斯敦，得克萨斯州77251-1443

SMJ320C6701

浮点数字信号处理器

SGUS030B - 2000年4月 - 修订2001年5月

CPU说明（续）

src1

.L1

src2

DST

长DST

长SRC

LD1 32 MSB

ST1

数据路径中的

src2

DST

.M1

src1

src2

LD1 32 LSB

DA1

.D1

DST

src1

src2

DA2

.D2

src2

src1

DST

LD2 32 LSB

src2

.M2

src1

DST

src2

数据路径B

.S2

src1

DST

长DST

长SRC

LD2 32 MSB

ST2

src1

这些功能单元执行的浮点指令。

图1. SMJ320C67x CPU数据通路

邮政信箱1443

休斯敦，得克萨斯州77251-1443

长SRC

长DST

DST

.L2

src2

长SRC

长DST

DST

.S1

src1

文件

(A0–A15)

文件B

(B0–B15)

控制

注册网络文件