TigerSHARC DSP在信号处理系统中的应用
发布时间:2008/5/26 0:00:00 访问次数:480
    
    
    来源:国外电子元器件 作者:西安电子科技大学电子工程学院 林文峰 刘书明
    
    摘要:文中讨论了tisersharc dsp在信号处理系统中的几个应用问题。介绍了多片tigersharc dsp芯片构成的信号处理系统组成;估计了系统的运算量、所需的计算时间以及完成算法所需的dsp数目;讨论了dsp复位波形的要求以及与cpld配置芯片的关系;最后说明了dsp的电源供电和功耗的计算方法。
    关键词:tigersharc dsp;运算量;复位;功耗
    随着人们对实时信号处理要求的不断提高和大规模集成电路的迅速发展,作为数字信号处理核心和标志的数字信号处理器dsp芯片得到了快速的发展和应用。本文将介绍analog device公司的一款dsp-tigersharc在信号处理系统中的应用,并将对设计中的一些问题进行讨论说明。
    1 系统设计及各部分功能简介
    图1所示是一个信号处理系统的硬件框图。实际上,为了简化系统硬件,减少dsp片间连线,该系统的6个dsp以松耦合的链路方式进行连接。首先由dsp1通过外部dma方式读入中频解调后的i、q路数据,并由dsp1对读入数据进行脉冲压缩匹配滤波,脉冲压缩后进行二次对消,以消除固定杂波。再由dsp1将处理后的数据按距离单元段通过链路口0、1分别发送给dsp2、dsp4。dsp2、dsp4主要进行目标检测mtd,并采用滑窗加权fft实现窄带多谱勒滤波器组。当dsp2、dsp4完成mtd后 再将对应每个距离单元的16个输出数据通过链路口分别送到dsp3和dsp5。之后,由dsp3、dsp5先进行求模运算,再进行恒虚警计算。dsp3、dsp5处理后的数据经链路口传输到dsp6,在dsp6接到该信号后,先对距离单元内16个输出进行门限处理,并选择其中最小杂波剩余值作为本单元的输出。门限处理后,dsp6还应完成视频积累,视频积累采用累加求平均的方式,这样可以避免反馈积累的拖尾现象。视频数据以dma方式通过外部口送出,并分别加到d/a与ds96f172等输入端,前者产生模拟视频,后者以差分形式送到显示单元。
    
    2 tigersharc dsp简介
    tigersharc dsp是一款高性能的静态超标量数字信号处理器,该处理器专为大的信号处理和通信任务而在结构上进行了优化。由于该处理器将非常宽的存储带宽和双运算模块结合在一起,从而建立了数字信号处理器性能的新标准。tigersharc静态超标量结构使dsp每周期能够执行多达4条指令、24个16-bit定点运算和6个浮点运算。
    该tigersharc dsp器件在三条相互独立的128bit宽度的内部数据总线中,每条可连接三个2mbit内部存储器中的一个,并可提供4个字的数据、指令及i/o访问和12gbytes/s的内部存储器带宽。当其运行在250mhz时,adsp-ts101s的内核指令周期为4ns,同时可以提供20亿次的40bit mac运算或者500万次80bit mac运算。
    tigersharc dsp器件的主要性能如下:
    ●最高运行速度为250mhz,指令周期为4ns;
    ●带有6mbits片内sram;
    ●带有双运算模块每个内部包含有一个alu、一个乘法器、一个移位器和一个寄存器组;
    ●具有一个外部端口、4个链路口和可编程标志引脚、sdram控制器和2个定时器;
    ●与用于片上仿真的ieee1149.1标准的jtag接口兼容;
    ●可通过共享总线无缝连接多达8个tiger-sharc dsp的片内总线仲裁。
    3 系统运算量分析及计算时间估计
    根据信号处理任务,下面具体分析系统各组成部分的运算量,并估计所需的时间,并确定完成算法所需的dsp数目(总信号处理周期小于1000μs)。
         3.1 脉冲压缩
    图2所示是采用fft技术实现脉冲压缩滤波的算法框图。若总距离单元数为1200,则需做2048点复数fft。当2048点复数fft完成后,
    
    
    来源:国外电子元器件 作者:西安电子科技大学电子工程学院 林文峰 刘书明
    
    摘要:文中讨论了tisersharc dsp在信号处理系统中的几个应用问题。介绍了多片tigersharc dsp芯片构成的信号处理系统组成;估计了系统的运算量、所需的计算时间以及完成算法所需的dsp数目;讨论了dsp复位波形的要求以及与cpld配置芯片的关系;最后说明了dsp的电源供电和功耗的计算方法。
    关键词:tigersharc dsp;运算量;复位;功耗
    随着人们对实时信号处理要求的不断提高和大规模集成电路的迅速发展,作为数字信号处理核心和标志的数字信号处理器dsp芯片得到了快速的发展和应用。本文将介绍analog device公司的一款dsp-tigersharc在信号处理系统中的应用,并将对设计中的一些问题进行讨论说明。
    1 系统设计及各部分功能简介
    图1所示是一个信号处理系统的硬件框图。实际上,为了简化系统硬件,减少dsp片间连线,该系统的6个dsp以松耦合的链路方式进行连接。首先由dsp1通过外部dma方式读入中频解调后的i、q路数据,并由dsp1对读入数据进行脉冲压缩匹配滤波,脉冲压缩后进行二次对消,以消除固定杂波。再由dsp1将处理后的数据按距离单元段通过链路口0、1分别发送给dsp2、dsp4。dsp2、dsp4主要进行目标检测mtd,并采用滑窗加权fft实现窄带多谱勒滤波器组。当dsp2、dsp4完成mtd后 再将对应每个距离单元的16个输出数据通过链路口分别送到dsp3和dsp5。之后,由dsp3、dsp5先进行求模运算,再进行恒虚警计算。dsp3、dsp5处理后的数据经链路口传输到dsp6,在dsp6接到该信号后,先对距离单元内16个输出进行门限处理,并选择其中最小杂波剩余值作为本单元的输出。门限处理后,dsp6还应完成视频积累,视频积累采用累加求平均的方式,这样可以避免反馈积累的拖尾现象。视频数据以dma方式通过外部口送出,并分别加到d/a与ds96f172等输入端,前者产生模拟视频,后者以差分形式送到显示单元。
    
    2 tigersharc dsp简介
    tigersharc dsp是一款高性能的静态超标量数字信号处理器,该处理器专为大的信号处理和通信任务而在结构上进行了优化。由于该处理器将非常宽的存储带宽和双运算模块结合在一起,从而建立了数字信号处理器性能的新标准。tigersharc静态超标量结构使dsp每周期能够执行多达4条指令、24个16-bit定点运算和6个浮点运算。
    该tigersharc dsp器件在三条相互独立的128bit宽度的内部数据总线中,每条可连接三个2mbit内部存储器中的一个,并可提供4个字的数据、指令及i/o访问和12gbytes/s的内部存储器带宽。当其运行在250mhz时,adsp-ts101s的内核指令周期为4ns,同时可以提供20亿次的40bit mac运算或者500万次80bit mac运算。
    tigersharc dsp器件的主要性能如下:
    ●最高运行速度为250mhz,指令周期为4ns;
    ●带有6mbits片内sram;
    ●带有双运算模块每个内部包含有一个alu、一个乘法器、一个移位器和一个寄存器组;
    ●具有一个外部端口、4个链路口和可编程标志引脚、sdram控制器和2个定时器;
    ●与用于片上仿真的ieee1149.1标准的jtag接口兼容;
    ●可通过共享总线无缝连接多达8个tiger-sharc dsp的片内总线仲裁。
    3 系统运算量分析及计算时间估计
    根据信号处理任务,下面具体分析系统各组成部分的运算量,并估计所需的时间,并确定完成算法所需的dsp数目(总信号处理周期小于1000μs)。
         3.1 脉冲压缩
    图2所示是采用fft技术实现脉冲压缩滤波的算法框图。若总距离单元数为1200,则需做2048点复数fft。当2048点复数fft完成后,