基于FPGA的FFT/IFFT处理器的实现

发布时间:2008/5/28 0:00:00 访问次数:1121

基于fpga的fft/ifft处理器的实现

浙江大学仪器系数字技术与仪器研究所（杭州 310027）孙阳李然

1 引言

高速实时数字信号处理对系统性能要求很高，因此，几乎所有的通用dsp都难以实现这一要求。可编程逻辑器件允许设计人员利用并行处理技术实现高速信号处理算法，并且只需单个器件就能实现期望的性能。在数据通信这样的应用中，常常需要进行高速、大规模的fft及其逆变换ifft运算。当通用的dsp无法达到速度要求时，唯一的选择是增加处理器的数目，或采用定制门阵列产品。现在，随着微电子技术的发展，采用现场可编程门阵列（fpga）进行数字信号处理发展迅速。采用现场可编程器件不仅加速了产品上市时间，还可满足现在和下一代便携式设计所需要的成本、性能、尺寸等方面的要求，并提供系统级支持。本文研究了基于fpga的fft及其逆变换ifft处理器的硬件电路实现方法。在系统时钟频率为100mhz时，1024点复位fft的计算时间只需要10μs左右。

2 基4 fft/ifft算法

序列x(n),n=0,...,n-1的离散傅里叶变换为：

这说明ifft可以由fft求出。因此，fft和ifft处理器可以用统一的硬件结构来实现。

对于fft，设序列x(n)的长度为n=4p(p为整数)，则基4频率抽取蝶菜运算单元方程为：

3 fft/ifft的硬件实现

我们采用xilinx公司的virtex-ii系列fpga来实现fft/ifft处理器。

3.1 蝶形运算单元结构

基4频率抽取fft计算一共包括了log4(n)级运算，其中，在每一级中包含了n/4个基4蝶形运算，蝶形运算器如图1所示。

virtex-ii系列fpga有内嵌18bit×18bit补码乘法器以及大容量用户可配置ram，非常适合做大规模算术运算。图1所示的蝶形运算器可以在一个时钟周期内完成一次基4蝶形运算。其中，操作数a、b、c、d存放在ram中，三个18位放置因子w1、w2、w3存放在rom中。由于运算结果可能会超过原数据，所以要进行量化移位[1][2]。

3.2 并行运算结构

通用dsp的蝶算单元通常是从内存中顺序读入四个操作数a、b、c、d，因而计算速度受到了很大限制。而使用fpga可充分利用并行计算技术在一个时钟周期内并行读取四个操作数，以便完成一次基4蝶形运算。我们采用四对ram×2（分别存放实部和虚部）来存储蝶算中的操作数a、b、c、d。如图2所示，处理器在每个时钟周期从ram中读出数据a、b、c、d送入蝶形运算器（图1）。运算结果ao、bo、co、do在下一个时钟周期写回原地址。

图2中的四对ram×2的地址a0，a1，a2，a3分别对应公式（3）中的n,n+4p-s-1,n+2×4p-s-1,n+3×4p-s-1。a0，a1，a2，a3可以按下述方法产生：
设a,b为两个递减计数器，它们组成一个大的计数器counter=a×4p-1+b。如图3所示。

rotaten(x,m)表示把x(n位二进制)循环左移m位。则图2中四个操作数地址为：

式（4）中每个地址对应一个ram×2的入口地址。设操作数地址a的四进制表达式为a=（kp-1...k1k0）4。定义mk为a的所有四进制位数和除以4的余数

式（5）中，mod为求余运算。

可以证明地址a0，a1，a2，a3的mk值互不相同，取值范围是0，1，2，3。因此我们采取如图2所示的并行存储结构：所有mk=0的操作数都存放在rama中，mk=1的操作数都存放在ram b中，mk=2的操作数都存放在ram c中，mk=3的操作数都存放在ram d中。通过以上地址映射，我们可以在一个时钟周期并行读取四个操作数地址，完成蝶形运算。

3.3 放置因子的生成

为了加快fft/ifft运算速度，我们采用查表的方式来得到放置因子w1，w2，w3（图1），我们采用3对rom×2（实部和虚部）来存放复数w1，w2，w3，三个rom的入口地址都为c。可以证明，把图3中的计数器b的低2(p-a-1)位都置为0所得到的值即为c的值。即：

3.4 fft/ifft芯片整体结构

fft/ifft芯片整体结构如图4所示。在式（2）中讨论过，我们可以用fft来计算ifft，只需要先求出输入序列的共轭x*(k)，然后进行正常的蝶形运算，在输出时再进行一次求共轭运算。所谓复位的共轭是对它的虚部取反，实部不变。因此，我们可以把处理器动态地配置成fft或其逆变换ifft。为了充分利用i/o带宽、连续地进行fft/ifft。为了充分利用i/o带宽、连续地进行fft/ifft。我们采用了乒乓缓冲存储结构，如图4所示。由于fft/ifft计算采用的是同址计算，每次蝶形运算结果要写回原地址中，所以，ram x和ram y有输入和工作两种模式。这里，我们把ram x和ram y配置成乒乓结构，当ram x处于工作模式时，ram y处于输入状态。当一次64/256/1024点fft/ifft完成后，ram x和ram y将自动切换到另一个状态。这样，输入序列就可以连续地输入到fft/ifft处理器中进行变换，以达到实时处理的要求。输出结果存放在ram z中，可以由用户读出。

4 测试结果

这个电路采用verilog h

基于fpga的fft/ifft处理器的实现

浙江大学仪器系数字技术与仪器研究所（杭州 310027）孙阳李然

rotaten(x,m)表示把x(n位二进制)循环左移m位。则图2中四个操作数地址为：

式（4）中每个地址对应一个ram×2的入口地址。设操作数地址a的四进制表达式为a=（kp-1...k1k0）4。定义mk为a的所有四进制位数和除以4的余数

上一篇：用FLEX10K器件设计的恒虚警电路

上一篇：利用FPGA IP平台实现基于8051微控制器的SoC

相关技术资料: 7-12PWM输入功率驱动器工作原理; 7-12隔离式 DC/DC 变换器和模块优势特征; 7-12解读集成4 个高效降压 DC/DC 变换器; 7-12数字隔离功能全集成 DC/DC 电源变换器简述; 7-12集成低噪声电流输入模数转换器 (ADC)应用详解; 7-12128 通道20 位电流数字转换器应用探究; 7-11最新12kW量产电源参考设计简述; 7-11第三代快速碳化硅MOSFET技术参数应用; 7-11800 V高压直流 (HVDC)全新架构电源系统; 7-11串行千兆位媒体独立接口（SGMII和RGMII）; 7-11Analog Devices ADIN3310应用详情; 7-11干簧传感器MK17系列应用详解

相关IC型号

基于FPGA的FFT/IFFT处理器的实现

热门点击

推荐技术资料