算法实现系统设计方案
发布时间:2008/10/13 0:00:00 访问次数:505
由前面所述可知,sobel的滤波函数为
h=(q0+2q3+q6)-(q2+2q5+q8);v=(q0+2q1+q2)—(q6+2q7+q8)
dr=(q1+2q0+q3)-(q5+2qs+q7);dl=(q1+2q2+q5)—(q3+2q6+q7)
magnitude=max(h,v, dr,dl)
为了减少设计的复杂度,上面式子中的乘法运算可以改写成加法运算:
h=(q0+q3+q3+q6)-(q2+q5十q5+q8);v=(q0+q1+q1+q2)_(q6+q7+q7+q8)
dr=(q1+q0+q0+q3)_(q5+q8+q8+q7);dl=(q1+q2+q2+q5)-(q3+q6+q6+q7)
对于以上数据的处理,我们先估算分别使用单片机、dsp、cpld/fpga所需的时间。
如果使用12 mb的单片机,加法运算需要执行2次,加法的中间结果寄存20次,大小比较三次,比较中间结果寄存2次,51单片机内的加法需要两个指令周期,比较需要两个指令周期。这样,完成一次sobel滤波操作需要的时间至少为:(24×2+20+2×3+2)×1 us=72us°对于一幅600×800像素的图像,总共的时间为:600×800×72us=32s。
若使用40 mb六级流水的dsp,它们的处理时间大概为:32s/24=1.4s。
如果使用cpld/fpga设计,首先,h、v、dr、dl四个方向的滤波可以全部并行,同时,每一个方向的滤波函数可以采用一级四路并行加法器与一级双路并行加法器串连。这样一来,算上两级串行比较器,实际上整个系统只有四级串行结构,假设使用50 m的系统时钟,则处理完一个像素点的时间为4×1/(50 m)=80 ns,处理完一帧图像的时间为800×600×80 ns=38.4 ms,结果处理速度比dsp高了大约两个数量级。
从上可以看出,使用cpld`fpga设计有关图像处理模块,对整个系统速度的改善是非常明显的。
欢迎转载,信息来源维库电子市场网(www.dzsc.com)
由前面所述可知,sobel的滤波函数为
h=(q0+2q3+q6)-(q2+2q5+q8);v=(q0+2q1+q2)—(q6+2q7+q8)
dr=(q1+2q0+q3)-(q5+2qs+q7);dl=(q1+2q2+q5)—(q3+2q6+q7)
magnitude=max(h,v, dr,dl)
为了减少设计的复杂度,上面式子中的乘法运算可以改写成加法运算:
h=(q0+q3+q3+q6)-(q2+q5十q5+q8);v=(q0+q1+q1+q2)_(q6+q7+q7+q8)
dr=(q1+q0+q0+q3)_(q5+q8+q8+q7);dl=(q1+q2+q2+q5)-(q3+q6+q6+q7)
对于以上数据的处理,我们先估算分别使用单片机、dsp、cpld/fpga所需的时间。
如果使用12 mb的单片机,加法运算需要执行2次,加法的中间结果寄存20次,大小比较三次,比较中间结果寄存2次,51单片机内的加法需要两个指令周期,比较需要两个指令周期。这样,完成一次sobel滤波操作需要的时间至少为:(24×2+20+2×3+2)×1 us=72us°对于一幅600×800像素的图像,总共的时间为:600×800×72us=32s。
若使用40 mb六级流水的dsp,它们的处理时间大概为:32s/24=1.4s。
如果使用cpld/fpga设计,首先,h、v、dr、dl四个方向的滤波可以全部并行,同时,每一个方向的滤波函数可以采用一级四路并行加法器与一级双路并行加法器串连。这样一来,算上两级串行比较器,实际上整个系统只有四级串行结构,假设使用50 m的系统时钟,则处理完一个像素点的时间为4×1/(50 m)=80 ns,处理完一帧图像的时间为800×600×80 ns=38.4 ms,结果处理速度比dsp高了大约两个数量级。
从上可以看出,使用cpld`fpga设计有关图像处理模块,对整个系统速度的改善是非常明显的。
欢迎转载,信息来源维库电子市场网(www.dzsc.com)
上一篇:EDA典型单元电路的存储器的设计
上一篇:算法系统设计方案