DSP能够在16nm或28nm器件上处理尽可能多的MAC运算
发布时间:2023/2/19 14:55:28 访问次数:374
使用DSP硬件资源可实现乘法和累加(MAC)占用硬件资源较少。经优化后,DSP能够在16nm或28nm器件上处理尽可能多的MAC运算。
以16nm为例,赛灵思可编程器件中UltraScale™架构的DSP48E2片就属于专用片。DSP48E2片由一个 27x18二进制补码乘法器和一个48位累加器构成。MAC能使用赛灵思DSP片完成。
在低精度MAC运算中,相乘方式是a*b。其中a是4位无符号激活参数数据,b是4位有符号权重参数数据。DSP48E2片可被配置成4通道乘法运算。
制造商:Power Integrations 产品种类:隔离式DC/DC转换器 输出端数量:1 Output 输出功率:35 W 输入电压(标称值):48 V 输入电压(最小值):16 V 输入电压(最大值):75 V 输出电压—通道1:16 V 输出电流—通道1:3 mA 安装风格:Through Hole 封装 / 箱体:PDIP-8 产品:Isolated 输入电压:16 V to 75 V 封装:Tube 商标:Power Integrations 产品类型:Isolated DC-DC Converters 工厂包装数量50 子类别:DC-DC Converter 单位重量:2.268 g
LPDDR和DDR之间的关系很密切,LPDDR是在DDR基础上演化而来的,比如,LPDDR2是在DDR2基础上演化而来的,依次类推。但从第四代开始,二者开始走上不同的发展道路,DDR仍然通过提高核心频率来提升性能;而LPDDR为了获得更低的功耗,选择提高Prefetch预读取位数来提升性能。
LPDDR4是用两个16位通道组成32位总线,而DDR4却具备原生64位通道;LPDDR4的Prefetch预读取位数为16bit,而DDR4为8bit;这在实际运算过程中,DDR4的性能利用率会更高,但LPDDR却可以用更低的功耗来获取更高的理论性能。
深圳市金思得科技有限公司 http://jinside.51dzw.com/
使用DSP硬件资源可实现乘法和累加(MAC)占用硬件资源较少。经优化后,DSP能够在16nm或28nm器件上处理尽可能多的MAC运算。
以16nm为例,赛灵思可编程器件中UltraScale™架构的DSP48E2片就属于专用片。DSP48E2片由一个 27x18二进制补码乘法器和一个48位累加器构成。MAC能使用赛灵思DSP片完成。
在低精度MAC运算中,相乘方式是a*b。其中a是4位无符号激活参数数据,b是4位有符号权重参数数据。DSP48E2片可被配置成4通道乘法运算。
制造商:Power Integrations 产品种类:隔离式DC/DC转换器 输出端数量:1 Output 输出功率:35 W 输入电压(标称值):48 V 输入电压(最小值):16 V 输入电压(最大值):75 V 输出电压—通道1:16 V 输出电流—通道1:3 mA 安装风格:Through Hole 封装 / 箱体:PDIP-8 产品:Isolated 输入电压:16 V to 75 V 封装:Tube 商标:Power Integrations 产品类型:Isolated DC-DC Converters 工厂包装数量50 子类别:DC-DC Converter 单位重量:2.268 g
LPDDR和DDR之间的关系很密切,LPDDR是在DDR基础上演化而来的,比如,LPDDR2是在DDR2基础上演化而来的,依次类推。但从第四代开始,二者开始走上不同的发展道路,DDR仍然通过提高核心频率来提升性能;而LPDDR为了获得更低的功耗,选择提高Prefetch预读取位数来提升性能。
LPDDR4是用两个16位通道组成32位总线,而DDR4却具备原生64位通道;LPDDR4的Prefetch预读取位数为16bit,而DDR4为8bit;这在实际运算过程中,DDR4的性能利用率会更高,但LPDDR却可以用更低的功耗来获取更高的理论性能。
深圳市金思得科技有限公司 http://jinside.51dzw.com/