位置:51电子网 » 技术资料 » D S P

GDDR3图形存储器将三维图形性能发挥到极限

发布时间:2007/8/28 0:00:00 访问次数:440

存储器带宽对快速提高台式机和笔记本电脑中PC图形系统的三维渲染性能起着关键的作用。过去5年来,高端图形系统中的存储器带宽每年增加30%。图形存储器系统的带宽至今已超过了PC主内存的带宽。为了满足这种突出的带宽要求,非常有必要为图形存储器定义专门的I/O标准。英飞凌技术公司在设计与制造高性能图形存储器方面已经有很悠久的历史了。2005年新的GDDR3标准在图形市场上有了突破性进展。


图形存储器的发展历史


最早的图形存储器与标准的通用DRAM有很大的区别。这些早期的图形存储器通过专门的功能支持三维渲染和显示处理。经过不断发展,图形存储器逐步转向通用的标准DRAM。逻辑处理功能最终全部转移到GPU内进行处理,图形存储器则专注于其作为DRAM的核心功能。因此,对这种图形存储器的带宽需求急剧增长。


到90年代晚期,通用的标准DRAM不再能够满足图形处理器必需的带宽要求。存储器成为系统的瓶颈,此时诞生了x32 GDDR存储器。英飞凌是首家推出双倍数据速率图形RAM的公司。英飞凌的32Mb DDR SGRAM是当时全球速度最快的图形存储器。2001年,该公司推出了后续设计——128Mb(4Mx32)图形DDR。


英飞凌公司推出的128Mb GDDR是业界首款采用BGA封装的图形存储器。与TSOP或TQFP封装相比,BGA封装有两大内在优势。首先是尺寸上的优势。与以前使用的TQFP封装相比,新的BGA封装在图形卡上只需要一半的空间,因此应用于笔记本图形系统中时很理想并且非常成功。BGA封装的第二大优势是能够显著减小所有信号与地址线上的电气寄生效应。电气寄生效应的降低是提高数据速率的必要条件。


随着128Mb GDDR的推出,GDDR标准也宣告结束,因为GDDR标准无法满足日益提高的带宽要求。图形工业需要一个更加先进、为更高数据速率优化的新标准。GDDR2与新标准无缘,也从来没有大批量生产过。GDDR3是代替GDDR的标准。2004年英飞凌成功地向市场推出了256Mb的GDDR3产品,随后在2005年又推出了采用最小的FBGA封装的512Mb GDDR3,时钟频率最高达800MHz。


GDDR3图形存储器标准


GDDR3标准借鉴了通用的DDR2的很多特性,并经过进一步优化获得更高的数据速率和更低的功耗。


与GDDR相比,GDDR3的主要创新表现为:工作电压从2.5V下降到1.8V;片内信号端接取代了GDDR中未端接的信号线;动态控制阻抗的输出驱动器;4位预取和单向单端数据选通。所有这些特性的综合效果就是更高的数据速率、更好的信号完整性和更低的功耗。由于这些变化,GDDR3存储器可以获得比GDDR和DDR2标准高得多的数据速率。



表1:GDDR、GDDR3和DDR2标准的比较


片内信号端接:随着传输频率的上升,信号线必须用电阻端接,以防止反射信号干扰正常信号而影响信号质量。GDDR端接是通过外部电阻实现的,该电阻焊接在靠近存储器的PCB上。外部端接可以略微扩展GDDR的频率范围,但该类端接方案不能满足提升到高达800MHz甚至更高频率范围的GDDR3所需的信号完整性。因此GDDR3使用片内信号端接,其端接电阻集成在存储器芯片内部。


支持可靠高速的点到点传输的另外一个重要功能特性是具有自适应阻抗的Vddq端接。GDDR3的I/O接口是一个总线两端都被端接的伪开漏逻辑电路:一端是40欧姆阻抗的动态控制驱动器,另外一端是具有60欧姆信号线端接的接收器。


三维图形渲染系统中的基本功能和任务分配


在交互式三维游戏中图形的计算可以分成几个按顺序执行的基本步骤。在第一个步骤中,根据游戏者给出的指令结果计算生成三维场景。三维场景代表虚拟三维世界中所有物体的排列和位置信息。这部分计算是由PC中的CPU完成的。然后CPU将三维场景传递给GPU。GPU的任务是将三维场景转换成显示器可以显示的二维图像。GPU执行的这个任务被称为三维渲染。


在产生实际图像时必须考虑很多效果,如颜色、纹理、多个扩展光源、阴影、反射、透明、光线吸收、不透明材料等等。要实现所有这些效果就要求强大的计算能力以及特别快速和很宽的存储器接口,以便能在最短的等待时间内完成对存储器的随机访问。存储器带宽和容量的主要驱动因素是必须被存储并快速可用的参数数量以及高度重复计算的中间结果的存储。不要忘记所有这些计算必须实时完成,每秒计算能力必须超过40帧。


集成与独立的图形设备


一般来说,图形系统可以分成两大类,即集成图形系统和独立图形系统。在集成图形系统中,图形处理单元嵌入在位于笔记本和台式机主板上的PC芯片组内。对于纹理存储和缓存,这些集成系统使用PC的主内存。这一做法从两方面限制了三维图形渲染性能。首先,最大存储器带宽受限于标准主内存带宽,其次,图形系统必须与CPU以及PC机上同时访问内存的其它客户程序共享这个带宽。从“汤姆的硬件指南”执行的基准测试可以清楚地

存储器带宽对快速提高台式机和笔记本电脑中PC图形系统的三维渲染性能起着关键的作用。过去5年来,高端图形系统中的存储器带宽每年增加30%。图形存储器系统的带宽至今已超过了PC主内存的带宽。为了满足这种突出的带宽要求,非常有必要为图形存储器定义专门的I/O标准。英飞凌技术公司在设计与制造高性能图形存储器方面已经有很悠久的历史了。2005年新的GDDR3标准在图形市场上有了突破性进展。


图形存储器的发展历史


最早的图形存储器与标准的通用DRAM有很大的区别。这些早期的图形存储器通过专门的功能支持三维渲染和显示处理。经过不断发展,图形存储器逐步转向通用的标准DRAM。逻辑处理功能最终全部转移到GPU内进行处理,图形存储器则专注于其作为DRAM的核心功能。因此,对这种图形存储器的带宽需求急剧增长。


到90年代晚期,通用的标准DRAM不再能够满足图形处理器必需的带宽要求。存储器成为系统的瓶颈,此时诞生了x32 GDDR存储器。英飞凌是首家推出双倍数据速率图形RAM的公司。英飞凌的32Mb DDR SGRAM是当时全球速度最快的图形存储器。2001年,该公司推出了后续设计——128Mb(4Mx32)图形DDR。


英飞凌公司推出的128Mb GDDR是业界首款采用BGA封装的图形存储器。与TSOP或TQFP封装相比,BGA封装有两大内在优势。首先是尺寸上的优势。与以前使用的TQFP封装相比,新的BGA封装在图形卡上只需要一半的空间,因此应用于笔记本图形系统中时很理想并且非常成功。BGA封装的第二大优势是能够显著减小所有信号与地址线上的电气寄生效应。电气寄生效应的降低是提高数据速率的必要条件。


随着128Mb GDDR的推出,GDDR标准也宣告结束,因为GDDR标准无法满足日益提高的带宽要求。图形工业需要一个更加先进、为更高数据速率优化的新标准。GDDR2与新标准无缘,也从来没有大批量生产过。GDDR3是代替GDDR的标准。2004年英飞凌成功地向市场推出了256Mb的GDDR3产品,随后在2005年又推出了采用最小的FBGA封装的512Mb GDDR3,时钟频率最高达800MHz。


GDDR3图形存储器标准


GDDR3标准借鉴了通用的DDR2的很多特性,并经过进一步优化获得更高的数据速率和更低的功耗。


与GDDR相比,GDDR3的主要创新表现为:工作电压从2.5V下降到1.8V;片内信号端接取代了GDDR中未端接的信号线;动态控制阻抗的输出驱动器;4位预取和单向单端数据选通。所有这些特性的综合效果就是更高的数据速率、更好的信号完整性和更低的功耗。由于这些变化,GDDR3存储器可以获得比GDDR和DDR2标准高得多的数据速率。



表1:GDDR、GDDR3和DDR2标准的比较


片内信号端接:随着传输频率的上升,信号线必须用电阻端接,以防止反射信号干扰正常信号而影响信号质量。GDDR端接是通过外部电阻实现的,该电阻焊接在靠近存储器的PCB上。外部端接可以略微扩展GDDR的频率范围,但该类端接方案不能满足提升到高达800MHz甚至更高频率范围的GDDR3所需的信号完整性。因此GDDR3使用片内信号端接,其端接电阻集成在存储器芯片内部。


支持可靠高速的点到点传输的另外一个重要功能特性是具有自适应阻抗的Vddq端接。GDDR3的I/O接口是一个总线两端都被端接的伪开漏逻辑电路:一端是40欧姆阻抗的动态控制驱动器,另外一端是具有60欧姆信号线端接的接收器。


三维图形渲染系统中的基本功能和任务分配


在交互式三维游戏中图形的计算可以分成几个按顺序执行的基本步骤。在第一个步骤中,根据游戏者给出的指令结果计算生成三维场景。三维场景代表虚拟三维世界中所有物体的排列和位置信息。这部分计算是由PC中的CPU完成的。然后CPU将三维场景传递给GPU。GPU的任务是将三维场景转换成显示器可以显示的二维图像。GPU执行的这个任务被称为三维渲染。


在产生实际图像时必须考虑很多效果,如颜色、纹理、多个扩展光源、阴影、反射、透明、光线吸收、不透明材料等等。要实现所有这些效果就要求强大的计算能力以及特别快速和很宽的存储器接口,以便能在最短的等待时间内完成对存储器的随机访问。存储器带宽和容量的主要驱动因素是必须被存储并快速可用的参数数量以及高度重复计算的中间结果的存储。不要忘记所有这些计算必须实时完成,每秒计算能力必须超过40帧。


集成与独立的图形设备


一般来说,图形系统可以分成两大类,即集成图形系统和独立图形系统。在集成图形系统中,图形处理单元嵌入在位于笔记本和台式机主板上的PC芯片组内。对于纹理存储和缓存,这些集成系统使用PC的主内存。这一做法从两方面限制了三维图形渲染性能。首先,最大存储器带宽受限于标准主内存带宽,其次,图形系统必须与CPU以及PC机上同时访问内存的其它客户程序共享这个带宽。从“汤姆的硬件指南”执行的基准测试可以清楚地

相关IC型号

热门点击

 

推荐技术资料

业余条件下PCM2702
    PGM2702采用SSOP28封装,引脚小而密,EP3... [详细]
版权所有:51dzw.COM
深圳服务热线:13751165337  13692101218
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式


 复制成功!