奇特的显存容量、显存位宽
在尽力GPU多次的改朝换代之后,许多人认为新一代DX10 GPU将会改用512bit显存控制器和搭配1GB以上的显存。可细想一下我们不难看出,512bit显存控制器就意味着光是信号线就需要在PCB上布出512条等长线路连接各片显存。这样显卡的制造成本将会相当惊人,而体积和发热量也会再度飙升--事实上ATI R600正是采用了512bit显存控制器设计,并且拥有超过G80的发热量功耗以及PCB长度!
但是在进入US时代之后,GPU对于显存带宽的支持也较以往更甚。为此NVIDIA选择了折衷的方案,即采用了384bit的显存控制器和和高速GDDR3 786MB显存,以在成本和性能上获得平衡。许多人会惊讶为什么G80不采用性能更强的GDDR4显存?这问题就出在GDDR4内存的惊人功耗上。初期的GDDR4内存发热量惊人,而且产能也并不充足。保守起见,NVIDIA最终还是选择了GDDR3显存。
NVIDIA GeForce 8800GTX拥有384bit显存位宽,搭配了共786MB、1.8GHz速度的GDDR3显存。至于NVIDIA GeForce 8800GTS就只拥有320bit显存位宽和640MB 1.6GHz速度的GDDR3显存。全系列的GeForce 8800显卡的GDDR3显存都有Samsung提供,GeForce 8800GTX采用的是的GDDR3显存芯片速度为-1ns。
比较可笑的是,在GeForce 8800图片刚刚出现的时候,许多人还认为这片显卡将会拥有eRAM(嵌入式内存)。更有人猜测GeForce 8800将会采用eRAM来连接被称作"第二核心"的NV10芯片。这样推断绝对是无稽之谈。要知道当今只有NEC保留了eRAM生产线,并且为Xbox360中的GPU生产eRAM。在通用桌面平台上,整合eRAM不仅会让成本几何级飙升,还会让驱动优化的难度相当大。何况NEC的产能也无法保证GeForce 8800惊人的需求量。由此可见eRAM只适用于易于优化的封闭环境,在通用桌面环境上加入eRAM只会白白增加成本而已。
GPU物理加速来临?
在G80的Tech Spec中NVIDIA赫然写上了被称作Quantum Effect技术的GPU物理加速方案。NVIDIA在文档中表示,通过这个技术,GPU就可以执行众多复杂的物理计算而不必CPU的参与,极大的提升游戏性能。
由G80的内部体系架构中我们不难看出,在采用统一渲染机构之后每个Stream Processor都可以处理较DX9时代复杂的指令。而没有把这些单元简单的称作Shader,恐怕也是基于这样的考虑。由于物理计算的海量并行性与GPU执行的图形操作大致相仿,所以在DX10 GPU时代,用GPU来执行物理运算将会更为容易和高效。
另一方面,在物理运算强调的浮点性能中G80也可以轻易的获得超过400Gflops的性能,要知道AGEIA的PPU的浮点性能也不过30GFlops。所以在驱动程序和游戏开发者的支持下, 要实现物理加速,并不是件困难的事情。
GeForce 8800功耗有多大?