史前最强的GPU?!NVIDIA G80显卡技术特性分析(2)
中华网科技 http://tech.china.com
2006-10-31 09:32:28
|
|
|
2、统一着色架构现身,取代传统的管线架构?
“管线”这一概念不知道是什么时候开始深入人心的,讨论管线概念的最激烈应该是在GeForce 6 系列和Radeon X800系列的时候,人们逐渐形成了一种观念,这就是管线数越高,性能越好。现在这个时候,人们争论的焦点也完全集中在了G80身上。从目前泄密出为的G80规格来看,作为第一款支持DX10的GPU,G80可能抛弃了传统的管线架构、而引入了最新的统一着色渲染架构。
我们都知道,DX10最大特色之一就是引入了统一渲染方式。所谓统一渲染架构,最容易的理解方式就是Shader单元不再分离,显示核心不再为Shader类型不同而配置不同类型的Shader单元,对于主流的显示核心,Pixel Shader单元以及vertex Shader单元的概念都应该已经非常熟悉了,而在统一渲染架构中这两种Shader单元将不再分离,转而所有的Shader单元都可以为需要处理的数据进行处理,不管和是Pixel Shader数据还是Vertex Shader数据。而调配哪几组Shader单元负责处理什么数据或者进行什么样子类型的计算,则由一个被称为small sets of instructions(SSI)的部分来控制。这样在硬件上,设计者就无需为不同的着色引擎设计不同的执行单元,只要按照所对应的接口以及操作方式全部融为一体,仅设置一种独立的Shader执行单元。这意味着GPU厂家可以用更小的核心来实现现在需要用8000万甚至更多晶体管才能实现的功能!而统一渲染架构则可以帮我们解决硬件资源上的限制----你能够不受限制地使用纹理资源,并可以使用任意长度的着色指令,如果能够将闲置的像素单元用来处理顶点,那么游戏速度就不会如此可怜了!此外,统一渲染架构将令GPU的角色由单纯为Game Rendering提升至Game Computing的理念,统一着色引擎设计更适合异类运算工作,例如Physics运算、影像编码运算等,让显卡的应用范畴大幅提升。那么G80如何实现统一着色渲染呢?
针对这个问题,NVIDIA在G80显示芯片配备了“多功能差值单元(Multi-function Interpolators)”,用来实现像素属性差值计算与高阶数学计算功能的统一。在GPU中,每个像素着色单元中都会有一个差值计算单元,通过差值来计算每个像素的颜色、深度、纹理匹配等属性;与此同时,GPU还会利用函数求值单元处理平方根、对数、正弦、余弦等数学计算。不过,两个计算单元很少能同时发挥最大作用,从而导致能量和芯片面积的浪费。为此,NVIDIA将合而为一,把两个功能整合在同一计算单元中,不但可以同时处理像素属性计算和高阶数学计算,据称还能提高GPU的性能面积比和性能功耗比。对GPU来说,这种功能单元的共享已经变得越来越重要。GeForce 6/7都因为在像素着色单元中配备了算术逻辑单元(ALU)而获益匪浅,因为ALU可以同时扮演纹理寻址单元的角色,从而根据需要提高GPU的纹理性能或计算性能。(不过,从技术层面来看,G80这种作法属于一种低层次的多功能统一架构,仍离DX10标准有一定的距离,但这个统一渲染架构并不是DX10的硬性指标----因为微软并没有强求GPU必须使用同一渲染架构。因为那只是个硬件抽象层,硬件可以根据自己的方式处理像素、几何、顶点等数据,再交给DirectX 10进行最后的处理。)
不过,考虑到Vertex和Pxiel Shader在很多时候对系统的需求量是不同的,G80如何调配不同的Shader单元就是一个必须解决的问题。因此,当系统资源调配不协调时,往往会很大程度影响性的发挥。目前NVIDIA也没有透露任何消息。针对这么问题,我们猜测NVIDIA将会在G80引入一个资源协调单元,类似于Athlon 64 X2中的System Request Queue(系统请求队列)的功能。这个单元可以判定当前需要渲染场景的具体Vertex以及Pixel Shader的计算需求量,而根据这个需求量来分配Shader资源,使得所有Shader单元既可以处理Pixel Shader数据同时也可以处理Vertex Shader的数据。这样的资源合理利用率要高于普通的分离式Shader单元设计。
目前G80架构中所采用的统一管线数量仍是个未知数,但此前国外网站泄露出来数据来看G80中的顶级型号将拥有128个频率为1350MHz的统一渲染单元。这是一个什么样的概念?这意味着G80的Pixel shader性能将比G71高5倍,Vertex shader性能将比G71高32倍!因此推断来讲,G80总体性能将达到G71的6~8倍---仍要远高于当前GF7950 GX2 SLI的性能。其实G80并不是第一款采用统一渲染架构的GPU。ATI早在4年前就开始着手图形芯片统一渲染架构设计,比如ATI针对Xbox 360设计的Xenos图形芯片已经采用了统一着色架构。
需要说明的是,统一渲染架构听起来确是对于显卡渲染效能的提升大有裨益,但目前的情况是DX9C游戏依然占据绝对主流,以目前的技术来看,的确是PS/VS各自为政性能更好些,因为绝大多数游戏的建模并不需要太多顶点运算,即便提高分辨率开AA/AF/HDR都与VS没有直接关系,而且相对顶点渲染来说像素渲染将面临大规模使用纹理所带来的材质延迟。同时由于只有微软下一代操作系统Vista才能支持DirectX 10,而目前旧有的操作系统,如Windows XP等均无法升级至DirectX 10,所以推出G80的象征意义远比实际意义要大。另外,微软也表示,首批Vista仍然是DirectX 9,之后才会通过Windows Update让用户升级至DirectX 10。
但不管怎么样,G80仍是第一款支持DirectX 10 API统一渲染架构的台式GPU。
首页 上页 | 1 | 2 | 3 | 4 | 5... 下页 尾页 共 7 页
|