首页 | 新闻 | 军事 | 汽车 | 游戏 | 科技 | 旅游 | 经济 | 娱乐 | 教育 | 投资 | 文化 | 书画 | 公益 | 城市 | 社区 | 拍客 | 视频 | 好医生 | 海外购 |
因为在规格上它基于和8800系列相同的统一渲染架构,能智能调配显示资源,并最大化图形效能。除了统一渲染架构外,支持DirectX 10的特性也是8600系列备受期待的一大理由……
1、支持统一着色器架构
此前的显卡都采用象素着色器跟顶点着色器分离的架构,这种架构不允许GPU同时处理象素跟顶点着色。比如说显卡在进行顶点着色的时候象素着色器单元就变成闲置,浪费了资源而且还形成了不必要的性能瓶颈。特别是现在分离式架构的GPU PS资源都要远高于VS,在这种状况下瓶颈的负担无疑是雪上加霜。实际上这种情况我们在游戏里就经常碰到。而在采用了统一着色器架构的GPU以及运行于DX10的系统中,显卡可以同时对顶点、几何以及象素着色进行处理,而不必等待逐个分别进行。这也使得资源得以合理分配,保证整个架构高效运行。
而基于G80架构的GF8600GT同样采用了统一着色器架构。 虽然nVIDIA GeForce 8600GT相对于G80(G8800系列)而言简化了流处理器数量----只有32个,并降低了显存容量和位宽。但由shader单元的统一化仍使得任何通用计算程序在8600GTG上发挥它的所有计算资源,不存在我们7600GT的分离架构造成的着色器单元闲置问题。此外,统一架构的带来的执行单元和配套资源上的共享化也让之前分离架构上存在通用化计算问题迎刃而解。因此,游戏里像物理模拟、运动模拟以及其它原本不适合GPU计算的任务如今都可以交给GPU来做。GPU强大的性能使得那些原本在CPU中无法达成的任务,比如流体运动模拟,得以在游戏中实现。这使得拥有32个steaming processors的 8800GT仍足以满足目前主流游戏的应用,特别是在开启高负荷特效之后,性能表现更为抢眼。
当然, Geforce 8600系列的128bit位宽已经严重阻碍了核心效能的发挥,如果你更追求在高分辨率下的性能表现,那么你可以考虑采用256bit显存位宽的GF7900GS。当然,如果你用的仅是19英寸液晶显示器的话,那么Geforce 8600GT已经可以满足你的需要。
2、完美支持HDR+AA
HDR(High Dynamic Range,高动态光照渲染)能够将当前显卡的光照渲染效果发挥到了极致,而AA(全屏抗锯齿)则是为了追求高精密的图像质量。可以说两者并无直接关系,但是由于受架构的制约,NVIDIA的GF7600、7900显卡在大部分游戏无法同时支持FSAA和HDR!
而这个问题在支持DX10、售价仅为799元的GF8600GT得以轻松实现。由于DX10硬件支持RGBE,所以GF8600GT在处理HDR纹理时不再需要特别解码处理也能实现,从而可以轻松实现HDR+AA模式。而且GF8600GT还支持两种全新的HDR模式,一款是 R 11G 11B10 ,采用 11-Bit 红色和绿色、 10Bit 蓝色,另一款是采用 5Bit 共享加每种颜色以 9Bit 作尾数运算,以上两款HDR模式在HDR品质上和标准的FP16几乎没有差别,但却能有效减少资源损耗及显存带宽占用率,从而消除了以往HDR的瓶颈。
另一方面, 8600GT还支持更高精度的FP32 HDR(每通道32bit,即128bit HDR),随时为玩家提供更高质量的 HDR 效果做好准备。这些都是GF7600GT所不具备的功能
3、GF8600GT也继承了纯正的GPGPU血统,支持CUDA!
从R300到NV40,再到现在最新的G80,每一代旗舰GPU的晶体管都大大超过了同期的顶级CPU,也在挑战其同时代半导体工艺的极限。随着GPU性能的提升,近年来GPU用于通用计算(General Purpose GPU)及其相关方面的问题成为一个十分热门的话题。GPGPU指的是利用图形卡来进行一般意义上的计算,而不是单纯的绘制。以NV40为代表的可编程GPU发布后,GPGPU进入了一个高速发展的全新时代。相比固定的流水线,目前硬件的可编程顶点和片段单元不管是运算精度,支持的指令数还是寄存器个数都有了很大提高,更重要的是基于Shader Model 3.0版本顶点和片段着色器版本的硬件开始支持动态流控制的循环和分支还有子函数操作。比如,现在的片段着色程序最多允许同时访问16个独立的纹理,支持长度不受限制的指令数,寄存器个数也大大提高。而且提供了32位浮点精度的运算和存储格式,对于通用计算来说,这就很容易做出更为复杂的运算。尽管GPGPU前途一片光明,但挑战与机遇永远是并存的,目前GPGPU所面临的问题也非常的多。
首先是当前的图形硬件还存在很大的局限性。GPU毕竟是为了图形渲染而生,其通用性离真正的通用处理器还有很大一段距离。比如,在DX9硬件上,Vetxe Shader和Pixel Shader总共的指令数被制在1024(512+512)条指令,(片段着色器)Pixel Shader最多只能同时访问16个纹理,进行分支和循环操作的开销也比大。此外,片段着色程序虽然支持R16F的浮店类型数据格式,但缺乏其他类型的支持,限制了通用运算的多样性,而且R16F这种单精度的IEEE格式对于通常所用的工程计算而言精度还是低了点。由于每个shader程序最多带32个Temp寄存器,指令数也受到限制,所以在很多通用计算程序的编写中不得不采用multi-pass来完成一些复杂的运算,这样就降低了性能。由于整个GPU只能通过顶点纹理来读取数据,通过渲染到纹理来写入数据,对于显存没有任何间接写指令,输出地址只能由光栅化引擎决定,不能由程序改变,无法进行任意的读写操作,因此必须将计算的中间结果保存以避免多次读写,这又无形中降低了GPU的通用运算性能。另外在硬件上如果采用浮点运算,则不能利用硬件本身的颜色混合操作,也不能进行mipmap的自动运算,这些也妨碍了GPU在通用计算上的应用。不过,支持DX10的G80的出现,将让这些问题迎刃而解。
基于当前的G80架构,NVIDIA现在已经有了一个针对GPGPU的解决方案,被称作Compute Unified Device Architecture(简称CUDA),而GF8600也继续成了这一特性!CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用G80的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out特性。以上几点都将大大提高GPGPU应用的效率。例如,在游戏中我们可以使用CUDA来让GPU承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用CUDA的计算可以在现有的空间里为平台提供更强大的计算性能。
除了以上几点外,G8600GT还采用了全新的PureVideo技术,相比G8800系列采用的第一代PureVideo HD技术而言,GF8600核心中集成了最新的Video Processor,并且加入了BitStream Processor Engine(二进制空间分割引擎)模块。
它的功能是实现包括MPEG-2、VC-1、H.264编码视频的IDCT、MoComp和Deblocking功能。注意,它也是高清视频播放的重要部分,而且MPEG-2、VC-1的加速还需要它来实现。从理论上推断Geforce 8600/8500显卡进行VC-1编码视频的播放时,其加速效果也应该好于以往的Geforce 7系列显卡。需要说明的是,BSP引擎部分专门针对H.264视频,主要为繁重的CABAC/CAVLC解码(CABAC/CAVLC reverse entropy decoding)服务,可以独立完成目前对系统要求最高的H.264解码输出全过程,大大降低CPU资源使用。这样,你如果选择一款GF8600显卡,哪怕以往已经显得有些老态的处理器、内存都没有升级,也可以流畅播放高编码率、高分辨率的H.264高清视频。
首页 上页 | 1 | 2 | 3 | 4 | 下页 尾页 共 4 页 |