|
3dfx Voodoo5 5500显卡性能完全评述 (1)
2000-09-07 14:49:51
采用VSA-100芯片组的3dfx显卡可真称得上"马拉松式"计划了。早在1999年秋天,就已屡次听闻该公司即将推出的倍受褒奖的新产品计划,的确让人高兴了一阵子,人们为梦想中的这位动力强劲的,32位的芯片巨人把香槟都准备好了。
神圣的一天终于到来了:我们终于看到了可爱的3dfx宝贝儿(见下图所示)
3dfx新品采用了一种称为"VooDoo可伸缩结构"(VooDoo Scalable Architecture)的新技术。从3dfx VSA-100芯片组沿用过来的缩写"VSA"被用作新的芯片名字。这项技术主要提供了多芯片解决方案,甚至可支持高达32块芯片。大多数人可能还记得在3dfx Voodoo2显卡中使用的SLI技术,那时是两块图形加速器并行工作。实际上,VSA原理也差不多,只不过更灵活更强劲了些。如果仅靠增加图形处理器数目就来提高它的性能的话,确实也增加得差不多了。你可能会觉得这样做得效率问题有待商榷,或者提出另一种构架来,但多芯片方案的确拥有很重要的优势,我们将在稍后的评述中讨论这一点。
首先,我们来简单讨论一下VSA技术的一些基本原则。在"SLI"技术中,每个芯片组处理图象的一部分,3dfx在发布VSA之前就早早地公布其T-Buffer技术也并不是毫无用处的。因为这样,显卡就既能在T缓冲模式或在SLI模式下基于VSA-100芯片工作。让我们先对SLI看个究竟:
在Voodoo2时代SLI采用如下结构:两个图形处理器对同一帧页面的不同线条进行处理,形成最终图象。并且两块芯片使用了同一帧缓冲。就绪帧从帧缓冲中取出,在显示器上显示。VSA架构支持新的SLI技术实现,它突破了旧的SLI技术仅有两块芯片并行处理的限制,--而且老的技术能支持的最高分辨率仅为1024x768(现在可达到1600x1200)。并且,此新技术基于一种全新的思想方式。因为现今的图形加速器都采用AGP接口,据3dfx初衷,VSA-100芯片组专为AGP进行了优化,目前的SLI模式计划在原有的印制电路板接口上采用多芯片协议来实现(多芯片工作)。采用VSA-100芯片组,这种技术的最新版本已能支持高达32块图形加速器并行工作。现在,每块工作于SLI模式的芯片对形成页帧的某部分条纹的线条进行描述,其"继任者"亦类似于此,线条数目则可为1至128线。而且,线条数目可以动态调整。我的意思是说,芯片组连续地产生线条,线条再形成纹理,纹理再形成最终页帧。他们为何采用线数可变的纹理呢?事实上,这样才为SLI在颜色深度,多边形数量等方面实现场景最优化提供了可能。
值得一提的是,SLI模式下VSA-100芯片组的每一块芯片均使用自己的帧缓冲,以描述线条或纹理。然后,所有来自这些缓冲区的数据被提交到通用帧缓冲中,在那里产生完整页帧,再传送到显示器。而且,每块VSA-100芯片都有它自己的内存总线和内部帧缓冲,能支持最高64MB的内部显存。可用显存的一部分被用于帧缓冲(一般预留两到三倍帧缓冲量),剩下的用于存储材质(textures)数据和Z缓冲(Z-Buffering)数据。以防可用存储量不够,3dfx建议选择采用一下两种普遍支持的材质压缩方法:DXTC或FXT1。图象处理器的运作设计有助于避免存储总线的过载。顺便说一句,这种解决方案--即在SLI模式下的图象处理器之间均匀分配数据流--使总的存储器带宽显著地增加了。
但VSA-100芯片组也能工作于另一模式:T缓冲模式(T-Buffer)。我们在此不作详细讨论。我只是想说,每一VSA-100芯片在显存中划出了缓冲区,用于存储其描述内容。这意味着各芯片组在整个图象范围,而不是局部范围内其他处理器(芯片)并行工作。这与ATI RAGE MAXX较为类似,不过这里每个芯片组是工作于新的页帧。
事实上T缓冲技术改善的是最终的图象质量。MAXX 技术旨在提高显卡性能,因为每一芯片组工作于不同的图象,而T缓冲技术中是工作于同一幅图象或图象的同一部分的,后者能使图象质量显著提高。当然,它也会导致某些性能下降,但决定权还是在用户手中:选择快的速度(SLI模式),还是高的质量(T缓冲模式)。另外,T缓冲允许在性能下降与图象质量增加之间达成较为灵活的妥协。
T缓冲技术的主要功能在于其独特的"全景去齿化"(Full-Scene Anti-Aliasing)功能,它由驱动程序实现,无须游戏支持。去齿化效果( AA )在众多的评论有过描述。它能平滑物体边缘,消除直线边缘上较为显眼的阶梯现象。事实上,3D场景描述中的这些缺点影响了我们对场景整体的"自然感"。换句话说, 3dfx 采用了一种与Nvidia的"超级采样"(supersampling)不同的FSAA方法。你可以在一篇名为Beyond3D的文章里对AA(去齿化)技术有更多的了解。
FSAA的显卡实现基于一套VSA-100芯片组,并默认分为"主芯片"和"从芯片"。主芯片的缓存有一特定区域用于存储一幅指定分辨率的图象。这正是AA最具效果之处。Voodoo5展示的AA有两种类型:2x和4x(2速和4速)。2x方式下,图象的每个象素被分成两个子像素(左子像素和右子像素),每一VSA-100图象处理器基于左右子像素对景象进行描述,例如特定偏移量等。每个芯片组在它自己的缓存中处理,然后将所有的数据转移到主芯片,它用一种称为"alpha混合"(alpha-blending)的技术将已处理图象数据形成最终图象,并存储在特定的缓存区域内。由此,我们便得到了需要的"去齿化"(anti-aliasing)效果。
4x的AA技术对芯片数目为四的倍数的显卡更为合适。当然它也能应用于双芯片的显卡。这种方式下,每个象素被分成四个子像素,其实显示的是四幅存在某个偏移量的图象。当然,在双芯片的情况下,每个芯片组将负责两幅合在一起的图象,而不是一幅,这一点在性能上显露无疑。
NVIDIA和3dfx最显著的差别在于描述的实现方法上。通常"超级采样"技术为2x2掩模看成由四个子像素组成(水平方向两个,垂直方向两个),是其最高分辨率的两倍(附图01(a))。
第二种方案,即采用T缓冲的AA(去齿化技术),每个象素被相对于中心像素切分,这意味着子像素矩阵能旋转一定的角度(附图01(b))。显然,这种方法能提供更高的FSAA质量。
前面我们刚讨论过的颇为独特的T缓冲"去齿化"技术,和通常的"超级采样"技术一 样,也对资源有所浪费。在后面的测试中,我们看出它对显卡性能的影响。
在结束T缓冲技术介绍之前,我想指出一点,它也包括了其他一些动人功能,能保证大部分丰富的图象感觉。诸如运动模糊,散焦等影象效果。与其他效果不同--现今大多数游戏不支持AA(去齿化),但由于它并不依赖游戏对T缓冲的支持,所以仍然获得了广泛的应用。
好,现在让我们回到VSA-100芯片组上来。下面是它的一些主要的特征:
VSA-100主要特征:
1.完全集成的128位的2D/3D/图形加速器 2.包含1400万只晶体管, 采用0.25微米,6层板芯片生产技术 3.166MHz的图象核心工作频率 4.两条各带一材质块的描述管道 5.填充速率(Fillrate):3330万象素每秒(包括多材质填充(multitexturing)) 6.350MHz集成RAMDAC(RAM数模转换器) 7.32位渲染 8.24位Z & W缓冲器 9.8位模板缓冲器 10.32位,2048x2048材质 11.128bit内存接口 12.一块VSA-100芯片,最高支持64MB内部图形SDRAM/SGRAM 13.支持带SBA和DME的PCI 2.2和AGP2x/4x规范 14.支持最高分辨率2048x1536 @ 85Hz(3D下为1600x1200) 15.3D 加速性能 支持Voodoo3系列的所有典型功能:
1.单传输,单周期多材质处理(multitexturing) 2.单传输,单周期堆映射 3.单传输,单周期三向线性过滤(tri-linear filtering) 4.单象素mip映射和alpha混合 5.8位palletized材质支持(保证高的的游戏兼容性,且不影响总的的性能) 6.表象和象素雾化 7.三角块和扇形处理(在毗连三角块的情况下,无须传输每个三角形三条边的信息,只有用到新顶点的一组三角形才会每个三角形都定义数据。这降低了对存储总线带宽要求。)
动态的环境材质处理,并支持DX6,DX7和OpenGL 1.2 DXTC和FXT1材质压缩规范中,关于材质色彩混合的所有规范。
看到这里,大家应该可以注意到,此芯片组有很多地方类似NVIDIA Riva TNT2 Ultra。主要的差别在于更高的工作频率和很多绝对全新的功能。看起来好象3dfx没能采用0.18微米芯片生产技术(至少0来个0.22微米吧),而且似乎应该多提供一对材质处理块(要是"自由式"多材质处理就好了)。但是,你千万不要被VSA-100的相对"谦虚"搞糊涂了。主要是因为这些图形处理器能够而且应该在多芯片显卡上工作。在1999秋天3dfx公司已经公布了这一新的显卡系列,其中包括:
Voodoo4 4500 PCI/AGP : 1.1块VSA-100芯片 2.32MB RAM 3.填充速率:3330万象素每秒(多材质处理模式下为1670万象素每秒) 4.不支持T缓冲(因此没有FSAA功能和类电影效果) 实际上,Voodoo4仅是在Voodoo3系列显卡上增加了AGP材质处理,和更大的材质处理功能,支持32位色深,24位Z缓冲和8位模板缓冲。如果这款显卡在1999年春天或最迟99年秋天上市,其前景应更为清晰,亦更能让人理解。它理应能与基于NVIDIA Riva TNT2和Matrox G400芯片的显卡相竞争的。其销路也被看好,3dfx也至少能在市场上维持它的领先地位。但是一直等到了2000年夏天Voodoo4显卡才上市,这时候和那些早在一年前就已上市的竞争对手相比,其唯一无可争辩的优点就只剩下价格了。 Voodoo5 5000 PCI显卡 1.两块VSA-100芯片 2.32MB RAM 3.填充速率:6670万象素每秒(多材质模式下为3330万象素每秒) 4.T缓冲支持,如硬件FSAA和类电影效果 Voodoo5 5500 AGP 1.两块VSA-100芯片 2.64MB RAM 3.填充速率:6670万象素每秒(多材质模式下为3330万象素每秒) 4.T缓冲支持,如硬件FSAA和类电影效果 上述两款显卡代表了3dfx的大量的最新版产品。然而,对于缺少AGP材质处理的32MB 5000款显卡,我们不得不对其竞争力表示怀疑。
Voodoo5 6000 AGP:(如右图所示): 1.四块VSA-100芯片 2.128MB RAM 3.填充速率:13200万象素每秒(多材质模式下为6670万象素每秒) 4.T缓冲支持,如硬件FSAA和类电影效果 这是所有已公布显卡中最强劲的一款。据称拥有四块VSA-100芯片,128MB本地显存,当然也价格不菲。事实上,看起来也只有Voodoo5 6000显卡能在不影响到整个图形子系统性能的前提下充分展示硬件FSAA技术的优点。不过高昂的价格,可能也只有真正的3dfx的发烧友才可能成为Voodoo5 6000 AGP的主人。 现在仅有3dfx Voodo5 5500零售,其PCI版本在7月上市,Voodoo5 6000在仲夏时分,Voodoo4 4500可能会等到在夏末(尽管我们不能理解,那时侯还可以卖给谁)。
下 一 页 |
|
404 Not Found
404 Not Found
nginx
|