|
GEFORCE3背后的秘密(3)
【翻译】阅读
人次
2001年06月02日13:44
【文章简介】
关于NVIDIA的最新产品——GEFORCE3,在其强大能量的背后NVIDIA是否对我们隐瞒了什么呢?看完这篇文章后或许能够有一个答案... (2883 字) |
V 抗锯齿(Anti-aliasing) 在处理抗锯齿方面,GEFORCE3和GEFORCE2主要的区别在于前者使用多重取样(multi-sampling),而后者使用超级取样方式(supersampling)。在抗锯齿功能打开时,GEFORCE2先将目前的分辨率以一选定的系数与水平及垂直大小相乘,然后,将较高分辨率的画面传回,再将画面缩放回至原来屏幕的分辨率。GEFORCE3所使用的是将一个像素的数据分解为相距不足一个像素距离的多个子像素。这些子像素是生成像素的最后一个步骤,接下来就是将其写入帧缓冲。 在抗锯齿功能打开时,GEFORCE3所消耗的纹理带宽与未打开抗锯齿功能时消耗的带宽是一样的。纹理的分辨率与没有多重取样时是一样的,另外,所用的纹理数量也是相同的。所以在抗锯齿打开时,纹理的质量是一样的。GEFORCE3能使用的五点采样的方式为:首先生成两个子像素——这与2点采样很相似。不同之处在于,之后它会在邻近的三个像素中取样,然后合成最终像素颜色。不过,这样做的后果会使纹理的精度降低,在如下的图中就看得到。   我们再来看看GEFORCE2的超级取样情况,由于GEFORCE2先把屏幕设成比当前分辨率更高的分辨率,随之而来的就是在相同程度的抗锯齿情况下,将需要更多的纹理数据。同样,也需要更高解析度和透明度的纹理。这样做的坏处在于打开抗锯齿功能时所需要的纹理带宽激增,好处是抗锯齿后的画面更加艳丽清晰。 下面图片描述的是在打开抗锯齿之后画面中物体边缘的情况。看到在相同程度抗锯齿情况下,GEFORCE3和GEFORCE2的画面效果区别不很明显。在高质量的抗锯齿情况之下,由于2点采样生成的子像素很少,使得2点采样的抗锯齿效果最差。5点采样在画面中倾斜15度的物体边缘上来看效果很好。但是,如果把所有的角度都考虑到,还是4点采样的效果最好。   VI 抗锯齿后的画面效果 GEFORCE2和GEFORCE3的抗锯齿过程包含两个步骤:首先,将采样写入到帧缓冲当中;然后,将样品混合之后,把抗锯齿之后的图像输出到帧缓冲中。 (I) GEFORCE3和GEFORCE2的抗锯齿效果比较 在GEFORCE3的多重采样的第一个步骤中,所需要的纹理带宽与没有打开抗锯齿时没有变化。但是GEFORCE2的情况就不一样了,在打开抗锯齿功能时,随着超级采样的启动,所需要的纹理带宽也随之成倍地上涨。在同级别抗锯齿效果下,GEFORCE3和GEFORCE2需要的像素颜色缓存带宽很接近。由于GEFORCE3所特有的Z轴无损压缩功能,它对色深缓存带宽的要求相比GEFORCE2小一些。在第二个步骤中,处理同样的抗锯齿效果时两者所消耗的带宽相同,将已经处理的像素写入到帧缓冲当中时,GEFORCE2同时还要访问色深缓存。由于此时GEFORCE3在带宽利用上的优势,使得它的表现全面超过GEFORCE2。 
| 分辨率(32位色) |
640x480 |
800x600 |
1024x768 |
1280x1024 |
1600x1200 |
| Geforce2 4点取样抗锯齿 |
40.9 |
29.2 |
19.5 |
11.1 |
不支持 |
| Geforce2 3点取样抗锯齿 |
50.6 |
40.3 |
28.7 |
18.4 |
9.2 |
| Geforce3 4点取样抗锯齿 |
50.4 |
41.7 |
30.4 |
19.3 |
5.4 |
| Geforce3 2点取样抗锯齿 |
56.9 |
49.3 |
40.6 |
29.4 |
21.1 |
(II) GEFORCE3多重采样中5点采样和2点采样、4点采样效果比较 在低分辨率抗锯齿情况下,由于5点采样使用更大的采样体制,使得其在速度上落后于4点采样。然而随着分辨率的提高,当带宽成了主要瓶颈的时候,5点采样相比4点采样来说使用的带宽较少,使其在速度上超过了4点采样。此时,在多重采样的第二个步骤中,5点采样只比2点采样使用了更多的带宽,这也是显而易见的:5点采样除了和2点采样一样要在2个像素中采样之外还要在其邻近的3个像素中采样。结果如下图所示。 
| 分辨率(16位色) |
640x480 |
800x600 |
1024x768 |
1280x1024 |
1600x1200 |
| Geforce3 2点采样抗锯齿 |
58.9 |
52.6 |
44.8 |
35.9 |
27.2 |
| Geforce3 5点采样抗锯齿 |
52.8 |
46.1 |
38.4 |
28.9 |
21.7 |
| Geforce3 4点采样抗锯齿 |
54.6 |
47.7 |
38.4 |
26.4 |
18.3 |
VII 结论 顶点阴影技术给我们打开了一扇通往未来的门,如果以后能够出现更好的图形处理芯片的话,那么就可以改变当前所使用的顶点阴影指令或者改变该指令的长度来获得更好的效果。顶点阴影技术的广泛应用带来了更好的画面效果,但是随之而来的就是对内存带宽的强烈需求。首先,在打开顶点阴影功能之后,通过AGP的数据流量将会增加很多,而且显卡对像素带宽的要求也会增大很多。虽然在某种意义上来讲,GEFORCE3的像素带宽已经由于其特有的色深缓存优化而有所减少,但是由于高分辨率下的渲染和抗锯齿功能的打开,使得它对像素带宽的要求增大了很多。 在以后的产品中又会有什么样的变化呢?在NVIDIA以后的产品中我们能不能看到渲染体制有所改变?对Z轴遮挡筛选能不能有所改进呢?是否会加入对像素颜色缓存的压缩功能?NVIDIA公司可能有能力做到这些,或许这些只是时间的问题吧。想想看,如果你是NVIDIA,你会把所有的绝招一下子都拿出来么? 资料来源:ANANDTECH [全文完]
【作者:一面湖水 译 北京】 版权作品
未经许可 请勿转载
|