关于我们|广告服务|联系我们|您的建议

添入收藏夹 业界动态 今日行情 硬件评测 最新报价 主题论坛 精品商城 外地市场 硬件文章 新品Show

文章分类

整机配件

CPU
内存
硬盘
主板
声卡
网卡
音箱
光驱
机箱
电源
风扇
键盘
鼠标
显示卡
Modem
显示器

电脑外设

HUB
耗材
刻录机
打印机
扫描仪
摄像头
路由器
交换机
数码相机
移动存储
MP3随身听

其他相关

手机
家电
PDA
PALM
笔记本

小熊在线硬件文章

关键词
类别
 

GEFORCE3背后的秘密(2)

【翻译】阅读 人次
2001年06月02日10:36


【文章简介】
关于NVIDIA的最新产品——GEFORCE3,在其强大能量的背后NVIDIA是否对我们隐瞒了什么呢?看完这篇文章后或许能够有一个答案... (3779 字)

II 显存交错寻址控制器(Crossbar memory controller)

上面图片显示得很清楚,在这个64bit的显存控制器当中有四个相对独立而又能够相互访问的16bit控制器,这四个控制器能够彼此访问,还能够访问帧缓冲(framebuffer)和其它的图形处理子系统。这样做就把一个64bit的显存控制器分解为四个16bit的控制器,这四个控制器之间能够自动保持平衡,以便更有效率地为Z-testing和画面纹理渲染服务。

下面的Serious Sam Test 2 测试结果充分说明了上面提到的显存优化的效果。测试中平均每帧画面中都有12500个三角形,有三层纹理的物体至少需要两个时钟周期才能够渲染完毕,这对于GEFORCE3来说是很吃亏的,它的四重纹理(quad-texturing)技术可以将需要两个时钟周期才能完成的任务在一个时钟周期内处理完毕,从而省下一次读写帧缓冲的时间。

在上面的测试结果中,GEFORCE3在16位色下的填充率稍落后于GEFORCE2,但在这次测试中可以看到GEFORCE3在16位色下的测试结果全面超过了GEFORCE2。这其中一个原因就是GEFORCE3特有的Z轴无损压缩技术的应用。同样我们也看到GEFORCE3的32位色下的填充率很接近但是没有超过GEFORCE2的16位色填充率,这表现了尽管GEFORCE3有着4个16bit的显存控制器和对Z缓冲的优化,但是还无法满足32位色下对帧缓冲的极大需求。

    分辨率 640x480 800x600 1024x768 1280x1024 1600x1200
GeForce3, 16位色

65.1

62

56.6

50.4

43.5

GeForce3, 32位色

65.4

61.4

56.0

47.8

39.2

GeForce2, 32位色

64.4

58.7

51.3

38.9

29.0

GeForce2, 16位色

66.2

62.3

56.7

48.6

40.0

III 顶点阴影(Vertex Shader)

顶点阴影是用来定义像素的纹理以及光源的一种逻辑参数,它允许修改各个顶点的参数,使输出结果显示出不同的空间位置、颜色以及贴图纹理。画面上物体的特效即是来源于顶点参数的改变。

下图当中Dronez rolling demo画面中的细节描写、顶点混合以及逐像素光源渲染特效都是由顶点阴影功能完成的。

顶点混合的目的是避免某一点周围的顶点排列扭曲,通过下面图中没有经过贴图的框架图和贴图之后的模型图就能清楚地看出它们之间的区别。注意下面图中人物的肩膀、臀部和膝盖等关节部位,这些关节部位至少由两块骨头影响其外观,顶点混合的做法就是将每块骨头的影响都考虑到之后生成一个顶点位置。当顶点混合之后,每个顶点的光矢量都要重新排列位置以适应逐像素光源照明。注意一下图片中细微凸凹贴图,尤其在人物左腿上。

IV 顶点阴影对显卡表现结果的影响

在Dronez rolling demo测试中,打开顶点阴影之后将会使需要渲染的三角形数目加倍,有时甚至变为原来的三倍。在打开顶点阴影功能之后,画面中需要渲染的三角形数目大约为15300个/帧,当顶点阴影功能被屏蔽时,需要渲染的三角形数目约为7800个/帧。在这里需要强调的是,打开顶点阴影功能与否对画质并没有什么影响,或者说视觉上看不到有明显的变化。那么是什么导致在打开顶点阴影之后使得需要渲染的三角形数目如此剧增呢?可能的原因是在打开顶点阴影功能时,关于顶点属性的数据在多重通道中被反复调用,这是因为图形处理芯片内部存储这些顶点属性的空间不够,使得这些数据在多重通道中被调用来获得关于页面改变的信息、顶点混合的信息和光源信息。如果每周期所反复调用的数据只是关于顶点信息的一部分数据,那么所需要的显存带宽将增加为原来的两倍或三倍。

顶点阴影指令的长短在很大程度上决定处理修改后顶点的速度,GEFORCE3每个时钟周期处理一个指令。举个例子来讲,GEFORCE3处理一个有6条指令的顶点阴影,每秒钟能够生成三百三十万个顶点,然而用GEFORCE3默认的处理通道每秒钟却能生成一千六百万个顶点。下面的图将会更好地反映这个现象。处理一个只含有页面改变信息和顶点混合信息的指令将比处理一个除了这些指令之外再加上像素光源变幻的指令快出很多。下图也充分表现出当处理顶点阴影命令时,GEFORCE3会向CPU求援,因为当分辨率升高时,系统的瓶颈转变为带宽。

分辨率(16位色) 640x480 800x600 1024x768 1280x1024 1600x1200
GeForce2, 凸凹贴图

66.05

64.36

63.92

61.14

56.15

GeForce2

94.5

93.35

92.22

87.96

79.76

GeForce3, 凸凹贴图

112.45

104.18

98.46

82.67

69.56

GeForce3

144.46

141.6

141.17

124.29

104.96

资料来源:ANANDTECH

[未完待续]

【作者:一面湖水 译 北京】  版权作品 未经许可 请勿转载

网友评论(仅供参考与本站立场无关)
即刻发表你对本文的意见和看法(1000字以内)

◇相关主题

GEFORCE3背后的秘密(1) Cool! 2001.06.01
启亨引爆GEFORCE3导火线 Cool! 2001.05.29
令nVIDIA坐立不安的大力神3D Prophet 4500-STM KYRO II——之游戏效果前瞻(下) Cool! 2001.05.21
令nVIDIA坐立不安的大力神3D Prophet 4500-STM KYRO II——之游戏效果前瞻(上) Cool! 2001.05.20
小影霸Geforce3-小影霸奔驰G8000浮出水面 Cool! 2001.05.15
赛扬II800终于上市;内存有望降至220元左右;丽台GeForce3正式上市… 2001.05.09
丽台WinFast GeForce3最新版上市 Cool! 2001.05.08
GeForce3到底需要什么样的CPU 2001.04.28

更多相关主题看这里...


小熊在线公司版权所有
Copyright (C) 2001 beareyes.com
All Rights Reserved