|
深入任天堂GameCube(上)
【原创】阅读
人次
2001年09月15日12:44
【文章简介】
随着任天堂 GameCube 和微软 XBOX 的发布,新一轮游戏主机大战即将打响。从官方公布主机性能指标上来看,好象 NGC 是最弱的,不但比不上性能超强的XBOX,甚至连早就已经发布了的PS2都比不过。但事实真是如此吗? (3528 字) |
随着任天堂GameCube和微软XBOX的发布,新一轮游戏主机大战即将打响。从官方公布主机性能指标上来看,好象NGC是最弱的,不但比不上性能超强的XBOX,甚至连早就已经发布了的PS2都比不过。但事实真是如此吗?NGC的性能真的很弱吗?NGC能否提供足够多的多边形来表现越来越漂亮的游戏画面呢?要回答这个问题,我们需要先来复习一下NGC的主要性能指标:
·MPU(Microprocessor Unit,微处理器),IBM Power PC “Gekko”。相当于电脑上的CPU,是专为GameCube定制的,采用0.18微米工艺以及铜布线技术制造。 ·时钟频率:485MHz; ·处理器性能:1125 mips (Dhrystone 2.1测试结果); ·内部数据精度:32位整数以及64位浮点; ·外部总线带宽:1.3GB/秒(峰值),32位地址及64位数据总线,162MHz; ·内置一级缓存大小:32KB指令缓存以及32KB数据缓存(8路); ·内置二级缓存大小:256KB(2路);
·GPU:系统LSI(大规模集成电路),代号“Flipper”。 ·制程:0.18微米,采用NEC Embedded DRAM嵌入式内存技术; ·时钟频率:162MHz; ·嵌入式帧缓冲:2MB左右,6.2纳秒(1T-SRAM); ·嵌入式材质缓存:1MB左右,6.2纳秒(1T-SRAM); ·材质读取带宽:10.4GB/秒(峰值); ·系统内存带宽:2.6GB/秒(峰值); ·色彩及Z缓冲精度:各24位; ·图象特效:雾化、子像素抗失真(Subpixel Anti-aliasing)、8硬件光源、阿尔法混合、虚拟材质设计、多重贴图/凹凸/环境映射、MIPMAP、双线性过滤、三线性过滤、实时材质解压缩(S3TC格式)等;
(下列与声音部分有关的组件已整合在系统LSI中) ·音效处理器:专用16位DSP; ·指令内存:8KB RAM + 8KB ROM; ·数据内存:8KB RAM + 4KB ROM; ·时钟频率:81MHz; ·最大同时发音数:ADPCM,64通道; ·采样率:48KHz;
·系统浮点运算能力:10.5G FLOPS(峰值,CPU+几何引擎+硬件光照); ·实际多边形生成能力:6百万~12百万/秒(这是实际游戏中的性能,包括了复杂的模型以及贴图等); ·系统内存:40MB; ·主内存:24MB,10ns,1T-SRAM; ·A-Memory(用途不明,可能是为并不需要很高速度的设备提供缓冲,例如光驱、音频等):16MB(DRAM,81MHz); ·光驱:恒定角速度方式读取,平均访问时间128毫秒,数据传输率16Mbps到25Mbps; ·存储介质:8厘米(3英寸)DVD光盘,采用特殊技术制造,最大存储容量为1.5GB; ·输入输出接口:
游戏手柄接口 X4
记忆卡插槽 X2
模拟AV输出 X1
数字AV输出 X1
串口 X2
并口 X1
首先我们需要说明一点:任天堂公布的6~12百万多边形/秒这个数值相当保守,在发布NGC的当天,任天堂公布了两段关于《星球大战:流浪中队》的演示动画,开发此游戏的Factor 5公司(当然,是和卢卡斯(LucasArts)合作开发)指出,游戏中的画面用到了大约1200万多边形/秒,而这仅仅是NGC全部性能的50%,实际上NGC所能提供的最大多边形生成速率为2000万多边形/秒,而且这些多边形是已经经过了所有特效处理的,包括渲染、纹理等因素,所以说NGC的性能十分强大,只不过任天堂不象SONY和微软那样过分宣扬主机性能罢了。以下是Factor 5公司总裁在德国电视游戏站点maniac online上对这两段Demo所做的说明: ·这两段Demo都是实时生成的,并且只用到了NGC全部机能的50%; ·X-Wing战机是由Industrial Light and Magic(ILM)生成的原始模型,大约由30000个多边形组成,而飞行员则是由4000个多边形组成; ·两段Demo都运行60fps下,并且有双缓冲、真彩色、全屏抗失真和抗闪烁效果; ·第二个死星的表面是根据电影重建的,比例为1:1。由300个多边形组成,每个多边形都使用了512x512大小的真彩色材质。在Demo中可以看到25个这样的死星,以及70架钛战机和X-Wing战机出现在屏幕上。每幅画面中都包括20万个多边形,而且速度为60fps,大家自己算算多边形生成速率是多少?(60fps x 200000 = 1200万多边形/秒)而且这个数字还是在加了8光源、光泽、污垢以及凹凸贴图后得出的(要知道8光源会对性能造成极大影响,在3DMark 2001测试中,GeForce3开了8光源后性能下降了一倍多!)。 ·允许在同一个周期里实现以下所有特效:Alpha(阿尔法混合)、 Bump Mapping(凹凸映射)、 Gloss Mapping(光泽映射)、Specular Highlights(镜面高光)等。并且可以在一个周期里完成8层贴图。 ·2MB的帧缓冲是一种渲染缓冲,当一帧画面渲染好了之后,会被送到主内存中,而且是已经完成了抗失真和抗闪烁处理的。 ·1MB的材质缓存会在渲染的时候自动填充(填充什么?材质缓存里当然是填充材质了),这个交换动作是由T&L引擎触发的。经常使用的材质能够被“锁定”在缓存中。 ·A-Memory的主要作用是为音频部分提供缓存,但也可以被一些不需要很高速度的设备使用,可以节省主内存空间。 ·芯片内嵌的2MB帧缓冲只会包含当前正在渲染的帧和Z缓冲的数据,双倍/三倍缓冲是存放在主内存中的,因为视频数模转换器(DAC)可以从主内存中直接读取图像数据。渲染一幅图像时,多边形数据会被发送到T&L单元中,并自动完成将材质读取/交换到材质缓冲的动作。而材质则会在渲染的时候解压缩,所以没有压缩的材质不会占用内存空间。 罗罗嗦嗦地说了半天,干脆大家自己去下载这两段Demo看看吧,效果非常惊人,感觉跟电影没什么两样,这可是实时生成的游戏画面哦!实际玩起来一定会很爽的,两段Demo一共30MB左右,下载地址: http://cubemovies.ign.com/media/previews/video/rogue2/ign_starwars.mpg http://cubemovies.ign.com/media/previews/video/rogue2/ign_starwarslarge.mpg GameCube的主板  上图展示的就是任天堂GameCube的主板了,可以看到此主板非常简洁,跟我们平时常见的PC主板大不一样,比较复杂的元件只有五个——标有IBM字样的是CPU“Gekko”;标有ATi和NEC字样的则是GPU(图像处理器)+北桥+音频处理器的超大规模集成电路,也就是开头规格部分提到过的“LSI”;上方两块一模一样的、长方形BGA封装的芯片是总容量为24MB的1T-SRAM,系统主内存,频率为324MHz;左上角则是81MHz的A-Memory,传统TSOP封装,16MB,DRAM。估计GameCube“游戏方块”的名字就是从这种设计结构中得来的,整个主板的大小仅相当于一个CD盘盒,高度集成的好处是可以降低成本,而且性能也非常强大。  这是GameCube的系统方框图,看起来A-Memory内存与系统LSI之间的带宽很小,仅有81MB/秒。但A-Memory主要是为音频部分提供缓存,以及其他一些对带宽要求不很高的设备使用,简单算一下就知道了,音频部分所需要的带宽仅为:64(通道)x 48000(采样率)x 16bits(数据宽度)≈ 6MB(每秒)。所以81MB/秒的带宽完全能够满足需求。据任天堂内部人员指出,“Flipper”里的音频部分有其自己的数据通道,所以并不会占用主内存通道,更不会影响图像芯片的工作。 主内存 GameCube另一个令人惊讶的地方,是它采用了24MB 1T-SRAM作主内存。这种1T-SRAM是Mosys公司开发的,用在GameCube上的24MB 1T-SRAM速度为10纳秒,但这种1T-SRAM并不象Rambus和DDR那样通过加大带宽来提高速度,它在存取非线形数据的时候要比目前所有内存技术都快,尤其是在重复的随机存取时(例如游戏中复杂的人工智能运算)更能体现出它的优势。但对材质存取则没有什么帮助,因为材质在内存中是以线形方式存储的。不过材质数据的存取速度也不会因此而降低,因为主内存的带宽毕竟有2.6GB/秒,而且“Flipper”内部还有1MB的材质缓存可以派上用场,通过这1MB材质缓存存取数据要比主内存快得多,能够非常有效地提高重复材质的存取速度。 芯片的尺寸 由IBM定制的Power PC“Gekko”处理器主频为485MHz,内置256KB二级缓存,都是0.18微米加铜布线工艺制造的。虽然内置了256KB二级缓存,但IBM仍然把这块芯片的核心做到了43平方毫米——只有平时常见的铜矿CPU核心的一半大小!而图像芯片技术则来自ArtX公司,采用嵌入式内存技术,也是0.18微米工艺制造,核心大小为120平方毫米,仅仅比铜矿的核心略大一点,跟世嘉的游戏主机DreamCast里用的CPU,日立SH-4差不多大。况且其中不光是图像部分,还有嵌入式的SRAM内存以及音频处理器部分,所以说集成度非常惊人。芯片面积减小,意味着从一大片硅晶元中能切割出更多的芯片,随之而来的当然是成本降低。 GameCube内部的这两个芯片都被十分厚重的散热片包裹着,只是在主机的通风口处有一个风扇而已,说明这两块芯片的发热量都不高,不必象电脑那样,给显卡和CPU都加上风扇。“Flipper”中共有5100万个晶体管,其中有一半是嵌入式的内存(2500万个),另一半(2600万个)则是逻辑电路。“Flipper”共有3.1MB内嵌式存储器,2.1MB为帧缓冲,共分128个Bank;还有1MB材质缓存,分为512个Bank。 [未完待续]
【作者:小熊在线-UM 北京】 版权作品
未经许可 请勿转载
|