G80 vs R600:高端DirectX10显卡选择
● Radeon HD 2900 XT的强力挑战
Geforce 8800 GTS 640MB vs Radeon HD 2900 XT
● 纸面规格和现实性能的落差
399 美 元 价 位 3D 加 速 卡 规 格 对 比 | ||
显卡型号 | Geforce 8800 GTS | Radeon HD2900 XT |
核心代号 | G80 - 100 | R600 |
制造工艺 | 90nm | 90nm |
核心晶体管数目 | 6.81亿 | 7亿 |
DirectX 版本支持 | DirectX 10 | DirectX 10 |
着色器数量 | 96SP | 320SP |
着色器组织形式 | 96*1D | 64*(1D*5) |
着色器峰值计算能力 | 230.4 GFLOPS | 473.6 GFLOPS |
光栅处理器数量 | 20 | 16 |
抗锯齿模式支持 | 8xMSAA 16xCSAA |
8xMSAA 24xCFAA |
核心频率 | 515MHz | 740MHz |
着色器频率 | 1200MHz | 740MHz |
1600MHz | 1650MHz | |
内存位宽 | 320bit | 512bit |
内存带宽 | 63.4GB/s | 106GB/s |
内存类型 | GDDR3 | GDDR3 |
内存容量 | 640MB | 512MB |
视频加速相关 | PureVideo HD | Avivo |
产品价格定位 | 399美元 | 399美元 |
NVIDIA现以超频版本的Geforce 8800 GTS 640MB直面应战Radeon HD 2900 XT,把核心/着色器/内存频率从标准版本的515MHZ/1200MHz/1600MHz提升至600MHz/1400MHz/1800MHz。
在进入具体测试之前,让我们先来回顾两款显卡、两种GPU硬件的状况和对抗锯齿方面支持的异同。
[Page]产品回顾:GF8800GTS和HD2900XT
● Geforce 8800 GTS 640MB
翔升Geforce 8800 GTS 640MB
Geforce 8800 GTS 640MB
NVIDIA G80-100 GPU
G80芯片由TSMC(台基电)使用90nm工艺代工生产,晶体管数量为6.81亿,G80目前分为G80-450、G80-300和G80-100三种规格,G80-450和G80-300是全规格的芯片,对应Geforce 8800 Ultra/Geforce 8800 GTX显卡,提供384bit位宽内存
SAMSUNG 1.2纳秒GDDR3内存和NVIO芯片
Geforce 8800 GTS 640MB搭载了SAMSUNG 1.2ns速度的GDDR3芯片,8M*32bit组织形式,10枚芯片组成640MB容量、320bit位宽的显卡内存规格。其BIOS设定的内存频率为1800MHz,高于NVIDIA样板规格的1600MHz。
靠近输出接口的全新芯片编号是NVIO,这是一个高度集成的元件,包括两个400MHz的RAMDAC、两个Dual Link规格的TDMS和HDCP。把这些附加功能移出已经接近7亿晶体管的G80也是明智的做法,虽然表面上会小幅提升成本,但实际上降低了在如此复杂的GPU内实现稳定的输出电路的复杂度,能够较好的保证输出品质,并提高G80芯片的良品率。
● Radeon HD 2900 XT
Radeon HD 2900 XT
Radeon HD 2900 XT的PCB设计风格和Radeon X1800/X1900系列类似,GPU和Memory紧邻PCI Express接口布置,供电部分的高频开关电路远离信号输出电路,被安置在PCB的最外侧。
Radeon HD 2900 XT PCB正面
ATI R600 GPU
hynix 1ns GDDR3芯片
Radeon HD 2900 XT上搭载了hynix HY5RS573225A FP-1 GDDR3芯片,单颗芯片为8M*32bit组织形式,16枚芯片组成512MB容量和512bit位宽,1ns速度的芯片额定运行频率高达2000MHz(DDR),但Radeon HD 2900 XT设定的内存频率仅为1650MHz。
Radeon HD 2900 XT直接HDMI输出
Radeon HD 2900 XT的一个过人之处是可以直接简便实现HDMI输出,通过上图这种DVI—HDMI转接头,可以将Radeon HD 2900 XT的DVI输出转成HDMI信号输出,众所周知HDMI中的视频信号和DVI并无二致,但标准HDMI输出还包含了音频信号,R600核心中内置的HD Audio逻辑实现了这一点。
[Page]势均力敌?两款GPU特性及抗锯齿功能分析
● 风格迥异 G80和R600架构思路不同
G80和R600都是符合微软DirectX 10规范的高性能GPU,殊途同归的使用统一着色器基本单元代替沿用多年的像素、顶点着色器分离体系,两者在强调着色器操作的大规模并行思路也有相似之处,然而更多的方面还是体现出了很大的差异。
G80 体系架构图
G80内置96或128个流处理器,每一个即是通用着色单元,是更彻底的超标量体系架构。GigaThread硬件逻辑一视同仁的把任何指令拆成1D标量指令,在强大的硬件线程调度能力和高容量缓存资源的支撑下去管理128个1D标量着色器执行这些指令。考虑到片内缓存的高实现成本,G80在GigaThread上耗费了大量晶体管,标量着色器绝对数目相对R600处于劣势,但它使用着色器频率异步来提高计算能力。
R600 体系架构图
Radeon HD 2900 XT使用的R600 GPU内置惊人数量的通用标量着色器,共计达320个!但由于这些着色器组织形式、调度及运行频率等规格在两款顶级GPU上存在很大差异,我们并不能仅从着色器个数来判断GPU整体性能优劣。
在硬件上R600并不能把各种向量指令分解成若干1D标量指令,它现程分支处理逻辑只能进行保持数据原结构基础上的调度。这和G80的GigaThread逻辑完全把向量指令分解成1D标量指令在进行超大规模的标量化线程调度,直接输出给流处理器的运行模式完全不同。
● 均能支持最高8倍的多重取样抗锯齿
抗锯齿(AA:Antialiasing)仍然是提升3D画面质量的最有效手段之一,也是购买这个级别显卡产品用户的主要3D应用模式,因此以下的测试将着重于此,首先让我们来明确Geforce 8800 GTS和Radeon HD 2900 XT支持的抗锯齿模式。
● CSAA和CFAA
NVIDIA G80的CSAA
类似的,R600能支持NarrowTent过滤模式下的最高12倍CFAA(Customfilter Antialiasing),换用WideTent过滤模式则更高达16倍CFAA。
R600的MSAA和增强型CFAA取样模式的比较
不过CSAA和CFAA因为取样范围的共享都会造成不同程度的图像细节模糊,不少用户不能接受这些变化,所以本文接下来的AA测试还会统一使用4倍的MSAA,也能避免不同个性化AA带来的不公平可能。
[Page]● 测试系统的硬件环境
显卡性能测试使用的硬件平台由Core 2 Extreme X6800 CPU、975X Express主板和1GB*2双通道DDR2-800内存构成。细节及软件环境设定见下表。
系 统 硬 件 环 境 | |
中央处理器 | Intel Core 2 Extreme X6800 ( 双核 / 266MHz*11 / 4MB共享L2缓存 ) |
内存模组 | ADATA Vitesta Extreme Edition DDR2-1066 1GB *2 ( 运行在800@5-5-5 ) |
主板 | ASUS P5W64 WS PRO ( 975X Express / PCB版本1.01G / BIOS版本0701 ) |
显示卡 | Geforce 8800 GTS ( Geforce 8800 GTS / 640MB / 核心:600MHz / 内存:1800MHz ) Radeon HD 2900 XT ( Radeon HD 2900 XT / 256MB / 核心:740MHz / 内存:1650MHz ) |
硬盘 | WestDigital Caviar SE WD1600JS |
电源供应器 | Topwer TOP-900W ( ATX12V 2.0 / 900W ) |
显示器 | SAMSUNG SyncMaster 305T ( 30英寸LCD / 2560*1600分辨率 ) |
● 测试系统的软件环境
操 作 系 统 及 驱 动 | |
Microsoft Windows Vista Ultimate 32bit ( 中文版 ) | |
主板芯片组驱动 | Intel Chipset Software Installation Utility ( WHQL / 版本号8.2.0.1014 ) |
显卡驱动 | ATI Catalyst for Radeon HD 2000 ( WHQL / 版本号7.5 ) NVIDIA Forceware for Geforce 8 ( WHQL / 版本号158.43 ) |
桌面环境 | 1280*1024_32bit@60Hz |
性 能 测 试 软 件 | |
3D合成测试软件 | 3DMark 05 ( Futuremark / 版本号1.20 ) 3DMark 06 ( Futuremark / 版本号1.02 ) |
3D游戏 | Company of Heroes ( Relic / 版本号1.7 ) DiRT ( Codemaster / 版本号Demo ) F.E.A.R. ( Monolith / 版本号1.0.1 ) Quake 4 ( Raven Software / 版本号1.0.1262 ) S.T.A.L.K.E.R. ( iGSC Game World / 版本号1.0 ) The Elder Scrolls IV Oblivion ( Bethesda Softworks / 版本号1.1 ) |
测 试 辅 助 软 件 | |
速度记录软件 | Fraps ( beepa / 版本号2.8.2 ) |
额外的,我们使用Seasonic PowerAngel功率计测试整个系统的实时功率,CPU关闭了EIST等自动降频功能以减少误差,空载为系统进入操作系统待机时、满载为运行3DMark 06软件,取值均是相当长一段时期观察达到过的最大值。
[Page]性能测试结果和全文总结
● 测试说明及成绩分析
Geforce 8800 GTS 640MB vs Radeon HD 2900 XT 512MB | |||
<1> Geforce 8800 GTS 640MB 600MHz/1800MHz |
<2> Radeon HD 2900 XT 512MB 740MHz/1650MHz |
<1>/<2> | |
DirectX 9级别 D3D合成测试软件 | |||
3DMark 05 | |||
1280*1024 | 15199 | 16877 | 90% |
1280*1024 4AA+16AF | 12834 | 12286 | 104% |
1680*1050 4AA+16AF | 11708 | 10744 | 109% |
3DMark 06 | |||
1280*1024 | 9895 | 10541 | 94% |
1280*1024 4AA+16AF | 7588 | 7143 | 106% |
1680*1050 4AA+16AF | 6735 | 6212 | 108% |
DirectX 9级别 D3D游戏 | |||
DiRT | |||
1280*960 | 29.1 fps | 25.2 fps | 115% |
1280*960 4AA+16AF | 25.3 fps | 20.4 fps | 124% |
1600*1200 4AA+16AF | 19.9 fps | 8.7 fps | 229% |
F.E.A.R. | |||
1280*1024 | 95 fps | 112 fps | 84% |
1280*1024 4AA+16AF | 92 fps | 78 fps | 118% |
1680*1050 4AA+16AF | 67 fps | 58 fps | 116% |
S.T.A.L.K.E.R. | |||
1280*1024 | 59.2 fps | 60 fps | 97% |
1280*1024 4AA+16AF | 37.9 fps | 34.4 fps | 110% |
1680*1050 4AA+16AF | 31.3 fps | 26.4 fps | 119% |
The Elder Scrolls IV Oblivion | |||
1280*1024 | 57.6 fps | 63.1 fps | 91% |
1280*1024 4AA+16AF | 47 fps | 36 fps | 131% |
1680*1050 4AA+16AF | 39.1 fps | 31.9 fps | 123% |
DirectX 9级别 D3D扩展OpenGL游戏 | |||
Quake 4 | |||
1280*1024 | 88.4 fps | 82.3 fps | 107% |
1280*1024 4AA+16AF | 86.1 fps | 75.9 fps | 113% |
1680*1050 4AA+16AF | 81.8 fps | 72.3 fps | 113% |
DirectX 10级别 D3D游戏 | |||
Company of Heroes v1.7 | |||
1280*1024 | 32.7 fps | 34.5 fps | 95% |
1280*1024 4AA+16AF | 29.6 fps | 29.4 fps | 101% |
1680*1050 4AA+16AF | 22 fps | 21.9 fps | 100% |
系统功耗 | |||
空载 | 145W | 164W | 88% |
满载 | 235W | 323W | 73% |
所有的测试成绩如上表所示,这里用百分数表示Geforce 8800 GTS 640MB超频版和Radeon HD 2900 XT之间的对比状况,红色为超出,绿色为不足。
事实上对于这个级别的显卡产品而言,这样较低分辨率下Geforce 8800 GTS 640MB的AA性能属于正常,而Radeon HD 2900 XT在更高GPU理论计算能力和更牛的内存
● ZOL评测中心观点
选择谁拿定主意了么?
对于那些咬牙省出3000余大元想要彻底改善自己PC系统3D加速能力的玩家而言,想必前文的测试已经给出明确的答案:Geforce 8800 GTS 640MB超频版虽然硬件规格并不惊人,但却在普遍使用的高品质设定下有更好的游戏速度,并且功耗相对较低,不会给用户现有的电源供应器造成过多负担。
Radeon HD 2900 XT倒也并非一无是处,除了特色的支持HDMI直接输出外,某些情况下它确实能够提供更快的游戏速度,但由R600体系架构决定的是,这种显卡更为依赖优秀成熟的驱动程序配合,至少目前的R600还处于威力未完全发掘的状态,Catalyst研发团队需要加把劲了。