首页 | 新闻中心 | 产品报价 | 推荐经销商 | 找商家 | 本地商情 | 家园 | 社区 | 汽车
热点推荐
首页 > 硬件资讯 > 显卡 > 评测 > 正文

3000大元砸给谁 GTS640超频版硬撼R600

中关村在线云南站 2007年06月02日 来源:中关村在线 编辑:玉簌 收藏此页
 

G80 vs R600:高端DirectX10显卡选择

  ● Radeon HD 2900 XT的强力挑战

  Radeon HD 2900 XT的问世,让原本Geforce 8800独角唱戏的高端DirectX 10娱乐显卡舞台终于热闹起来,虽然AMD暂时只在新一代显卡产品线中投入了这唯一一款,但它却避开了高性能领域内NVIDIA顶级的Geforce 8800 Ultra和性价比极为突出的Geforce 8800 GTS 320MB,剑走偏锋的在399美元一线立足。纵然这更多的是出由于新一代Radeon冲击速度顶峰方面的无力,但事实上还是给市场领先者NVIDIA带来了压力:Geforce 8800 GTS 640MB之前的各方面形象并不强势,和Radeon HD 2900 XT相比显得竞争力有限。


3000大元砸给谁 GTS640超频版硬撼R600
Geforce 8800 GTS 640MB vs Radeon HD 2900 XT

  ● 纸面规格和现实性能的落差

  Geforce 8800 GTS是06年11月发布的NVIDIA首代DirectX10显卡的次顶级型号,其硬件规模大约是顶级的Geforce 8800 GTX的80%,虽然全规格的G80可以轻松击败Radeon HD 2900 XT,但下表规格对比中的许多数字给人的直观印象是Geforce 8800 GTS弱于半年后杀至的Radeon HD 2900 XT很多。然而在我们之前的测试中,这两块显卡实际性能的差异7

399 美 元 价 位 3D 加 速 卡 规 格 对 比
显卡型号 Geforce 8800 GTS Radeon HD2900 XT
核心代号 G80 - 100 R600
制造工艺 90nm 90nm
核心晶体管数目 6.81亿 7亿
DirectX 版本支持 DirectX 10 DirectX 10
着色器数量 96SP 320SP
着色器组织形式 96*1D 64*(1D*5)
着色器峰值计算能力 230.4 GFLOPS 473.6 GFLOPS
光栅处理器数量 20 16
抗锯齿模式支持 8xMSAA
16xCSAA
8xMSAA
24xCFAA
核心频率 515MHz 740MHz
着色器频率 1200MHz 740MHz
内存频率 1600MHz 1650MHz
内存位宽 320bit 512bit
内存带宽 63.4GB/s 106GB/s
内存类型 GDDR3 GDDR3
内存容量 640MB 512MB
视频加速相关 PureVideo HD Avivo
产品价格定位 399美元 399美元

  NVIDIA现以超频版本的Geforce 8800 GTS 640MB直面应战Radeon HD 2900 XT,把核心/着色器/内存频率从标准版本的515MHZ/1200MHz/1600MHz提升至600MHz/1400MHz/1800MHz

  本文即将通过最新3D游戏应用的测试直接把Geforce 8800 GTS 640MB超频版和Radeon HD 2900 XT推上擂台,并有针对性着重抗锯齿模式下的性能对其进行速度比较,给那些舍得掏出3000余大元投资在显卡上的用户一个较为清晰的信息:到底谁的高质量3D游戏性能更值得投资?纸面的数字指标反映到真实应用上时有有多少折扣?

  在进入具体测试之前,让我们先来回顾两款显卡、两种GPU硬件的状况和对抗锯齿方面支持的异同。

[Page]

产品回顾:GF8800GTS和HD2900XT

  ● Geforce 8800 GTS 640MB

  这里选用了一块来自翔升(ASL)的Geforce 8800 GTS 640MB超频版显卡作为测试样卡。这款产品完全参照NVIDIA P356样板设计,无论元件使用还是散热器配置都和NVIDIA官方样卡相同,精工细造的水准就无需多言。翔升只是在风扇上更换了带有自己logo的贴纸。


3000大元砸给谁 GTS640超频版硬撼R600   3000大元砸给谁 GTS640超频版硬撼R600

3000大元砸给谁 GTS640超频版硬撼R600   3000大元砸给谁 GTS640超频版硬撼R600
翔升Geforce 8800 GTS 640MB

  Geforce 8800 GTS 640MB是双槽位显卡,巨型热管散热器覆盖了PCB正面80%面积,散热出风向外排出机箱,它带有一个6pin外接电力输入接口和一个用于SLI配置的MIO接口,这种产品的双DVI接口均能支持Dual-Link规格数字输出。Geforce 8800 GTS 640MB的PCB设计比Geforce 8800 GTX精简,PCB尺寸和供电电路规格也较低。

3000大元砸给谁 GTS640超频版硬撼R600
NVIDIA G80-100 GPU

  G80芯片由TSMC(台基电)使用90nm工艺代工生产,晶体管数量为6.81亿,G80目前分为G80-450、G80-300和G80-100三种规格,G80-450和G80-300是全规格的芯片,对应Geforce 8800 Ultra/Geforce 8800 GTX显卡,提供384bit位宽内存接口(分为6组),内置128个通用标量着色器(SPs:Streaming Processors),24个光栅处理器(ROP:Raster Opteration)。Geforce 8800 GTS上配置的GPU是G80-100,提供320bit位宽内存接口,内置96个通用标量着色器,20个ROP。这款Geforce 8800 GTS 640MB的核心/着色器频率分别为600MHz/1400MHz,比NVIDIA样板频率高约20%。

3000大元砸给谁 GTS640超频版硬撼R600   3000大元砸给谁 GTS640超频版硬撼R600
SAMSUNG 1.2纳秒GDDR3内存和NVIO芯片

  Geforce 8800 GTS 640MB搭载了SAMSUNG 1.2ns速度的GDDR3芯片,8M*32bit组织形式,10枚芯片组成640MB容量、320bit位宽的显卡内存规格。其BIOS设定的内存频率为1800MHz,高于NVIDIA样板规格的1600MHz。

  靠近输出接口的全新芯片编号是NVIO,这是一个高度集成的元件,包括两个400MHz的RAMDAC、两个Dual Link规格的TDMS和HDCP。把这些附加功能移出已经接近7亿晶体管的G80也是明智的做法,虽然表面上会小幅提升成本,但实际上降低了在如此复杂的GPU内实现稳定的输出电路的复杂度,能够较好的保证输出品质,并提高G80芯片的良品率。

  ● Radeon HD 2900 XT

  Radeon HD 2900 XT却是目前最复杂的3D加速卡之一。它延续ATI传统的周身亮色纯红基调、覆盖了PCB正面85%面积的巨型散热器上以银色火焰涂装点缀,非常美观。

3000大元砸给谁 GTS640超频版硬撼R600   3000大元砸给谁 GTS640超频版硬撼R600
Radeon HD 2900 XT

  这款显卡使用了夸张的14层PCB以满足超密pin脚的512bit位宽内存控制器GPU和内存芯片信号稳定的通信需求。Radeon HD 2900 XT是双槽位的显卡产品,同时需要8pin+6pin双路外接电力输入,6pin+6pin外接电力也可以让它正常工作,但驱动控制面板中的Overdrive功能不会出现。在Crossfire实现方面,Radeon HD 2900 XT和Radeon X1950 PRO的方案相同,使用两个软性PCB联结器。

  Radeon HD 2900 XT的PCB设计风格和Radeon X1800/X1900系列类似,GPU和Memory紧邻PCI Express接口布置,供电部分的高频开关电路远离信号输出电路,被安置在PCB的最外侧。

3000大元砸给谁 GTS640超频版硬撼R600
Radeon HD 2900 XT PCB正面

  R600使用核心裸露的FCBGA封装,没有安装金属上盖保护,但基板周有一圈金属垫片和核心顶等高起辅助保护作用,芯片的生产相关信息也蚀刻在金属垫片上,GPU核心顶部光滑如镜。

3000大元砸给谁 GTS640超频版硬撼R600
ATI R600 GPU

  R600 GPU内含7亿晶体管!超过G80的6亿8千万成为当今GPU复杂度的No.1。这款芯片由台积电使用改进型80nm工艺制造,称为80HS工艺,新工艺有效提升GPU可达到的运行频率,并在成熟的技术下实现较高的良品率。Radeon HD 2900 XT上的R600运行在740MHz,全芯片内的所有逻辑频率同步。

3000大元砸给谁 GTS640超频版硬撼R600
hynix 1ns GDDR3芯片

  Radeon HD 2900 XT上搭载了hynix HY5RS573225A FP-1 GDDR3芯片,单颗芯片为8M*32bit组织形式,16枚芯片组成512MB容量和512bit位宽,1ns速度的芯片额定运行频率高达2000MHz(DDR),但Radeon HD 2900 XT设定的内存频率仅为1650MHz。

3000大元砸给谁 GTS640超频版硬撼R600
Radeon HD 2900 XT直接HDMI输出

  Radeon HD 2900 XT的一个过人之处是可以直接简便实现HDMI输出,通过上图这种DVI—HDMI转接头,可以将Radeon HD 2900 XT的DVI输出转成HDMI信号输出,众所周知HDMI中的视频信号和DVI并无二致,但标准HDMI输出还包含了音频信号,R600核心中内置的HD Audio逻辑实现了这一点。

[Page]

势均力敌?两款GPU特性及抗锯齿功能分析

  ● 风格迥异 G80和R600架构思路不同

  G80和R600都是符合微软DirectX 10规范的高性能GPU,殊途同归的使用统一着色器基本单元代替沿用多年的像素、顶点着色器分离体系,两者在强调着色器操作的大规模并行思路也有相似之处,然而更多的方面还是体现出了很大的差异。


3000大元砸给谁 GTS640超频版硬撼R600
G80 体系架构图

  G80内置96或128个流处理器,每一个即是通用着色单元,是更彻底的超标量体系架构。GigaThread硬件逻辑一视同仁的把任何指令拆成1D标量指令,在强大的硬件线程调度能力和高容量缓存资源的支撑下去管理128个1D标量着色器执行这些指令。考虑到片内缓存的高实现成本,G80在GigaThread上耗费了大量晶体管,标量着色器绝对数目相对R600处于劣势,但它使用着色器频率异步来提高计算能力。

  G80的这种设计思路使GPU能够在所有应用中保持稳定的均一性能,理论上最高的着色器资源利用率,和便于开发的驱动程序编译器。与之向悖,R600的着色器设计思路是把大量晶体管用在堆积海量流处理单元上,而向量、标量指令的并行推动力则交由中间件编译器实现,提高并行处理的方式是对原始指令进行组合,封装成流处理器组适应的形式。

3000大元砸给谁 GTS640超频版硬撼R600
R600 体系架构图

  Radeon HD 2900 XT使用的R600 GPU内置惊人数量的通用标量着色器,共计达320个!但由于这些着色器组织形式、调度及运行频率等规格在两款顶级GPU上存在很大差异,我们并不能仅从着色器个数来判断GPU整体性能优劣。

  R600虽然宏观上是320个流处理单元的超标量体系,但在微观实现上具有浓厚传统4D向量着色器特征。这些流处理单元被每5个分成一组4D+1D模式的5D向量着色器,和传统向量着色器不同的是,它能够理论上实现每周器发射最多5个标量指令,形成逻辑上的1D*5着色执行模式,和G80每个流处理器都是完整的拥有自己执行资源的ALU不同的是,R600的每5个流处理单元才能行使完整的ALU功能,向外部申请执行资源。

  在硬件上R600并不能把各种向量指令分解成若干1D标量指令,它现程分支处理逻辑只能进行保持数据原结构基础上的调度。这和G80的GigaThread逻辑完全把向量指令分解成1D标量指令在进行超大规模的标量化线程调度,直接输出给流处理器的运行模式完全不同。

  ● 均能支持最高8倍的多重取样抗锯齿

   抗锯齿(AA:Antialiasing)仍然是提升3D画面质量的最有效手段之一,也是购买这个级别显卡产品用户的主要3D应用模式,因此以下的测试将着重于此,首先让我们来明确Geforce 8800 GTS和Radeon HD 2900 XT支持的抗锯齿模式。

   G80和R600均支持最高8倍的标准MSAA(Multisampling Antialiasing),这是它们相对于自家上代产品的一项突破。MSAA拥有相对更为广泛的适用性和优秀的画面品质,但其对显卡本地内存容量和GPU的计算能力要求均较高,即使这样,大多数用户还是会选择这种模式进行游戏,典型的设置是开启4倍MSAA,并同时开启16倍的AF。

  ● CSAA和CFAA

3000大元砸给谁 GTS640超频版硬撼R600
NVIDIA G80的CSAA

   G80的Lumenex引擎支持一种新的抗锯齿包含了范围去样和几何取样而被称作CSAA(Coverage Sampling Antialiasing)。CSAA增加了4种单GPU的高品质多重取样抗锯齿模式,它们是8x、8xQ、16x和16xQ,其中8xQ和16xQ是桌面PC领域画面质量最高的抗锯齿模式。在很多游戏中,16x的CSAA可以和4x的MSAA达到相近的fps,但是16x CSAA可以提供好的多的画质。

   类似的,R600能支持NarrowTent过滤模式下的最高12倍CFAA(Customfilter Antialiasing),换用WideTent过滤模式则更高达16倍CFAA。

3000大元砸给谁 GTS640超频版硬撼R600   3000大元砸给谁 GTS640超频版硬撼R600
R600的MSAA和增强型CFAA取样模式的比较

  CFAA是通过不同过滤方式在可编程取样范围实现的一种灵活的抗锯齿模式,它的核心部分基于主流应用的MSAA,但在扩展取样范围后可以实现更高级别的AA品质,不同的过滤模式也在ATI Catalyst驱动中被不断的扩展出来,甚至是未来EdgeDetect过滤模式下支持最高24倍CFAA!

  不过CSAA和CFAA因为取样范围的共享都会造成不同程度的图像细节模糊,不少用户不能接受这些变化,所以本文接下来的AA测试还会统一使用4倍的MSAA,也能避免不同个性化AA带来的不公平可能。

[Page]

  ● 测试系统的硬件环境

  显卡性能测试使用的硬件平台由Core 2 Extreme X6800 CPU、975X Express主板和1GB*2双通道DDR2-800内存构成。细节及软件环境设定见下表。


系 统 硬 件 环 境
中央处理器 Intel Core 2 Extreme X6800
( 双核 / 266MHz*11 / 4MB共享L2缓存 )
内存模组 ADATA Vitesta Extreme Edition DDR2-1066 1GB *2
( 运行在800@5-5-5 )
主板 ASUS P5W64 WS PRO
( 975X Express / PCB版本1.01G / BIOS版本0701 )
显示卡 Geforce 8800 GTS
( Geforce 8800 GTS / 640MB / 核心:600MHz / 内存:1800MHz )
Radeon HD 2900 XT
( Radeon HD 2900 XT / 256MB / 核心:740MHz / 内存:1650MHz )
硬盘 WestDigital Caviar SE WD1600JS
( 160GB / 7200RPM / 8M缓存 / 50GB NTFS系统分区 )
电源供应器 Topwer TOP-900W
( ATX12V 2.0 / 900W )
显示器 SAMSUNG SyncMaster 305T
( 30英寸LCD / 2560*1600分辨率 )

  ● 测试系统的软件环境

操 作 系 统 及 驱 动
操作系统 Microsoft Windows Vista Ultimate 32bit
( 中文版 )
主板芯片组驱动 Intel Chipset Software Installation Utility
( WHQL / 版本号8.2.0.1014 )
显卡驱动 ATI Catalyst for Radeon HD 2000
( WHQL / 版本号7.5 )
NVIDIA Forceware for Geforce 8
( WHQL / 版本号158.43 )
桌面环境 1280*1024_32bit@60Hz

  测试内容除了包括D3D合成测试软件3DMark、DirectX 9 3D游戏和OpenGL D3D扩展3D游戏外,还最新加入更新了DirectX 10补丁的旧游戏Company of Heroes(Patch 1.7)。合成测试软件3DMark用总分衡量性能,3D游戏用平均fps来衡量性能,两者都是越高越好。

性 能 测 试 软 件
3D合成测试软件 3DMark 05
( Futuremark / 版本号1.20  )
3DMark 06
( Futuremark / 版本号1.02  )
3D游戏 Company of Heroes
( Relic / 版本号1.7 )
DiRT
( Codemaster / 版本号Demo )
F.E.A.R.
(  Monolith / 版本号1.0.1 )
Quake 4
( Raven Software / 版本号1.0.1262 )
S.T.A.L.K.E.R.
( iGSC Game World / 版本号1.0 )
The Elder Scrolls IV Oblivion
( Bethesda Softworks / 版本号1.1 )
 测 试 辅 助 软 件
速度记录软件 Fraps
( beepa / 版本号2.8.2 )

  额外的,我们使用Seasonic PowerAngel功率计测试整个系统的实时功率,CPU关闭了EIST等自动降频功能以减少误差,空载为系统进入操作系统待机时、满载为运行3DMark 06软件,取值均是相当长一段时期观察达到过的最大值。

[Page]

性能测试结果和全文总结

  ● 测试说明及成绩分析

  因为测试内容涉及到DirectX 10,这次显卡测试移植至32位Windows vista操作系统内进行,以期够代表未来应用的方向。在绝对性能测试里,我们将选用1280*1024、1600*1200这两个可以覆盖市场的主流分辨率:17至22英寸宽屏LCD的标准设定。在3D游戏测试中,所有游戏均把画面质量和可能的特效开至最高(包括HDR),抗锯齿在应用程序中设定,各性异性过滤则在显卡驱动中设定。


Geforce 8800 GTS 640MB vs Radeon HD 2900 XT 512MB
  <1>
Geforce 8800 GTS 640MB 600MHz/1800MHz
<2>
Radeon HD 2900 XT 512MB 740MHz/1650MHz
<1>/<2>
DirectX 9级别 D3D合成测试软件
3DMark 05
1280*1024 15199 16877 90%
1280*1024 4AA+16AF 12834 12286 104%
1680*1050 4AA+16AF 11708 10744 109%
3DMark 06
1280*1024 9895 10541 94%
1280*1024 4AA+16AF 7588 7143 106%
1680*1050 4AA+16AF 6735 6212 108%
DirectX 9级别 D3D游戏
DiRT
1280*960 29.1 fps 25.2 fps 115%
1280*960 4AA+16AF 25.3 fps 20.4 fps 124%
1600*1200 4AA+16AF 19.9 fps 8.7 fps 229%
F.E.A.R.
1280*1024 95 fps 112 fps 84%
1280*1024 4AA+16AF 92 fps 78 fps 118%
1680*1050 4AA+16AF 67 fps 58 fps 116%
S.T.A.L.K.E.R.
1280*1024 59.2 fps 60 fps 97%
1280*1024 4AA+16AF 37.9 fps 34.4 fps 110%
1680*1050 4AA+16AF 31.3 fps 26.4 fps 119%
The Elder Scrolls IV Oblivion
1280*1024 57.6 fps 63.1 fps 91%
1280*1024 4AA+16AF 47 fps 36 fps 131%
1680*1050 4AA+16AF 39.1 fps 31.9 fps 123%
DirectX 9级别 D3D扩展OpenGL游戏
Quake 4
1280*1024 88.4 fps 82.3 fps 107%
1280*1024 4AA+16AF 86.1 fps 75.9 fps 113%
1680*1050 4AA+16AF 81.8 fps 72.3 fps 113%
DirectX 10级别 D3D游戏
Company of Heroes  v1.7
1280*1024 32.7 fps 34.5 fps 95%
1280*1024 4AA+16AF 29.6 fps 29.4 fps 101%
1680*1050 4AA+16AF 22 fps 21.9 fps 100%
系统功耗
空载 145W 164W 88%
满载 235W 323W 73%

  所有的测试成绩如上表所示,这里用百分数表示Geforce 8800 GTS 640MB超频版和Radeon HD 2900 XT之间的对比状况,红色为超出,绿色为不足。

   显而易见,Geforce 8800 GTS 640MB超频版虽然在大多数项目的1280档分辨率标准测试中落后5%-10%,但在所有的4倍MSAA+16倍AF设定测试中获得了胜利,普遍领先幅度在10%以上,最高达128%!

   事实上对于这个级别的显卡产品而言,这样较低分辨率下Geforce 8800 GTS 640MB的AA性能属于正常,而Radeon HD 2900 XT在更高GPU理论计算能力和更牛的内存带宽下却速度下降更多则有些说不过去,笔者曾在R600发布时的测试中提到过这个问题,而今天使用最新发布的Catalyst 7.5后仍没有明显改善。

  ● ZOL评测中心观点


3000大元砸给谁 GTS640超频版硬撼R600

选择谁拿定主意了么?

   对于那些咬牙省出3000余大元想要彻底改善自己PC系统3D加速能力的玩家而言,想必前文的测试已经给出明确的答案:Geforce 8800 GTS 640MB超频版虽然硬件规格并不惊人,但却在普遍使用的高品质设定下有更好的游戏速度,并且功耗相对较低,不会给用户现有的电源供应器造成过多负担。

   Radeon HD 2900 XT倒也并非一无是处,除了特色的支持HDMI直接输出外,某些情况下它确实能够提供更快的游戏速度,但由R600体系架构决定的是,这种显卡更为依赖优秀成熟的驱动程序配合,至少目前的R600还处于威力未完全发掘的状态,Catalyst研发团队需要加把劲了。

    本文导航
    顶一下
    (0)
    0%
    踩一下
    (0)
    0%
    更多相关资讯
    文章评论查看所有评论
    请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
    评价:
    表情:
    评测热点TOP10