处理器架构几十年来发生了翻天覆地的变化。AMD的新处理器架构已经设计出来有一段时间了,由于AMD没有透露性能方面的任何细节,目前还不清楚新架构是否存在问题和是否能继续保持很强的竞争力。
英特尔准备在12月正式发售自己的Kentsfield四核心处理器,相关主板厂商也已经做好了全面准备。看来这次英特尔又一次走在了前面。那么AMD的四核心架构究竟是怎样的呢?
我们目前确定的就是AMD已经将新处理器架构命名为巴塞罗那(Barcelona)。巴塞罗那虽然不是全新的架构,但也将是一个高度优化的AMD x86-64架构。新的优化是非常之多,而且有着很重要的意义。尽管没有更巨大的革命性意义,我们可以准确地说巴塞罗那对Opteron的进步就像英特尔的Core 2架构对Pentium M架构一样。虽然只是一小步,但是基于原有架构的新设计将把性能提升到一个崭新的高度。
现在就让我们进入到令人激动的AMD新处理器架构之旅吧。
首先我们了解到巴塞罗那将是下一代服务器和工作站Opteron CPU的核心架构。当然下一代桌面处理器也将基于该架构,但是细节上会有很多不同。不过目前AMD并未透露这些差别的详细信息。
目前四核心Opteron定位的市场包括两大块:高性能的科学计算,包括金融分析、石油勘探和生物科学等等;另外一块就是多媒体编解码,如制作HD-DVD影像、视频压缩和相关应用。
这两块市场的相同之处就在于都需要高性能的浮点运算能力。过去十年来应用软件已经过渡到了SIMD(单指令多数据流,即一个命令处理多个操作数)时代,所以AMD要做的事实际上就是不断增强心核心的SSE处理单元。SSE是英特尔提出的单指令多数据流扩展技术,对各类多媒体计算和应用都起到了强化的作用。
下面这个表格列出了巴塞罗那架构的改进与增强
特性 | 当前CPU | 巴塞罗那核心 |
SSE执行宽度 | 64位 | 128位 |
指令预取带宽 | 16字节/周期 | 32字节/周期 |
数据缓存带宽 | 2 x 64位加载/周期 | 2 x 128位加载/周期 |
L2缓存/内存控制器带宽 | 64位/周期 | 128位/周期 |
浮点调度深度 |
36 dedicated x 64-bit ops | 36 dedicated x 128-bit ops |
另外,新架构下SSE MOV指令可以在浮点运算的“store”管线中处理。新架构每周期可以处理2条SSE操作,移动一条SSE指令。具体的改进有点类似于英特尔的Core 2处理器。
巴塞罗那的基础构架做了很多增强调整
这些措施包括:
1.更高级的分支预测功能:AMD新架构增加了一倍返回堆栈容量,添加了更多分支历史比特数据,并且内建了一个512项的间接分支预测器(indirect branch predictor)。
2.32字节的指令预取。通过减少预取指令的分拆来大幅提升处理效率。
3.边带堆栈优化器(Sideband stack optimizer).堆栈优化将减少对单位带宽的占用。
4.乱序载入处理(Out-of-order load execution)。某些指令在实际运行当中可以绕过其他指令的处理,而且指令的存储也可以不按顺序进行,这在某些环境下对效率的提高有着很关键的作用。
其它改进还包括对转换旁视缓冲器(TLB) 的优化、附加的Fastpath指令、比特操作扩展和SSE指令集等等。
AMD对内存带宽也作了相应改进。巴塞罗那核心目前有独立的内存控制器,可以让更多的内存分页保持打开的状态。新核心支持48位硬件寻址,理论上将可以寻址256TB空间的物理内存。AMD加入了1GB内存分页,通常CPU的内存分页只有4KB或2 MB。
巴塞罗那核心拥有三级缓存架构。L1缓存为64KB,L2缓存为512KB,而L3缓存为2MB。这里L1和L2缓存是每个内核拥有的大小,而L3缓存是所有内核共享的大小。注意L3缓存的大小将是变化的,不同的产品型号可能拥有不同容量的L3缓存。L1和L2缓存是独占的,这同目前的Opteron处理器以及Athlon 64处理器基本一致。这也意味着在L1和L2缓存中不会存在同一数据的备份。AMD认为这种缓存架构对即将来临的虚拟化技术非常有益。
巴塞罗那采用三级缓存架构
AMD还增强了对虚拟化技术的硬件支持。最明显的改进就是将目前的影子分页技术变成了虚拟地址转换,这项技术会把虚拟化管理器管理影子页面的时间保持在最短。
今天越来越多的用户开始关心电脑硬件的功耗问题了。在这一问题上,AMD是一位勇敢的先行者,它在过去几年时间里为我们奉献了很多低功耗高效率的处理器精品。不过现在Intel已经赶了上来,衡量处理器的标准也变成了每瓦性能(performance per watt mantra)的高低。AMD必须在这方面不断创新才能保持自己的竞争优势。
首先,巴塞罗那核心是基于65纳米SOI工艺制造,所以在增加晶体管数量的同时它还可以拥有更低的核心电压和发热量。
新核心支持内核与内存控制器分离供电方案。这样一来,即使内存控制器处于忙碌状态,CPU内核却可以降低自己的电压。一些特定环境下该方案非常有吸引力,比如在一些需要大量内存带宽而只需要很少的CPU处理能力的情况下,可以大幅降低处理器功耗。这个方案同样也可以在需要的时候提升工作电压。在需要更高内存性能的时候,内存控制器将提高自己的电压并以更高的工作频率工作。
AMD的新武器还包括增强版本的PowerNow技术。之前的PowerNow技术允许一个处理器核心在需要时降低工作频率。而新版本PowerNow将允许多核处理器的单个内核在其他内核负载时降低自己的工作频率。需要注意的是此时单个内核并不能单独降低自己的电压,而是只降低工作频率。不过基本上结果是一致的,这将大幅减少可能的发热量。
AMD预期新的巴塞罗那核心的功耗最高不超过95W。一个双四核处理器系统,加上内存、芯片组的总功耗将在240W左右,这里不包括算上显卡和硬盘的功耗。
巴塞罗那核心并不像英特尔的Core架构对NetBurst架构那样具有革命性的改变。毫无疑问新核心将保持性能的持续增长,但是究竟能增长多少目前还无法确定。
年底之前,AMD将向大众展示基于巴塞罗那核心的PC系统,而CPU成品则要等到2007年中期发售。在这之前,我们还很难去评价它的性能如何。不过有一点可以确定的是新核心将在性能上超越目前的Opteron处理器。那么巴塞罗那是否快到足可以抵抗英特尔的Core架构处理器的大举进攻,两家巨头之间又将上演什么样的好戏,我们将在明年夏天揭开谜底。
由于AMD桌面产品要到2007年下半年才能出货,这就给了英特尔6到7个月的时间来保住他们四核心处理器的王座地位。或许AMD又要批评英特尔的Kentsfield不是真四核,只是把两个双核拼凑在一起了。不过事实上英特尔的四核也确实是简单地把两个双核Core 2处理器封装起来的产物。不过对于消费者们来说,这一点似乎并不会特别重要。