眼下已到8月末,而在9月10日,AMD新一代基于K10核心的四核心“巴塞罗那”处理器就将正式发布,而且是全球同步。由于时差的关系,事实上“巴塞罗那”在中国发布的时间比美国还要早。
玩家期待已久的K10架构处理器终于要进入量产化阶段了,服务器平台的产品出了,桌面平台的产品也就为时不远了。
那么K10处理器到底有哪些大的改进,其最大的亮点又是什么呢?为了将K10架构的风采展现给大家,接下来笔者就和大家共同分享一下。
在经过K7/K8时代的辉煌之后 AMD将迎来崭新的K10时代
事实上K10处理器作出的重大改进主要包括:1、SSE处理单元翻倍,这点与Core架构出现时一样。2、分支预测技术更为精准,这有点类似于英特尔当年针对Pentium M架构所做的改进。3、内存性能进一步提升,这主要得益于AMD采用集成内存控制器设计。4、加入三级缓存,减少数据同步延迟并有效降低能耗。
5、增加虚拟化技术,可使处理器中的物理内存地址和虚拟内存地址进行直接对话,从而获得最好的虚拟化性能。6、出色的能耗控制,配合制程工艺以及功耗控制技术的改进,AMD K10架构处理器将获得良好的性能功耗比,基本与K8架构水平相当。7、更好的投资保护及价值提升,一是方便用户升级,二来提高用户的满意度。下面笔者讲解得更细致一些,好方便大家理解。
第一、先来看SSE处理单元翻倍。这点主要是针对K8处理器来说,由于目前K8处理器仅支持64位SSE处理单元,而通常单个指令为128位长度,因此这就需要先拆分再处理,处理完毕后还要再组装成128位长度,显然延迟会大幅增加。而在K10平台,巴塞罗那处理器也开始引入128位SSE处理单元。这样以前要两个周期完成的任务,现在只需要一个周期就可以完成,效率大幅提升。
特性 |
当前CPU |
巴塞罗那核心 |
SSE执行宽度 |
64位 |
128位 |
指令预取带宽 |
16字节/周期 |
32字节/周期 |
数据缓存带宽 |
2 x 64位加载/周期 |
2 x 128位加载/周期 |
L2缓存/内存控制器带宽 |
64位/周期 |
128位/周期 |
浮点调度深度 |
36 dedicated x 64-bit ops |
36 dedicated x 128-bit ops |
SSE事实上就是英特尔提出的单指令多数据流扩展技术,对各种多媒体计算及应用都可以起到强化作用。当然对提高通用处理器的浮点运算能力也很有帮助,毕竟目前多数应用软件已经过渡到SIMD时代(单指令多数据流),SSE处理单元翻倍将会显著提升软件执行效率。
随着浮点运算能力的增强,K10核心的巴塞罗那处理器将在高性能科学运算以及多媒体编解压缩等方面拥有更出色的表现,值得期待。
[Page]
第二、分支预测技术改进。CPU所具备的分支预测技术的精准性,会决定该CPU构架最适合的流水线宽度和级数,对提升CPU核心效能很有帮助。K8架构之所以拥有出色的性能表现,全赖于其分支预测技术与架构的
搭配达到了非常和谐的效果。不过其并没进一切可能缩小预测数据的范围,这也就意味着有些即将用到的数据可能没有被提前预读取,后果是还要从内存或硬盘中调取数据。可想而知延迟会增加不少,从而无法更好发挥出CPU的核心效能。
那么怎样才能进一步缩小未预测数据的范围呢(即进一步提升核心效能)?其实英特尔在Pentium M构架中就已经做到了这一点,就是加入间接分支预测器,也就是所谓的乱序执行能力。早在英特尔NetBurst构架中,就已经见识到间接分支预测技术带来的好处,其帮助NetBurst构架的错误率降低12%,而在一些特殊应用中(253.perlbmk专项性能),错误率更是降低了55%,当然这也使英特尔在当时延续了其在多媒体性能方面的优势。
AMD K10巴塞罗那引入增强型分支预测
正因为间接分支预测能够进一步提升CPU的核心效能,因此AMD也将在K10架构的巴塞罗那处理器中引入该优化技术。不过AMD赋予这项技术更多、更新的理念,相信这也将是K10处理器制胜的关键所在。具体改进细则如下:
1.更高级的分支预测功能:AMD新架构增加了一倍返回堆栈容量,添加了更多分支历史比特数据,并且内建了一个512项的间接分支预测器(indirect branch predictor)。
2.32字节的指令预取。通过减少预取指令的分拆来大幅提升处理效率。
3.边带堆栈优化器(Sideband stack optimizer),堆栈优化将减少对单位带宽的占用。
其它改进还包括对转换旁视缓冲器(TLB) 的优化、附加的Fastpath指令、比特操作扩展和SSE指令集等等。
[Page]
第三、AMD K10架构巴塞罗那处理器对内存性能也做了进一步的改进。巴塞罗那处理器将继续采用集成内存控制器设计,而且可以让更多内存分页处于打开状态,即随时处于CPU调度范围之内。由于K10架构改进后的内存控制器支持48位硬件寻址能力,因此理论上可寻址256TB容量的物理内存空间。
这得益于其内存分页的管控能力提升至1GB/每分页,相比于之前的4KB/每分页和2MB/每分页拥有更高的利用率。目前,AMD已经向SPEC基准评测组织提交了最新的性能评估报告,报告的内容之一就是说Barcelona的SPECCint_2006_rates性能会比其他竞争产品提升25%以上。
巴塞罗那采用三级缓存架构
第四、AMD K10架构巴塞罗那处理器将采用三级缓存架构设计。或许有玩家认为这没什么大不了,因为就连英特尔奔腾4 3.46处理器也正式使用过。不过这里的三级缓存架构设计却有很大的不同。
首先,三级缓存对单核处理器来说帮助并不是很明显,这点已基本得到证实。其次AMD K10架构四核处理器引入的三级缓存架构,是在供给所有二级缓存共享的基础上搭建,也就是说其具备和英特尔Core架构共享式缓存一样的原理:即不再需要对四个核心共用的数据进行同步,而是共同在三级缓存中直接调用即可,这样就可以大幅减少延迟,进一步提高核心利用率。
第五、AMD K10架构巴塞罗那处理器将引入高端用户要求的虚拟化技术。其特点在于可使得处理器中的物理内存地址和虚拟内存地址进行直接对话,这样的话使得这个平台有最好的虚拟化的性能。巴塞罗那处理器的影子分页技术会与虚拟技术配合,变成虚拟地址转换,这样就可以把虚拟化管理器的影子页面管理时间保持在最短,从而提升虚拟化操作的效能。
[Page]
第六、AMD K10架构巴塞罗那处理器将引入先进的能耗控制技术。在配合制程技术提升的前提下,AMD将确保晶体管数量能够大幅增加,但却仍可以拥有更低的电压和发热量。
AMD功耗控制技术原理图
从目前AMD提供的资料来看,即使四个核心全速前进,AMD处理器的功耗控制水平将仍与K8处理器相当。当然如果巴塞罗那处理器四个核心中,只有一个全速工作而其余三个仅有33%工作的话,整体功耗将下降50%。而如果当四个中只有一个全速工作,另外三个中只有一个有33%工作的话,整体功耗将降至37.5%。效果还是相当不错的。
AMD K10架构处理器拥有众多技术改进
第七、AMD K10架构处理器还将为用户提供更好的投资保护及价值提升。即现有用户不需要更换平台即可升级至K10架构四核处理器,当然也就可以体验到更多先进的技术支持。当然最令玩家期待的还将是未来AMD平台出现的“K10处理器+RD790主板+R600(DX10)显卡”套装搭建方案,相信AMD还会为用户带来更多的惊喜。
总结:
在众人的期盼当中,K10架构巴塞罗那处理器终于快要浮出水面,其众多的技术改进及架构调整令用户心动不已。架构的变更也意味着巴塞罗那处理器在核心效能上更大的提升,由于K10架构承载了太多的使命,对于AMD公司来说又至关重要,因此巴塞罗那处理器的发布非常值得期待。同时也预祝K10架构四核巴塞罗那处理器能有更好的表现,这样最终受益的还将是广大的消费者。