AMD新一代处理器发展路线图


严格意义上讲,K10并不是一种全新的架构,它最初的名称是K8L,仅是K8架构的深度改良版。在2009年,AMD终于将推出代号为Bulldozer和Bobcat的新一代微架构,前者面向10-100W TDP的PC与服务器市场,作为现行K10的接替者,尽管AMD没有公开表明,但Bulldozer的代号序列其实就是K11,它也是AMD自2001年推出K8后,时隔8年推出的新一代微架构。Bobcat则定位于1-10W TDP市场,主要针对UMPC和嵌入市场。

Bulldozer不再是K8/K10基础上的小修小改或者所谓的“深度修改”,它完全是一种重新设计的新架构,当然K8/K10的一些成功的设计元素也被保留。首先我们来看Bulldozer微架构本身,它采用超标量体系架构,但指令解码能力尚未披露,或许AMD有能力做到像英特尔酷睿架构一样的4路解码,但也有可能维持现行的3路解码体系。其次,Bulldozer将拥有更深的管线,这意味着它将会拥有更高的工作频率,同样由于保密原因,我们还未知晓Bulldozer处理管线的深度数字。微架构的改进将让Bulldozer具有更出色的每瓦性能,也就是能拥有更佳的能源效率。

Bulldozer架构的另一个关键创新就是将采用名为“SSE5”的新一代多媒体指令集。SSE(Streaming SIMD Extensions)是一种支持X86架构的单一指令多重数据(Single Instruction, Multiple Data, SIMD)指令集,它的功能就是利用特殊的指令来一次处理多笔运算,借此达到提升性能的目的。第一代SSE指令集由英特尔在1999年推出,并先后发展到SSE2、SSE3以及未来的SSE4,每一代指令集都在上一版本的基础上引入新的指令;与SSE相对的是AMD的3D Now!指令集,AMD后来也对自己的指令集进行扩展提升,使之能够兼容英特尔的SSE指令集,这样那些为SSE做优化的程序也能够在AMD平台中高效率运行。而在Bulldozer架构的指令集上,AMD显然玩了一个花招,即不再沿用过去的3D Now!命名,而是直接将名称更改为“SSE5”。这种做法显然让英特尔气愤难平,因为SSE是英特尔指令集的专属命名,且目前SSE指令集只发展到第四代,即便是2008年下半年推出的Nehalem也只采用SSE4,而AMD以釜底抽薪的方法夺下SSE5这个命名,很容易给市场造成英特尔SSE4比AMD SSE5落后一代的误解!尤其不幸的是,由于英特尔未给SSE的名称申请商标保护,所以暂时也对AMD无计可施。

我们抛开这些商业口水因素不言,来看看AMD的SSE5指令集有哪些不凡之处,具体点说,SSE5是128-bit指令集,一共有170条指令,其中基础指令64条,新增的最重要的有两条:“三操作数指令(3-Operand Instructions)”与“熔合乘法累积(Fused Multiply Accumulate)”,前者允许将多个简单指令汇整为一个指令,以实现更有效率的运行——这在功能上实际相当于英特尔酷睿微架构中的“宏操作融合”技术,所不同的是“宏操作融合”只能合并两条简单指令,而AMD的SSE5能够将三条运算指令合二为一,实现与RISC架构相等的效率。“熔合乘法累积”的功能与之类似,它可以将乘法与加法指令结合起来,借助单一的指令来执行多笔重复的计算,以达到更高的效率——准确点说,这一功能对于系统的3D渲染、图像处理、音频/视频编辑、向量计算等高密度计算场合都可发挥效用。与其他指令集一样,SSE5要求得到软件的支持,而AMD提早一年将其发布,让软件开发业者及早作好准备,等到Bulldozer推出时SSE5的实际潜力即可获得充分发挥,这种做法无疑比英特尔在推出处理器时才公布指令集的做法来得高明。

Bulldozer将采用原生4核结构,AMD未公布其缓存方案,但从过去透露的技术路线来看,不排除Bulldozer改用共享式二级缓存的可能。AMD还计划推出8核心、16核心的高端版本,但这两者很有可能采用多芯片封装而成,以降低核心数量翻番带来的技术难度。在连接架构方面,Bulldozer继承了K8/K10成功的集成内存控制器+HT直连总线方案——显然,Bulldozer将全面支持DDR3内存,而到时DDR3内存的价格也将滑落到可与DDR2竞争的区间;对于Bulldozer的服务器版本,FB-DIMM内存将不再被支持,而是将采用AMD自己的一项被称为“G3 Memory Extender(G3MX)”的内存技术。这种变化主要是由于FB-DIMM在使用环境下的不佳表现所导致:在FB-DIMM内存系统中,随着内存模组数量的增多,内存频率将无法得到保持,另外FB-DIMM的缓冲芯片不仅带来更高的成本和更高的功耗,而且也令内存延迟非常可观。与之不同,G3MX内存虽然也采用缓冲技术,但缓冲芯片位于主板与CPU的内存控制器之间,这种方式对于性能与功耗的负面影响要小于FB-DIMM,而且G3MX技术只对主板设计提出要求,不需要内存模组作出什么改变,可以很小的代价实现迁移。G3MX内存暂时只出现在高端服务器和工作站上,AMD暂时还没有将它引入桌面和移动平台的想法。

Bulldozer的对外连通能力将获得显著加强,它拥有多达4个HT 3.0控制器(目前的Barcelona只支持3个HT 3.0控制器),这意味着Bulldozer可以构建更为强大的多路计算系统,不仅如此,Bulldozer还直接集成了一个PCI Express 2.0控制器,虽然其能力较为有限,但已可以让许多小系统产品不再需要北桥芯片,直接将I/O南桥挂接到处理器上即可,整套系统也因此变得更为紧凑。

提升每瓦性能同样是Bulldozer的终极追求,根据AMD的介绍,在PC和笔记本电脑领域,Bulldozer架构产品的每瓦性能大约是Barcelona的1.3倍,也就是每瓦性能提升30%,而在服务器和高性能PC,Bulldozer架构产品的每瓦性能则达到Barcelona的1.5-2.0倍,并有望成为“有史以来最高性能的单线程和多线程计算核心”—即便英特尔的Nehalem能够在现行酷睿体系的基础上前进一大步,也很难保证能够拥有对Bulldozer的显著优势,从这些方面来看,我们很乐观地预计Bulldozer将与Nehalem展开一场势均力敌的竞争。
[an error occurred while processing this directive]