下一代内存技术发展趋势面面观


尽管在RDRAM失败之后Rambus公司就被业界所忽视,但内存业界最优秀的技术始终掌握在Rambus公司手中,早在2003年7月,Rambus公司就推出具有超高性能的XDR(eXtreme Data Rate DRAM)内存,主要定位于图形、游戏机和高清电视等领域,而在2005年7月,Rambus接着推出第二代的XDR2内存——无论哪一种产品,在技术上都远远超越同时代的DDR体系。遗憾的是,僵化的授权机制以及Rambus糟糕的商业推广,导致内存厂商对XDR内存视而不见,只有东芝公司在从事XDR颗粒的生产,由于规模较小,XDR的成本颇高,nVIDIA和ATI/AMD两大图形厂商都不愿意冒着大风险来支持XDR,XDR唯一成功的应用便是索尼的PS3游戏机。

在基本的架构方面,XDR继承了RDRAM的16bit位宽设计(DDR体系的模组都是64bit),虽然并行度只有DDR内存的1/4,但XDR内存总线可工作在2.4GHz、3.2GHz和4.0GHz的超高频率下,单条模组最高可提供8GBps的带宽;而由于单模组位宽较低,XDR系统可轻松支持双通道、四通道和八通道设计,换言之该系统所能提供的最高带宽高达64GBps——这个数字远远超越同时期顶级图形系统所采用的GDDR3技术,性能优势非常明显。

 下一代内存技术发展趋势面面观

 Rambus XDR内存在性能上远优于DDR体系


那么,XDR如何做到这一切?关键便是DRSL信号、ODR八倍率传输和Rambus FlexPhase电路等三项技术。DRSL的全称是“Differential Rambus Signaling Level”,意为“差分Rambus信号电平”,它是在LVDS(Low Voltage Differential Signaling,低压差分信号)信号技术的基础上发展而来。LVDS技术被应用于SATA、SAS(串行SCSI)、PCI Express、HyperTransport等高速串行总线中,它与传统信号技术存在本质性的不同:传统信号技术是用一条线路传输一个信号,通过信号高低电平来判断数值;而LVDS采用两条线路组成的线路对来传输一个信号,根据这两条线路的信号电平差值来判断数值是“1”还是“0”。如果处在干扰严重的环境下,两条线路的信号电平都会同时异常提高或异常降低,但它们之间的电平差值却可以维持相对的稳定,所传输的数据顺利为接收方接收,这就意味着LVDS具有很强的抗干扰性能。

XDR的DRSL信号与LVDS并没什么不同,只是DRSL拥有双向传输和单向传输两个版本,而LVDS在同一时刻只能单向传输数据。自然,DRSL拥有与LVDS类同的优秀抗干扰性能,即便在高频率下依然可保持稳定!另外,DRSL仅需要200mV电压即可驱动,自身功耗很低,对持续提高工作频率相当有利。

对于并行总线来说,要达到GHz的超高频率绝非易事——总线频率越高,信号同步的误差要求就越高,对布线的要求也就越苛刻(线路长度不同,信号到达的时间也不同,如误差过大,将导致数据传送失败)。但XDR就做到了这一点,幕后功臣便是FlexPhase电路技术,该技术为每一对并行线路都配备一个相位调节器,信号相位可按照1.4度(一周期360度,1.4度等于0.39%周期)的步幅进行调校,信号同步精度可以达到2皮秒(1皮秒=1×10-12秒),即便总线频率高达100GHz,FlexPhase技术也能够胜任。在它的帮助下,PCB布线的难度大大减轻,而FlexPhase的工作过程非常简单,在系统开机时FlexPhase控制器会自主扫描各条总线,根据反馈信息得出每一条线路存在相位差,并据此计算出正确的相位调校值,在数据传输开始时,这些预定的调校值便会开始生效。

DRSL信号与FlexPhase电路技术实现高频率的并行总线,让XDR内存可以获得超高带宽,而XDR内存自身也通过ODR八倍率传输技术来实现高性能——ODR技术可以让XDR的数据传输频率达到核心频率的8倍,如第一代XDR最高可工作在400MHz频率下,对应的数据频率便是3.2GHz,刚好可以同3.2GHz的16bit内存总线匹配,这一点类似于DDR3的8bit预取,不同之处在于XDR可以做到更高的核心频率。

2005年推出的XDR2在第一代技术基础上继续向前迈进,相对于第一代技术,XDR2主要有以下几个方面的升级:首先,XDR2的核心频率提高到500MHz,XDR最高为400MHz;其次,XDR2的寻址与控制命令总线频率从800MHz大幅度提升到2GHz;再者,XDR2支持16倍数据速率(HDR,Hex Data Rate),数据传输频率达到核心频率的16倍,也就是可达8GHz,每个数据引脚可提供8Gbps的数据传输率。标准XDR2内存的设计位宽仍为16bit(可以像XDR那样动态调整位宽),这就意味着单通道XDR2系统的数据带宽就可达到16GBps,双通道32GBps,顶级的八通道系统可提供高达128GBps的惊人带宽!第三,XDR2引入了Micro-Threaded架构,该架构可以有效提升小数据量、频繁随机访问应用时的内存效率,3D图形渲染、流计算、海量网络数据处理等应用可以明显受益——毫无疑问,XDR2的技术水平超越了这个时代,Rambus公司虽然未能在商业上取得成功,但它的顶尖实力为业界所公认。

索尼在PS3游戏机中成功地采用了XDR内存,凭借XDR的卓越性能表现,PS3中的CPU与GPU得以充分发挥运算力,并成为性能最佳的游戏主机。由于IBM的Cell处理器所整合内存控制器直接支持XDR,这就意味着所有基于Cell芯片的计算平台都将采用XDR体系的内存产品。不过PC工业显然对此熟视无睹,当年Rambus RDRAM所造成的伤害还难以令人忘记,加上Rambus失道寡助,与内存厂商频频专利诉讼使之无法获得足够多的支持,最终导致XDR一直都处于一种边缘化的状态。不过,XDR的卓越性能令人难以拒绝,英特尔公司也没有放弃未来采用XDR的可能,但这一次它显得非常慎重——在2007年11月份,Rambus宣布与英特尔签署了一份合作协议,以探寻XDR内存技术进入英特尔计算系统的可能。在这份合作案中,Rambus将提供部分特定技术和设计资源,并交由英特尔在半导体技术层面进行评估,但英特尔仅仅是评估未来XDR技术的可能用途,暂时没有将其投入实际产品的计划。

Rambus封闭的作态以及糟糕的商业化运作,令XDR很难拥有光明前途,内存工业也都聚拢在JEDEC的周围,除非未来Rambus能够永久性开放技术授权,否则XDR很难获得大面积的应用,但它的设计思想将为DDR体系的未来版本提供足够多的借鉴——事实上,JEDEC即将发布的DDR4内存就从Rambus XDR中汲取了足够多的灵感,换一个角度来看,就是DDR4将面临着侵犯Rambus XDR技术专利的风险。无可比拟的技术优势让许多业界巨头都觊觎Rambus,英飞凌(Infineon)、SUN微系统公司、三星公司都动过要收购Rambus的念头,英特尔应该也动过这个主意,但也许是Rambus开价过高导致收购无法实现——假如英特尔未来能将Rambus收归旗下,那么凭借在平台上的主导地位,将有很大的机会成为内存标准的主导者。

CPU架构的变化期待高传输速率DRAM
无论英特尔还是AMD,都认为未来PC平台的发展瓶颈将在存储器上,存储器技术已经无法跟上多核心处理器对于数据传输的高要求。单核处理器时代并无这样的困扰,因为单核处理器只是以单线程进行任务,单个任务所需要的数据量较为有限,内存带宽并不会成为瓶颈,只是对存取延迟较为敏感。但多核处理平台就并非如此,伴随着核心数量的增加,多线程性能变得越来越重要,多个CPU核心要求都能够迅速获得数据——多个任务量所需的数据显然要大大超过过去的单线程任务,这就要求内存带宽必须要有成倍成倍的增长才不至于拖CPU的后腿。
这种情况将在混合处理器到来之后变得更加严重,混合处理器同时集成了CPU与GPU,GPU负责图形运算时对内存带宽的高要求众所周知,若内存系统无法提供足够的性能,那么整套系统也因此被拖累。而如果未来的多核CPU的计算能力达到1TFLOPS,那么就需要100GBps以上的带宽才可满足运算要求,以128bit双通道计算,要达到这样的带宽就需要内存的每引脚数据传输率达到6.4Gbps——鉴于严峻的现实需求,英特尔不得不重新考虑应用XDR技术的可能,因为XDR是目前唯一能够满足此要求的内存技术。

[an error occurred while processing this directive]