图形领域GPU标准之战逐鹿并行计算


AMD在2006年就推出了基于R580 GPU(即为Radeon X1900)的流处理加速卡,R580虽然没有采用统一渲染架构,但之前的ATI在设计时已经为此作好了准备。AMD流处理加速卡与nVIDIA Tesla类似,两者都搭载了高于显卡的大容量内存,只是AMD的产品属于上一代架构。伴随着R600 GPU的推出,AMD流处理加速卡也将进入一个新阶段:R600拥有多达320个并行处理内核,浮点性能达到每秒470GFLOPS,比nVIDIA G80略低一些,但它同样可归属于顶尖产品之列,预计不需太长时间,AMD便会推出基于R600的新一代流处理加速卡。

nVIDIA为Tesla推出了完整的CUDA软件开发平台,帮助开发者快速开发出相应的计算程序。相比之下,AMD只为客户提供CTM瘦硬件接口,允许开发者直接访问GPU的原生指令集和存储器,以便发挥出GPU的流计算能力。问题在于,CTM仍然属于硬件接口之列,开发者必须深入了解硬件才能够开发出相应的计算程序,这项工作显然过于复杂了。因此尽管AMD流处理器推出在先,也获得包括GraphStream公司、PANTA Systems和Rackable Systems公司在内的支持,但并没有获得多少科研机构的采用,主要原因就在于为AMD流处理器平台编程的难度较高,而nVIDIA Tesla显然是更理想的选择。

AMD流处理计划的另一个障碍就是GPU硬件的限制。R600被认为是一个失败的案例,它集成了高达7亿枚晶体管,能耗超过230瓦,而计算性能却明显不如nVIDIA的 G80,后者只用了6.9亿晶体管和140瓦的功耗。AMD意识到R600架构难以与对手匹敌,为此将希望放在下一代R700上面,根据AMD的构想,R700将是GPU史上最富革命性的产品—R700摆脱了现行GPU单芯片的做法,走向多芯片体系,R700基本结构相对简单,性能相当于主流GPU产品,具有低功耗、制造良品率高等优点,同时R700具有高效的多芯片协作能力,即通过多芯片的组合,AMD可以衍生出高端、主流和低端产品。这种设计方案的优点在于快速过渡和低成本,我们知道,现行的GPU开发模式都是首先开发最高性能的版本,然后以此为基础依次衍生出主流和低端型号,但两者往往有长达半年的时间差,而且不同型号的GPU芯片无法共享生产资源,很容易因良品率低问题导致高成本。R700将扭转这一不利局面,AMD只需要设计并制造出R700一种GPU芯片,就可以同时推出高端(例如可集成8枚GPU)、主流(可集成4枚、2枚GPU)和低端(1枚GPU)等完善的产品线,保证在时间上的领先。如果对手的产品性能强悍,那么AMD只要通过调整芯片数量就能够再度获得领先,这种极富弹性的架构可以确保AMD在图形领域保持自己的竞争力。同时借助R700的力量,AMD可以构建起一套完善的协处理器加速平台,与英特尔和nVIDIA分庭抗礼。

然而,即便R700计划能够获得成功,AMD在高并行性计算领域也有自己的问题:英特尔通过X86指令扩展意图建立自己的标准,nVIDIA则已提供完善的CUDA软件平台并获得用户的支持,AMD只是拿出简单的CTM瘦硬件接口,光是软件开发的复杂度就令人望而生畏。可以预见,伴随着高并行计算领域竞争的白热化,AMD如果无法及时赶上就会有被抛弃的危险,毕竟标准之争高于一切。

[an error occurred while processing this directive]

相关文章