热点推荐
ZOL首页 > 商用及工作站 > 工作站 > IBM“细胞”处理器Cell:不止是游戏CPU

IBM“细胞”处理器Cell:不止是游戏CPU


赛迪网 责任编辑:褚士玮 【转载】 2008年02月21日 06:00 评论

  这款IBM、索尼和东芝2001年联手研发的处理器“细胞”,将像细胞一样,渗透到未来数字生活的方方面面。


IBM“细胞”处理器Cell:不止是游戏CPU

  Cell发布之初,人们以为它仅仅是SONY下一代游戏机PlayStation3的特制处理器,而随着时间的推移这个观点的错误性日渐明显——Cell完全可以应用在诸如大型服务器工作站、桌面/便携电脑、网络设备、HDTV电视机和数字录像机等其他电子产品中。

  是什么样的架构似的Cell处理器有着如此神通广大的本领呢?Cell处理器的现状又如何?

一个“细胞”的微结构

  Cell处理器与日常使用的处理器在构架上有较大的区别,在这个块芯片中主要包含了一个64位多线程IBM PowerPC和8个独立32位SPE(Synergistic Processing Element,协作处理)单元,PPE(PowerPC Processing Element)与SPE之间通过一个名为EIB(Element Interconnect Bus)总线连接起来。Cell通过两条不同接口进行数据的读写操作——XIO(XDR I/O Cell)与MIC(Memory Interface Controller)将会一起集成到一种定制的名为XDR ASIC(Application Specific Integrated Circuit,特定用途集成电路芯片)之中,起控制XDR内存芯片并与之进行数据交换的作用;而FlexIO接口则与系统的其他周边部件连接。下文部分我们将较为详细地叙述各部分细节内容。

  PPE是一款衍生于PowerPC架构的单元,PPE在物理特征上有很多与PowerPC相同——PPE同样为一款64bit多线程处理单元、拥有512KB二级缓存和集成VMX指令处理单元等。8个SPE单元都是Cell处理器SoC(System-on-Chip)结构中的重要组成部分,其中包括了自己完整的计算单元,是专门为处理多媒体SIMD(Single Instruction, Multi Data)指令数据而设计的。其中,VMX指令单元显得不是那么合适,原因在于VXM指令单元所能够处理的字节长度仅仅为32bit单精度浮点或者数据。好在SPE里面整合了针对Streaming最佳化的构架,能够采用并行处理的方式,使得同一时间能够处理128bit长度的指令。SPE单元将独享256KB的Load Store单元,而整个256KB的Load Store单元由4个大小为64KB的Load Store单元组成。Load Store存储单元为完全独立的部分,其地址空间与其他地址空间完全分离。简单来说,我们可以将Load Store储存单元理解成为处理器中的缓存,由于Load Store的加入可以使得SPE性能得到大幅度提升。

  EIB总线由4条128bit带宽的数据通道组成,在这4条通道中,相邻的通道之间数据传输方向为不同的。根据物理知识知道,这样的设计可以大大减小数据通道之间的信号干扰。需要指出的是,EIB总线中的数据通道只能为平行或者垂直的,这样的设计原因也是为了减小总线中的信号干扰。

  当Cell处理器采用单精度模式运算时具有了256GigaFLOPS的成绩,就算采用了双精度模式的运算性能也达到了25~30GigaFLOPS。为了能让Cell处理器发挥出应有的性能,必须选用一条同样具有高性能的内存系统。而Rambus公司的XDR内存系统则可以担此大任。MIC控制器能够控制两组内存通道,而每一组通道能够支持36个设备连接到同一控制器以及地址总线,而每个设备的数据总线通过一组双向点对点连接到内存控制器并且每一组点对点数据通道具有3.2Gbps带宽。这样当一组内存通道连接上两个DRAM时,一组内存通道就可以提供高达12.6GB/s(2X16X3.2Gbps)带宽,而两组内存通道就可以提供25.2GB/s带宽,完全可以满足Cell处理器的需求。由于XDR内存系统所特有的性质,ECC设计上也就不再局限于芯片本身而是在于XIO所控制的内存芯片集合。而Cell处理器中的MIC控制器则能够支持ECC功能,这样的设计使得Cell完全可以适应于大型服务器等对稳定性要求较高的领域。

  FlexIO则负责了Cell处理器与系统其他部分的联接工作,该接口同样是由Rambus公司提供,其最大带宽达到了76.8GB/s。FlexIO是由12条数据通道组成的接口,每一条数据通道位宽为8bit而且都采用了点对点的设计。但是值得注意的是,这12条数据通道并不是采用对等的设计——在这12条数据通道中,有7条为向外传输数据的通道,带宽达到了44.8GB/s;剩下的5条为向内传输数据的通道,带宽也都达到了32GB/s。

“进化”

  在ISSCC 2007论坛上,IBM宣布实现了可运行在6GHz频率下的Cell处理器!更让人称道的是,Cell处理器达到如此惊人频率的同时,并没有采用各种极端的散热方法。与此同时,IBM和SONY还在大会上共同宣布Cell处理器将会很快转向65纳米制程,同原本90nm的Cell相比,新的65nm版本使用SOI绝缘硅技术制造,体积更小、耗电量也更低,有利于节省成本——iSuppli分析认为,PS3现在所用的Cell处理器成本高达89美元,是整台机器中第三贵的部件,而采用65nm工艺制成以后其成本将降至60美元甚至更低。除了制程的更新以外,Cell处理器在设计上也有了一定意义上的改良,采用双供电SRAM阵列。除了普通意义上的处理器供电电路(Vdd),65nm Cell专门为L1、L2缓存设计了第二路供电线路(Vcs),提高了稳定性。SONY还预计Cell处理器将在2009年转入更高级的45nm工艺,进一步降低其成本让Cell处理器的应用更为宽广。

  不仅在生产工艺方面,在应用方面“细胞”也得到了进化。最为典型的便是Cell处理器不再仅仅是一个游戏机芯片了,Cell处理器强大的运算能力,让PS3加入Folding@home计划,在其中会专门列出一项新的计划名为Cure@PS3——当PS3开机但却被闲置的时候,它会从网上下载数据包,来计算蛋白质的折叠过程,并将结果反馈给斯坦福大学,帮助专家们研究阿兹海默症(Alzheimer's),疯牛病(Mad Cow, BSE),可传播性海绵状脑病(CJD),肌萎缩性脊髓侧索硬化症(ALS),帕金森氏症(Parkinson's)等疑难杂症。此外,IBM公司和美国著名的医学教研机构Mayo Clinic合作,Mayo Clinic使用搭载Cell处理器的IBM BladeCenter刀片服务器系统,尝试对CT机、核磁共振机拍出的图片进行配准的工作,使用Cell驱动的刀片服务器系统,可以让这一大运算量图像处理工作大大加速。

  在Mayo Clinic和IBM的测试中,使用传统系统对98组透视图片进行配准总共需要耗费7个小时,而使用IBM的BladeCenter QS20系统和专为Cell优化的配准软件,完成同样工作则仅仅需要516秒,不到10分钟,这对急诊病人和加快诊断流程无疑优势巨大。而且SONY也计划在2008年推出基于Cell处理器的家用电器,东芝也将推出基于Cell处理器的掌上设备。索尼电脑娱乐(SCE)公司董事长Ken Kutaragi日前在接受媒体采访时对Cell处理器充满信心。Ken Kutaragi表示,目前针对游戏机使用,Cell处理器集成了8个SPE处理核心,但是针对家庭应用,Cell处理器当中的SPE核心将有可能减少到2个。同时,Ken Kutaragi认为,集成2个SPE核心的Cell处理器便可应付家庭应用程序和产品的需求。

给文章打分 5分为满分(共0人参与) 查看排行>>
频道热词:云计算  服务器  服务器  
视觉焦点
TOP10周热门工作站排行榜
  • 热门
  • 新品
查看完整榜单>>