(转文)超算怪兽来了:Xeon Phi联手Tesla、Cray打造新一 ...

来源:百度文库 编辑:超级军网 时间:2024/05/01 05:04:30
原文链接:http://www.expreview.com/20817.html
--------------------------------
原文:



  Cray公司是世界知名的超级计算机厂商,在HPC相关的技术研发上有很强的实力,Intel为了进一步打开HPC市场的大门早前宣布收购Cray公司部分资产,如今Intel的投资得到回报了,Cray公司下一代超级计算机“Cascade”(瀑布)将使用Intel专为HPC市场推出的Xeon Phi处理器,不过获胜的不止是Intel,还有NVIDIA公司基于下一代Kepler架构的Tesla加速卡。

  Cascade计算机的目标是将实际应用的速度维持在数千万亿次(multi-petaflops),与TOP500排名使用峰值速度明显不同。这么强大的计算机显然不是普通公司所需要的,它是在美国能源部下属的能源开发计算中心投资4000万美元的支持下开发的,主要用于环境科学、混合能源、天体物理及其他科学研究。

  再来看一下Cascade的两大构成,Xeon Phi是Intel使用MIC多核架构设计的,A0步进有48、52及60核心版本,显存频率约为2.4-4.5GHz,B0步进则有57、60及61个核心,显存频率也提高到了5-5.5GHz,单精度浮点性能约为2.2TFLOPS,双精度约为1.1TFLOPS。

  至于提到的下一代Kepler架构Tesla卡,虽然没有详说,不过不大可能是GK104核心的K10,因为它的双精度浮点性能太低,只有0.195TFLOPS,GK110架构的Tesla K20可能性更大,毕竟它单精度、双精度浮点性能分别有4.9TFLOPS、1.6TFLOPS。

  NVIDIA公司Tesla商业部门高级总监Sumit Gupta称Cascade是世界首款集成三大关键技术的计算机,除了上述提及的Xeon Phi和Tesla加速卡之外还有Cray公司的Aries互联架构,不论处理器是否支持都可以使用高速PCI-E 3.0通道传送数据。原文链接:http://www.expreview.com/20817.html
--------------------------------
原文:



  Cray公司是世界知名的超级计算机厂商,在HPC相关的技术研发上有很强的实力,Intel为了进一步打开HPC市场的大门早前宣布收购Cray公司部分资产,如今Intel的投资得到回报了,Cray公司下一代超级计算机“Cascade”(瀑布)将使用Intel专为HPC市场推出的Xeon Phi处理器,不过获胜的不止是Intel,还有NVIDIA公司基于下一代Kepler架构的Tesla加速卡。

  Cascade计算机的目标是将实际应用的速度维持在数千万亿次(multi-petaflops),与TOP500排名使用峰值速度明显不同。这么强大的计算机显然不是普通公司所需要的,它是在美国能源部下属的能源开发计算中心投资4000万美元的支持下开发的,主要用于环境科学、混合能源、天体物理及其他科学研究。

  再来看一下Cascade的两大构成,Xeon Phi是Intel使用MIC多核架构设计的,A0步进有48、52及60核心版本,显存频率约为2.4-4.5GHz,B0步进则有57、60及61个核心,显存频率也提高到了5-5.5GHz,单精度浮点性能约为2.2TFLOPS,双精度约为1.1TFLOPS。

  至于提到的下一代Kepler架构Tesla卡,虽然没有详说,不过不大可能是GK104核心的K10,因为它的双精度浮点性能太低,只有0.195TFLOPS,GK110架构的Tesla K20可能性更大,毕竟它单精度、双精度浮点性能分别有4.9TFLOPS、1.6TFLOPS。

  NVIDIA公司Tesla商业部门高级总监Sumit Gupta称Cascade是世界首款集成三大关键技术的计算机,除了上述提及的Xeon Phi和Tesla加速卡之外还有Cray公司的Aries互联架构,不论处理器是否支持都可以使用高速PCI-E 3.0通道传送数据。
看到一篇老外的评测,这个没以前intel吹的那么猛。

代码得从新编译,指望MPI程序能直接在上面跑是不可能的。

想调优,还是调用专有的指令集。不比现在使用cuda的GPGPU计算好多少。

没有了软件兼容性,那么这计算速度也就没啥吸引力了。
automation 发表于 2012-8-19 10:55
看到一篇老外的评测,这个没以前intel吹的那么猛。

代码得从新编译,指望MPI程序能直接在上面跑是不可能 ...
也是有优势的,一个是核心数不像Tesla那么多,一个是x86架构还是比CUDA更容易接受。
Xeon Phi规格新说:62核、更高的1.3GHz频率
http://www.expreview.com/20860.html
-----------------------


  Xeon Phi虽然还没有最终完成,但是已经获Cray公司青睐用以打造新一代超级计算机“Cascade”,当然同期选中的还有NVIDIA公司的Tesla加速卡。为了匹敌甚至击败NVIDIA的GK110架构计算卡,Intel也在不断提升Xeon Phi的规格。

  Xeon Phi使用了Intel的MIC多核架构,早期的A0步进有48、52及60核心版本,显存频率约为2.4-4.5GHz,B0步进则有57、60及61个核心,显存频率也提高到了5-5.5GHz,核心频率为1.05-1.1GHz。

  按照B0步进的能力计算,其双精度浮点性能已经达到了1TFLOPS,与AMD最新推出的FirePro W9000专业卡相同,虽然前者配置是8GB 512bit GDDR5显存,后者配备的是6GB 384bit显存,不过AMD的W9000支持PCI-E 3.0标准,Intel的Xeon Phi暂时还只支持PCI-E 2.0,折抵之下二者各有胜负。

  Xeon Phi真正的对手是NVIDIA GK110架构的Teska K20,虽然后者还没有准确的规格信息,但是双精度浮点能力据悉可达1.5TFLOPS,为此Intel还要进一步加强Xeon Phi的规格。

  VR-Zone报道称Xeon Phi的核心数将达到62个,而运行频率也显著提高到1.3GHz,性能差不多提升20-30%的样子,对于TDP功耗近300W的显卡来说如此幅度的提频难度可不小。

  另外,VR-Zone还谈到了Xeon Phi的另一个优势,原文称中国及新加坡的专家认为Xeon Phi上的编译器要要比CUDA环境下的效率明显要高,如果Intel把QPI总线也带到Xeon Phi上,它也可以像标准版Xeon那样共享系统内存,那么领先优势还会更大。
也是有优势的,一个是核心数不像Tesla那么多,一个是x86架构还是比CUDA更容易接受。
不明白核心数少为什么是优势?

至于X86架构,建议读读NV的博客
blogs.nvidia.com/2012/04/no-free-lunch-for-intel-mic-or-gpus/
虽然比较老了,但是观点并不过时,核心思想在于X86体系结构并不会带来较少的工作量。

这可算是NV的官方态度吧。还没有看到INTEL的反驳。
guanlong 发表于 2012-8-22 17:10
不明白核心数少为什么是优势?

至于X86架构,建议读读NV的博客
核心少,线程少嘛,每核心分到的资源更多了。

x86是大家都熟悉,主要是这个。
核心少,线程少嘛,每核心分到的资源更多了。

x86是大家都熟悉,主要是这个。
超算靠的是大规模并行计算,在满足内存和通讯带宽的条件下,计算核越多越好。xeon phi 本质上是把多个为超算优化过的pentium核集
成到一个die上,好处是资源管理容易,坏处是系统优化的不彻底,与直接计算无关的逻辑太多。gk110也不彻底,但比xeon phi的程度深的多。

就这么说吧,我认为在超算的金字塔顶端,knight' corner以目前的体系结构无法取代gpu加速,但在塔身有可能获得大块市场。
guanlong 发表于 2012-8-22 18:42
超算靠的是大规模并行计算,在满足内存和通讯带宽的条件下,计算核越多越好。xeon phi 本质上是把多个为超 ...

不是“计算核越多越好”,恰恰相反,是同等计算能力下计算核心越少越好。线程越多,软件编写越困难。

Xeon Phi用的是512bit SIMD+FMA,非常适合超算应用。
俄罗斯参赛:
http://news.mydrivers.com/1/238/238668.htm
------------------------------
俄罗斯开始制造最新超级计算机
2012-08-23 09:20:03

俄罗斯科学院日前宣布开始制造本国性能最强的超级计算机,其浮点运算速度将达到每秒1万万亿次。目前,世界上只有美国和日本拥有同级别性能的计算机。

南方都市报援引俄《消息报》报道称,俄科学院跨部门超级计算机中心将在今年年底前安装新计算机的首批两台机柜(每台造价约为140万美元),使其运算速度暂时先达到2千万亿次,这已超过俄目前性能最强的计算机“罗莫诺索夫”,后者的运算速度为1 .7千万亿次。新计算机最终将由54台机柜组成。

跨部门超级计算机中心副主任鲍里斯·沙巴诺夫说,俄目前已经拥有制造万万亿次级超级计算机的技术,在资金到位的前提下,新计算机预计将于2013年建成并达到1万万亿次的运算速度。但考虑到各国在IT领域的技术竞争十分激烈,等到俄新计算机最终成型时,它恐怕已无法进入世界计算机性能排行榜的前三位。

目前,美国的IBM“红杉”和日本的“京”以1 .632万万亿次和1 .051万万亿次的运算速度在该排行榜上占据前两位。鉴于此,俄超级计算机将主打节能牌,研发者将确保其占据绿色超级计算机500强排行榜(G reen 50 0 )的第二名,仅次于IBM公司研制的“蓝色基因/Q”。

俄罗斯从2009年起加入世界超级计算机研发大战。提出这一要求的是时任俄总统梅德韦杰夫。他认为,一个国家如果没有超级计算机,“就无法生产出有竞争力的产品”。不过,也有专家对这场高科技竞赛不以为然。《开放系统》杂志总编列昂尼德·切尔尼亚克认为,研制超级计算机通常只是为了创造工业纪录,为国家炫耀高科技成就提供一个理由,但这些机器并不能为完成重大战略任务提供实际帮助。