为什么天河系列超算在市场上不成功?

来源:百度文库 编辑:超级军网 时间:2024/04/29 15:21:47


先不说TH系列卖出去多少,就连已经安装的TH-1、TH-1A、TH-2小时利用率都不是很高;为什么呢?

我们先来看看TH系列的沿革:
TH-1:Xeon E5540+HD4870X2
TH-1A:Xeon X5670+Tesla M2050
TH-2:Xeon E5-2692v2+Xeon Phi 31S1P
第一代基本属于玩票,HD4870X2显然不适合24×7的高强度应用;客观上说AMD那会儿对GPGPU也不怎么上心
第二代推翻了第一代的技术路线换上了M2050,并且得到了NV的大力支持(那会儿Tesla还在推广期);但是……
第三代又是重头再来,这会儿真正悲剧了……Xeon Phi 31S1P在INTEL的定位就是小白鼠(第零代,类似于EVA-00),严格来说Knights Landing才是真正具有市场价值的第一代Xeon Phi(基础架构彻底另起炉灶)
TH-2A的协处理器预计将升级为Knights Landing(TH-2的拓扑结构似乎已经没有扩大系统规模的余地,更何况也找不到更多的Xeon Phi 31S1P了),那么问题来了……Knights Landing首先定位为可互换插槽的协处理器(传统协处理器走PCIE总线,带宽瓶颈非常严重),而这一版本的Knights Landing显然TH-2是装不上的,那么就只有INTEL假惺惺的向下兼容版Knights Landing能用了(偏偏这货就不是为走PCIE总线设计的,带宽瓶颈对其造成的性能限制远比一般协处理器严重得多)--当然我大天朝有的是钱,连主板、CPU、内存…一起扔掉换新的就没这问题了(可惜最根本的问题没解决)

现在假设你是一位HPC用户,我们知道,面向GPGPU的编译优化是非常困难的:

TH-1的应用程序几乎不可能移植到TH-1A上,CAL和CUDA完全是两个体系(不知道这会儿的OpenCL能不能提供一些帮助,不过已经没有任何意义了)

那么TH-1A向TH-2移植呢?INTEL携ICC表示不高兴(当然想象力够的话可以试试GCC,谁知道呢)

TH-2和TH-2A总算是一家公司的解决方案了吧?它们的共同点大概也就是INTEL出品(这还是在TH-2A选择保守版升级方案的前提下),不过ICC好歹算是提供了理论上的可能性,不考虑好不好用的话

……

有没有一种彻底被耍了的感觉?



最后多句嘴:未来多半属于简单同构Many-Core,并且ARM阵营有极大可能性异军突起(比如AppliedMicro X-Gene 128core ARMv8);不能解决易用性,异构计算终归只是看上去很美(哪怕是IBM的POWER9+Volta)

先不说TH系列卖出去多少,就连已经安装的TH-1、TH-1A、TH-2小时利用率都不是很高;为什么呢?

我们先来看看TH系列的沿革:
TH-1:Xeon E5540+HD4870X2
TH-1A:Xeon X5670+Tesla M2050
TH-2:Xeon E5-2692v2+Xeon Phi 31S1P
第一代基本属于玩票,HD4870X2显然不适合24×7的高强度应用;客观上说AMD那会儿对GPGPU也不怎么上心
第二代推翻了第一代的技术路线换上了M2050,并且得到了NV的大力支持(那会儿Tesla还在推广期);但是……
第三代又是重头再来,这会儿真正悲剧了……Xeon Phi 31S1P在INTEL的定位就是小白鼠(第零代,类似于EVA-00),严格来说Knights Landing才是真正具有市场价值的第一代Xeon Phi(基础架构彻底另起炉灶)
TH-2A的协处理器预计将升级为Knights Landing(TH-2的拓扑结构似乎已经没有扩大系统规模的余地,更何况也找不到更多的Xeon Phi 31S1P了),那么问题来了……Knights Landing首先定位为可互换插槽的协处理器(传统协处理器走PCIE总线,带宽瓶颈非常严重),而这一版本的Knights Landing显然TH-2是装不上的,那么就只有INTEL假惺惺的向下兼容版Knights Landing能用了(偏偏这货就不是为走PCIE总线设计的,带宽瓶颈对其造成的性能限制远比一般协处理器严重得多)--当然我大天朝有的是钱,连主板、CPU、内存…一起扔掉换新的就没这问题了(可惜最根本的问题没解决)

现在假设你是一位HPC用户,我们知道,面向GPGPU的编译优化是非常困难的:

TH-1的应用程序几乎不可能移植到TH-1A上,CAL和CUDA完全是两个体系(不知道这会儿的OpenCL能不能提供一些帮助,不过已经没有任何意义了)

那么TH-1A向TH-2移植呢?INTEL携ICC表示不高兴(当然想象力够的话可以试试GCC,谁知道呢)

TH-2和TH-2A总算是一家公司的解决方案了吧?它们的共同点大概也就是INTEL出品(这还是在TH-2A选择保守版升级方案的前提下),不过ICC好歹算是提供了理论上的可能性,不考虑好不好用的话

……

有没有一种彻底被耍了的感觉?



最后多句嘴:未来多半属于简单同构Many-Core,并且ARM阵营有极大可能性异军突起(比如AppliedMicro X-Gene 128core ARMv8);不能解决易用性,异构计算终归只是看上去很美(哪怕是IBM的POWER9+Volta)
另外,Fuji搭载SPARC64IXfx的下一代HPC Post-FX10恐怕也不好混;起码从P/W、P/P值来看,ideal HPC已经走到头了
今天无聊查了下,天河2号机柜貌似一台都没卖岀去过...orz
今天无聊查了下,天河2号机柜貌似一台都没卖岀去过...orz
中国需要超级计算机的场所多半都属于国防尖端场所这种场所的生意查不到,就算是民用单位比如说气象局都会爆一个保密项目也拿保密费,所以说要查这种资料要去档案馆查
超算啥时候卖得出去的?
今天无聊查了下,天河2号机柜貌似一台都没卖岀去过...orz
我能告诉你现在长沙有两套,南京一套,广州一套吗?广州中山大学那套我参与拉到广州大学城的,一次就10台9.6米的厢车,分了三次拉过去的
超算也不是随便买卖的吧
  原来超算是可以随意买卖滴
给我来一台超算吧
扫雷卡不?玩坦克世界特效全开不?
楼主知道天河计算任务排到几年后吗?另外,什么叫貌似?
哎!还是多思考一下自己的为人处事吧。
原来超算是可以随意买卖滴
起码lBM、HP、Cray、Oracle、Fuji、NEC...都是敞开供应的
楼主知道天河计算任务排到几年后吗?另外,什么叫貌似?
天河二号使用率只有三成 个人可登录官网申请使用
http://lt.cjdby.net/thread-1928893-1-1.html
超算啥时候卖得出去的?
Top500里面IBM 153、HP 179,不是卖的是送的?
天河的架构变更没楼主说的对应用影响那么大,实际上运行的都是linux系统,基本兼容性问题不大,能做出超算,系统软件的配套是没问题的。超算这东西问题是没人去用,还是推广问题。
原来要卖出去才算成功,楼主你那么成功,卖几次了?
昨天ccav还在说超算很忙,今天楼主就说超算很闲,看来有料啊!!!
都不用说学习成本高得吓人的异构超算,谁家的游戏机敢不兼容自己的上代产品?
技术路线应当具有延续性以降低开发、部署、应用成本,这点神威比天河强太多了
天河的架构变更没楼主说的对应用影响那么大,实际上运行的都是linux系统,基本兼容性问题不大,能做出超算 ...
重要的不是操作系统,而是开发、编译环境对应的学习成本
原来要卖出去才算成功,楼主你那么成功,卖几次了?
的确不算很成功,一年收到的猎头骚扰邮件大概也就和您一辈子差不多
天河二号使用率只有三成 个人可登录官网申请使用
http://lt.cjdby.net/thread-1928893-1-1.html
http://m.ycwb.com/ycwb/html/2014-06/30/content_482266.htm?div=0,34%出处在这里,拿个贴吧里的东西想说明啥?
紫辉 发表于 2014-11-19 22:01
给我来一台超算吧
我也要一台,3000元可以吗?3000万?鸟…——这么贵,怎么买
http://m.ycwb.com/ycwb/html/2014-06/30/content_482266.htm?div=0,34%出处在这里,拿个贴吧里的东西想 ...
天河二号被指运营成本高利用率低
http://digi.163.com/14/0701/10/A02H3U6U00162OUT.html
天河二号被指运营成本高利用率低
http://digi.163.com/14/0701/10/A02H3U6U00162OUT.html
转进?被谁指的?
重要的不是操作系统,而是开发、编译环境对应的学习成本
你说的一堆架构差异只对写系统的人造成问题,超算出厂的时候就带了对应系统了,你说的底层编译问题厂家已经解决了。对于超算用户来说,只要对应的库和接口没变,自己的代码还有源码,编译下就完工了。况且超算用户的使用很多任务都是用非编译的脚本执行的,根本不会在意架构的变动。
向北方 发表于 2014-11-20 08:27
转进?被谁指的?
当头棒!天河二号被指运营成本高利用率低
http://servers.pconline.com.cn/503/5030676.html

好可爱的鸵鸟

bokei 发表于 2014-11-20 08:29
你说的一堆架构差异只对写系统的人造成问题,超算出厂的时候就带了对应系统了,你说的底层编译问题厂家已 ...


INTEL已经有了ICC,所以这玩意一定是吃太饱撑着了的产物?
Intel Xeon Phi协处理器高性能编程指南
http://www.ptpress.com.cn/Book.aspx?id=37643
你是可以不在意硬件底层,只不过代价是性能表现惨不忍睹

PS:偏偏每一代天河的库和接口(CAL、CUDA、OpenMP…)都是推倒重来,怎么破?
bokei 发表于 2014-11-20 08:29
你说的一堆架构差异只对写系统的人造成问题,超算出厂的时候就带了对应系统了,你说的底层编译问题厂家已 ...


INTEL已经有了ICC,所以这玩意一定是吃太饱撑着了的产物?
Intel Xeon Phi协处理器高性能编程指南
http://www.ptpress.com.cn/Book.aspx?id=37643
你是可以不在意硬件底层,只不过代价是性能表现惨不忍睹

PS:偏偏每一代天河的库和接口(CAL、CUDA、OpenMP…)都是推倒重来,怎么破?
LZ想买这玩意干啥?模拟核试验?
INTEL已经有了ICC,所以这玩意一定是吃太饱撑着了的产物?
Intel Xeon Phi协处理器高性能编程指南
http ...
你确认你理解这个指南的内容,你确认知道什么叫协处理器的作用?这些内容我说了,根本不是天河的用户会接触的,这部分是给编写底层系统的用户用的好不好……这本书真正要看的人就是天河厂商的技术人员。
为啥会有高级语言和脚本语言?因为大家发现像以前用汇编哪样哪样换个cpu就要重新写一次软件太麻烦,谁不知道用低级语言运行效率高。况且超算的优势在于并行,这点上低级语言没有一点优势,远远比不上高级语言和脚本语言带来的编程便利,而高级语言和脚本语言恰恰是对底层最不敏感的,因为所有和底层进行的任务都由编译器和解释器完成了。而你认为天河出厂的时候不带编译器,还要用户自己写和安装么?所以你所说的性能惨不忍睹根本就是伪命题。
这年头真是只要狗会打字都能指点江山了啊
你确认你理解这个指南的内容,你确认知道什么叫协处理器的作用?这些内容我说了,根本不是天河的用户会接 ...
天河2自带编译器?ICC&OpenMP直接哭晕
高级语言(的运行效率)不需要考虑硬件底层,编译器搞定一切?那么码农顶天配拿3-5K

很不意思地问一句:写过Hello world么?
看不懂,支持楼主和懂的交流
枯渴庭园 发表于 2014-11-20 08:03
都不用说学习成本高得吓人的异构超算,谁家的游戏机敢不兼容自己的上代产品?
技术路线应当具有延续性以降 ...
申威目前也就一台蓝光,很久没有升级的迹象。
都不用说学习成本高得吓人的异构超算,谁家的游戏机敢不兼容自己的上代产品?
技术路线应当具有延续性以降 ...
不是说交通,城市管理,动画制作这些民用领域都要超算的吗?怎么不多看看就下定论来给我们看了?
枯渴庭园 发表于 2014-11-20 09:40
天河2自带编译器?ICC&OpenMP直接哭晕
高级语言(的运行效率)不需要考虑硬件底层,编译器搞定一切?那么 ...
天河二号是Phi的首次大规模应用,英特尔很重视,软硬件的支持都很到位。
用户只需要关心怎么用好超算软件,底层的编译器无需过分关心,细节问题有技术支持。
不是说交通,城市管理,动画制作这些民用领域都要超算的吗?怎么不多看看就下定论来给我们看了?
正是因为都要用,所以广大用户才希望这货尽可能简单易用;明白?

从这一点说甚至简单同构Many-Core都不是最理想的,超大规模并行编程同样不容易(比异构那是强多了);无奈强核心胖节点甚至更"理想"的矢量机实在搞不下去了
天河二号是Phi的首次大规模应用,英特尔很重视,软硬件的支持都很到位。
用户只需要关心怎么用好超算软 ...
你大概不知道Knights Landing底层架构彻底推倒重来,lNTEL根本拿Phi当小白鼠吧?

技术支持...但愿
枯渴庭园 发表于 2014-11-20 09:55
你大概不知道Knights Landing底层架构彻底推倒重来,lNTEL根本拿Phi当小白鼠吧?

技术支持...但愿
我当然知道,但这个变化没有天河1到天河2那么大。
对用户而言,面对的是优化好的超算软件,不必过多关心硬件架构。
转进?被谁指的?
网易呗,你看那个网址。和有些人没有什么好说的。