近距离看中国天河2号超级计算机

来源:百度文库 编辑:超级军网 时间:2024/04/28 21:14:59
天河2号已经报道了很多次了,但关于这部全球第一的超级计算机,很多细节还是一团迷雾,特别是升级了“ARCH”联网系统的内部细节,16000个节点是怎么通过这个ARCH堆到一起的?希望本文能稍微满足一下大家的好奇心。
不管怎么样,国家有天河2可以用,还是很值得高兴的。
首先是天河2的主板,根据最早爆料者Jack Dongarra的说法,国防科技大学做了一些“一体化改进”。

天河2号主板
在天河2里,两个ARCH网络接口和两枚Ivy Bridge-EP版的Xeon E5节点(每个节点有两个CPU插座),被做在了一块板子上(虽然他们理论上它们之间没有什么关系)。这样一个节点上,还有一枚Xeon Phi协处理器供左半边的节点共享,右侧有5枚Xeon Phi。左右两半电器上是分开的,完全可以分开维护。
所谓的Arch-2网络界面,通过PCI-Express 2.0接口连接着搭载着Xeon E5的主板,可惜,PCIe 2.0的带宽比PCIe 3.0版本的要少一半(也许Arch-3会升级到PCIe 3.0界面,或者NUDT的实验室白板上已经有原型涂鸦了)。每个节点上都有一个Arch-2网络界面;每节点上的3个Xeon Phi协处理器,通过PCIe 3.0界面和CPU通讯。嗯,没错Xeon Phi与CPU的谈话速度,要快过CPU之间的……不确定这种不平衡的设置对天河二君的性能有什么影响。
来来来,看一眼天河二君的霸气外露的网口背板。

天河2的网口交换背板
天河的Arch-2网络背板双面都有接口,而且有不同的速率。Arch-2可以跑10Gb/s,或者14Gb/s。其中一个闪亮的RSW交换口在主板的背面,连接机架上节点组互相之间的通讯。(不太明白这个RSW是啥意思……给诸君赔不是)

天河2的RSW交换模块
让人看不懂的是,有几组RSW交换界面是旋转90度插在一起的——不过,PDF上就是这么画的。
8个一组的RSW交换刀片连接着4个刀片机(一共8个ARCH-2接口),看起来其他的4个几口是用来连接576口的主干交换机的,实现与主干连接的硬件层叫做LSW刀片机,看上去就是这个样子:

天河2的LSW交换机刀片
Arch-2由13个576口的怪兽交换机组成,看来有用到不少的LSW交换机。这些交换机用的是国防大学自己的开发的光纤技术和自有知识产权的传输协议。和所有的超级计算机一样,布线看上去整齐如麻,特别是你要把16000个节点连起来的时候。
In China, presumably they call a tangle of cables noodles, not spaghetti(不是我不敬业,这句我吐槽不来……)
我真想改行卖光纤网线啊。
一些天河2的技术细节在此(PDF):
http://www.netlib.org/utk/people/JackDongarra/PAPERS/tianhe-2-dongarra-report.pdf
补充侦查一侧,对于超算用户来讲,好像很实惠啊……
http://news.mydrivers.com/1/269/269296.htm

天河2号已经报道了很多次了,但关于这部全球第一的超级计算机,很多细节还是一团迷雾,特别是升级了“ARCH”联网系统的内部细节,16000个节点是怎么通过这个ARCH堆到一起的?希望本文能稍微满足一下大家的好奇心。
不管怎么样,国家有天河2可以用,还是很值得高兴的。
首先是天河2的主板,根据最早爆料者Jack Dongarra的说法,国防科技大学做了一些“一体化改进”。

天河2号主板在天河2里,两个ARCH网络接口和两枚Ivy Bridge-EP版的Xeon E5节点(每个节点有两个CPU插座),被做在了一块板子上(虽然他们理论上它们之间没有什么关系)。这样一个节点上,还有一枚Xeon Phi协处理器供左半边的节点共享,右侧有5枚Xeon Phi。左右两半电器上是分开的,完全可以分开维护。
所谓的Arch-2网络界面,通过PCI-Express 2.0接口连接着搭载着Xeon E5的主板,可惜,PCIe 2.0的带宽比PCIe 3.0版本的要少一半(也许Arch-3会升级到PCIe 3.0界面,或者NUDT的实验室白板上已经有原型涂鸦了)。每个节点上都有一个Arch-2网络界面;每节点上的3个Xeon Phi协处理器,通过PCIe 3.0界面和CPU通讯。嗯,没错Xeon Phi与CPU的谈话速度,要快过CPU之间的……不确定这种不平衡的设置对天河二君的性能有什么影响。
来来来,看一眼天河二君的霸气外露的网口背板。

天河2的网口交换背板天河的Arch-2网络背板双面都有接口,而且有不同的速率。Arch-2可以跑10Gb/s,或者14Gb/s。其中一个闪亮的RSW交换口在主板的背面,连接机架上节点组互相之间的通讯。(不太明白这个RSW是啥意思……给诸君赔不是)

天河2的RSW交换模块让人看不懂的是,有几组RSW交换界面是旋转90度插在一起的——不过,PDF上就是这么画的。
8个一组的RSW交换刀片连接着4个刀片机(一共8个ARCH-2接口),看起来其他的4个几口是用来连接576口的主干交换机的,实现与主干连接的硬件层叫做LSW刀片机,看上去就是这个样子:

天河2的LSW交换机刀片Arch-2由13个576口的怪兽交换机组成,看来有用到不少的LSW交换机。这些交换机用的是国防大学自己的开发的光纤技术和自有知识产权的传输协议。和所有的超级计算机一样,布线看上去整齐如麻,特别是你要把16000个节点连起来的时候。
In China, presumably they call a tangle of cables noodles, not spaghetti(不是我不敬业,这句我吐槽不来……)
我真想改行卖光纤网线啊。
一些天河2的技术细节在此(PDF):
http://www.netlib.org/utk/people/JackDongarra/PAPERS/tianhe-2-dongarra-report.pdf
补充侦查一侧,对于超算用户来讲,好像很实惠啊……
http://news.mydrivers.com/1/269/269296.htm
其实技术含量并不高!


技术含量真心不高,可惜2楼搞不出来,为啥?人家研究史前生物制造技术,专业等级千人斩,乃们这堆渣渣还不膜拜下?

技术含量真心不高,可惜2楼搞不出来,为啥?人家研究史前生物制造技术,专业等级千人斩,乃们这堆渣渣还不膜拜下?
技术含量不高,是因为TG做出来了,TG做不出来的才是高科技…………
军迷20年 发表于 2013-7-16 14:46
技术含量不高,是因为TG做出来了,TG做不出来的才是高科技…………
这样一来,以后能叫高科技只能越来越少了.
大白菜才是TB的王道啊.
说说看,怎么个不高??求科普
chaifox 发表于 2013-7-16 14:47
这样一来,以后能叫高科技只能越来越少了.
大白菜才是TB的王道啊.
错,有那么一天,TG把大白菜做成高科技满地球去卖,才是王道,卖不卖还要看心情
iamrabbit 发表于 2013-7-16 14:39
其实技术含量并不高!
废话,只要tb做出来的都只有白菜一个下场,你见过高技术的白菜吗???
有没有技术含量,我们先不争,有行业内的人在超大,让这些人来评价。
一百遍啊一百遍1 发表于 2013-7-16 14:58
废话,只要tb做出来的都只有白菜一个下场,你见过高技术的白菜吗???
当年咱们的祖先研究出来大白菜,在那个时候真心是高科技,顶级的生物技术
当初被日本超过天河1,有人高呼“超级计算机又成高科技了”
现在中国重拿第一,很不幸超级计算机又成“低技术含量”了……
一百遍啊一百遍1 发表于 2013-7-16 14:58
废话,只要tb做出来的都只有白菜一个下场,你见过高技术的白菜吗???
那叫高科技白菜,咋了,不行啊?
能用 Xeon Phi 加速的软件有商业化的吗?{:soso_e141:}  还不如继续用NV的GPU K20X
暑假什么时候结束啊!?
暑假前一般每天论坛刷好若干次,很多帖子一直看到跟帖结束!
现在好了,连新帖子都懒得看!!
真心希望暑假早点结束!!!
iamrabbit 发表于 2013-7-16 14:39
其实技术含量并不高!
您给咱弄一个?
当初被日本超过天河1,有人高呼“超级计算机又成高科技了”
现在中国重拿第一,很不幸超级计算机又成“低 ...
话说量子计算机要是出来的话,这家伙真心没含量了,为吗,人家说量计算机,就手机哪大一块都比现在的超算牛逼,最牛逼的还有量子加基因加什么神经的计算机,估计人家会说,去,进回收站吧!
还真是第一次看这些部件
昨晚合肥暴出,中国量子电话以做成功,我搬过来都三个半小时,硬是不给通过审核,唉:-(
2楼绝对高端人才!脚盆妥妥的要引进!解决自己超算的性能和悲催的效率问题。   
另文章真心忘了介绍前端的FT-1500。
1楼和2楼的ID………
iamrabbit 发表于 2013-7-16 14:39
其实技术含量并不高!
张口就来........乃做个瞧瞧...........
K1103 发表于 2013-7-16 17:26
暑假什么时候结束啊!?
暑假前一般每天论坛刷好若干次,很多帖子一直看到跟帖结束!
现在好了,连新帖子 ...
加1~~~现在都不爱上论坛了
我赌一页以内会有某贵宾进来说欧美的超算架构何等牛逼,天朝渣渣云云
公知说着计算机根本无法应用,是国家面子工程来的
我赌一页以内会有某贵宾进来说欧美的超算架构何等牛逼,天朝渣渣云云
我来说吧!美国,我有超算,我有量子技术,还特么的有量子电脑。不过还在试验室,兔子说,超算比你快,量子在组网,可不比你差哦!美国,兔子,你怎么不说你量子电话都造出来了,当我不知道么?
我赌一页以内会有某贵宾进来说欧美的超算架构何等牛逼,天朝渣渣云云
我来说吧!美国,我有超算,我有量子技术,还特么的有量子电脑。不过还在试验室,兔子说,超算比你快,量子在组网,可不比你差哦!美国,兔子,你怎么不说你量子,电,话,都造出来了,当我不知道么?
iamrabbit 发表于 2013-7-16 15:06
有没有技术含量,我们先不争,有行业内的人在超大,让这些人来评价。
你是业内人吗?