神威太湖之光超算揭秘:国产260核自研处理器,能效比超 ...

来源:百度文库 编辑:超级军网 时间:2024/04/28 04:05:08
转自:http://www.ithome.com/html/discovery/234951.htm

在今天公布的全球TOP500超算排名中,中国不仅保住了最强计算机的荣誉,而且在TOP500计算机数量上也实现了新突破,更关键的是在美国卡脖子之后中国用自己研发的处理器实现了超越,这次神威计算机不声不响地拿下TOP500冠军距离美国制裁中国超算中心不过一年零两个月。太湖之光超级计算的背后是中国国产处理器的大进步,它使用的是申威(跟计算机名别混了)SW26010处理器,260核心,64位架构,该系统的一大特色就是能效非常高,性能几乎是天河2号的三倍,但总功耗反而更低了。
20160620_210501_89.jpg
神威太湖之光:不仅性能最强,能效也逆天
先来简单说说神威太湖太湖之光计算机,它坐落于太湖之滨的无锡市国家超算中心内,此前大出风头的天河2号则是在中国广州的国家超算中心。神威计算机的研发单位是中国国家并行计算机工程技术研究中心,在太湖之光之前该中心研发过神威蓝光计算机,2012年安装于济南的国家超算中心内,当年的浮点性能为1千万亿次,现在来看性能早已经不算领先了,不过当时蓝光也是国内自主研发的HPC,使用的就是国产处理器。
20160620_210509_963.jpg
神威太湖之光超级计算机简介
在TOP500官网上可以找到太湖之光计算机的详细规格,其Linpack浮点性能为93PFLOPS,理论性能是125.4PLFOPS,而此前最强的天河2号性能分别是33.86LFOPS、54.9PFLOPS,也就是说太湖之光的实用性能几乎是天河2号的3倍,理论性能则是后者的2倍多,性能效率达到了74.2%,而天河2号只有55.8%。20160620_210511_909.jpg
神威太湖之光的能效比非常高
更关键的是,在性能大幅飙升的情况下,太湖之光的功耗反而从天河2号的17.8MW降低到了15.37MW,计算下来其单位性能功耗达到了6GFLOPS/W,而以能效比著称的“泰坦”单位性能不过是2.1GLOPS/W。太湖之光的能效就算放到以节能而非性能为指标的Green500计算机中也是拔尖的,后者最新榜单中排名第一的单位性能不过是7GFLOPS/W,第二名的是5.3GLOPS/W,太湖之光能成为第二,而这两台计算机的性能与太湖一号差太远了,最强的Shoubu也不过605TFLOPS(0.65PFOPS)。
申威处理器:国产260核处理器
神威计算机使用的处理器来源于上海江南计算所,神威蓝光计算机使用的是申威SW1600处理器,2010年问世,架构体系源于DEC Alpha(这个是喷点啊,喷子要注意了,申威指令集不是国产的),根据资料来看它使用的还是65nm工艺,16个RISC 64位核心,频率在975MHz到1200MHz之间,1.1GHz频率下浮点性能140.88GFLOPS。
20160620_210514_374.jpg
▲太湖之光使用的是申威SW26010处理器
太湖之光显然不可能再使用神威1600处理器了,这次使用的是江南计算所研发的申威SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。
这样1个处理器就是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。
20160620_210515_17.jpg
▲每张计算卡上有2个节点
20160620_210515_949.jpg
▲每块主板上可以布置上下4张计算卡
20160620_210516_850.jpg
▲32张卡组成1个超级节点,或者说256个节点
20160620_210517_484.jpg
▲4个超级节点组成1组机柜
20160620_210518_331.jpg
▲太湖之光的整体布局
要想了解太湖之光的详细架构信息,可以读读田纳西大学这篇论文。
至于如何评价中国太湖之光到底有多强,可以看下论文中对比的美国最强HPC、中国前一代最强HPC及当前太湖之光的配置。
20160620_210520_427.jpg
转自:http://www.ithome.com/html/discovery/234951.htm

在今天公布的全球TOP500超算排名中,中国不仅保住了最强计算机的荣誉,而且在TOP500计算机数量上也实现了新突破,更关键的是在美国卡脖子之后中国用自己研发的处理器实现了超越,这次神威计算机不声不响地拿下TOP500冠军距离美国制裁中国超算中心不过一年零两个月。太湖之光超级计算的背后是中国国产处理器的大进步,它使用的是申威(跟计算机名别混了)SW26010处理器,260核心,64位架构,该系统的一大特色就是能效非常高,性能几乎是天河2号的三倍,但总功耗反而更低了。
20160620_210501_89.jpg
神威太湖之光:不仅性能最强,能效也逆天
先来简单说说神威太湖太湖之光计算机,它坐落于太湖之滨的无锡市国家超算中心内,此前大出风头的天河2号则是在中国广州的国家超算中心。神威计算机的研发单位是中国国家并行计算机工程技术研究中心,在太湖之光之前该中心研发过神威蓝光计算机,2012年安装于济南的国家超算中心内,当年的浮点性能为1千万亿次,现在来看性能早已经不算领先了,不过当时蓝光也是国内自主研发的HPC,使用的就是国产处理器。
20160620_210509_963.jpg
神威太湖之光超级计算机简介
在TOP500官网上可以找到太湖之光计算机的详细规格,其Linpack浮点性能为93PFLOPS,理论性能是125.4PLFOPS,而此前最强的天河2号性能分别是33.86LFOPS、54.9PFLOPS,也就是说太湖之光的实用性能几乎是天河2号的3倍,理论性能则是后者的2倍多,性能效率达到了74.2%,而天河2号只有55.8%。20160620_210511_909.jpg
神威太湖之光的能效比非常高
更关键的是,在性能大幅飙升的情况下,太湖之光的功耗反而从天河2号的17.8MW降低到了15.37MW,计算下来其单位性能功耗达到了6GFLOPS/W,而以能效比著称的“泰坦”单位性能不过是2.1GLOPS/W。太湖之光的能效就算放到以节能而非性能为指标的Green500计算机中也是拔尖的,后者最新榜单中排名第一的单位性能不过是7GFLOPS/W,第二名的是5.3GLOPS/W,太湖之光能成为第二,而这两台计算机的性能与太湖一号差太远了,最强的Shoubu也不过605TFLOPS(0.65PFOPS)。
申威处理器:国产260核处理器
神威计算机使用的处理器来源于上海江南计算所,神威蓝光计算机使用的是申威SW1600处理器,2010年问世,架构体系源于DEC Alpha(这个是喷点啊,喷子要注意了,申威指令集不是国产的),根据资料来看它使用的还是65nm工艺,16个RISC 64位核心,频率在975MHz到1200MHz之间,1.1GHz频率下浮点性能140.88GFLOPS。
20160620_210514_374.jpg
▲太湖之光使用的是申威SW26010处理器
太湖之光显然不可能再使用神威1600处理器了,这次使用的是江南计算所研发的申威SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。
这样1个处理器就是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。
20160620_210515_17.jpg
▲每张计算卡上有2个节点
20160620_210515_949.jpg
▲每块主板上可以布置上下4张计算卡
20160620_210516_850.jpg
▲32张卡组成1个超级节点,或者说256个节点
20160620_210517_484.jpg
▲4个超级节点组成1组机柜
20160620_210518_331.jpg
▲太湖之光的整体布局
要想了解太湖之光的详细架构信息,可以读读田纳西大学这篇论文。
至于如何评价中国太湖之光到底有多强,可以看下论文中对比的美国最强HPC、中国前一代最强HPC及当前太湖之光的配置。
20160620_210520_427.jpg
260核,厉害啊!什么时候可以用在家用电脑上!我想买!
尹嘉岩野 发表于 2016-6-22 21:22
260核,厉害啊!什么时候可以用在家用电脑上!我想买!
和微软操作系统不兼容!估计你用不习惯
楼主资料和列表详细。能否提供下田纳西论文连接或者关键词
玩游戏卡吗?
下一步就是制程了吧?谁来说说和农企还有多大差距?英特尔差距太大不提。
这种核用在嵌入式板卡上一定很爽
260个核  完全可以动态控制每个核是否通电工作  可以最高效节能
而且如此强的芯片 完全可以 做一个模拟器  就可以兼容温逗死系统了

苏霍伊金雕 发表于 2016-6-23 00:02
下一步就是制程了吧?谁来说说和农企还有多大差距?英特尔差距太大不提。


农企的女友现在离intel也不远了,据说计划下一步和intel比肩7nm,现在是14nm.  intel是第一梯队(只有1家),台积电,三星,女友 第二梯队

国内现在学精了,不追这些玩意了,反正一时半刻追不上,还是选性价比高的。

14nm 投样片就是6000万一次 18nm 好像是2000多万,用量少的基本不会用最新的制程,不然经费还不够打样的。

现在政府比以前精多了,所以龙芯就很难要到钱了,还是国家队自己靠得住,国产CPU的投资,大几十亿全给了国家队。
苏霍伊金雕 发表于 2016-6-23 00:02
下一步就是制程了吧?谁来说说和农企还有多大差距?英特尔差距太大不提。


农企的女友现在离intel也不远了,据说计划下一步和intel比肩7nm,现在是14nm.  intel是第一梯队(只有1家),台积电,三星,女友 第二梯队

国内现在学精了,不追这些玩意了,反正一时半刻追不上,还是选性价比高的。

14nm 投样片就是6000万一次 18nm 好像是2000多万,用量少的基本不会用最新的制程,不然经费还不够打样的。

现在政府比以前精多了,所以龙芯就很难要到钱了,还是国家队自己靠得住,国产CPU的投资,大几十亿全给了国家队。


功耗低 不熱 是不是代表超頻空間大

功耗低 不熱 是不是代表超頻空間大
没看过龙芯之类的cpu实体,但我想说,第一次看见cpu上面印着中文,心情大好
看来我没猜错,这个貌似是异构运算体系,不错。
http://server.chinabyte.com/424/13814924.shtml用可视化的数据告诉你:中国超算为什么比美国强


TOP500榜单国家分布


TOP500国家计算能力对比
65nm工艺能达到这个性能/功耗比,当真是逆天了
如果能用16nm工艺流片的话,美的没法说了
以后中国有实力,可以一举把不节能的cpu列入征收高税率的产品。。。。
凤凰竹马甲 发表于 2016-6-23 11:44
65nm工艺能达到这个性能/功耗比,当真是逆天了
如果能用16nm工艺流片的话,美的没法说了
好像是28nm,
http://lt.cjdby.net/forum.php?mod=viewthread&tid=2247657
4楼 真实性不知
下一步就是制程了吧?谁来说说和农企还有多大差距?英特尔差距太大不提。
农企现在没有制造部分了,下一代的zen是用三星授权gf的14 nm
BAKA1314 发表于 2016-6-23 02:29
能效低 不熱 是不是代表超頻空間大
大哥,估计你有笔误
确实值得骄傲和自豪
很强!很叼!很给力!
牛逼,霉帝已经穷途末路咯
michealeal 发表于 2016-6-22 23:46
和微软操作系统不兼容!估计你用不习惯
那以后会出兼容微软系统的CPU吗?真希望能用上国产的CPU  
尹嘉岩野 发表于 2016-6-24 11:46
那以后会出兼容微软系统的CPU吗?真希望能用上国产的CPU
不知道,这款cpu是军方的,军用需求还是第一位的,有没有民用计划都不好说。
michealeal 发表于 2016-6-24 12:05
不知道,这款cpu是军方的,军用需求还是第一位的,有没有民用计划都不好说。
啊?那真可惜了,如果也能让我们老百姓享受一下我们自己的高科技产品就好了