中国“天河二号”成为全球最快超级计算机

来源:百度文库 编辑:超级军网 时间:2024/04/29 15:30:39



原帖链接:http://www.chinanews.com/gn/2013/06-17/4935890.shtml
TOP500列表:http://www.top500.org/list/2013/06/

  中新网6月17日电 据央视报道,今日公布的全球超级计算机500强排行榜中,中国“天河二号”成为全球最快超级计算机。

  2013年5月,我国研制成功世界上首台5亿亿次(50PFlops)超级计算机——“天河二号”,这是国家863计划“十二五”高效能计算机重大项目的阶段性成果。天河二号双精度浮点运算峰值速度达到每秒5.49亿亿次,Linpack(国际上流行的用于测试高性能计算机浮点计算性能的软件)测试性能已达到每秒3.39亿亿次。

  由国防科技大学等单位研制的天河二号5亿亿次超级计算机,在体系结构、微异构计算阵列、高速互连网络、加速存储架构、并行编程模型与框架、系统容错设计与故障管理、综合化能耗控制技术以及高密度高精度结构工艺等方面,突破了一系列核心关键技术。

  与2010年11月获得TOP500第一的天河一号相比,天河二号峰值计算速度和持续计算速度均提升10倍以上,计算密度(单位面积上的计算能力)提升了10倍以上,系统能效比(单位能耗的计算速度)是天河一号的3倍。

  天河二号拟于2013年底前在广州投入实际运行,目前,正在开展技术人员培训、机房建设等工作。天河二号将服务于珠三角地区以及包括香港、澳门在内的周边区域。







原帖链接:http://www.chinanews.com/gn/2013/06-17/4935890.shtml
TOP500列表:http://www.top500.org/list/2013/06/

  中新网6月17日电 据央视报道,今日公布的全球超级计算机500强排行榜中,中国“天河二号”成为全球最快超级计算机。

  2013年5月,我国研制成功世界上首台5亿亿次(50PFlops)超级计算机——“天河二号”,这是国家863计划“十二五”高效能计算机重大项目的阶段性成果。天河二号双精度浮点运算峰值速度达到每秒5.49亿亿次,Linpack(国际上流行的用于测试高性能计算机浮点计算性能的软件)测试性能已达到每秒3.39亿亿次。

  由国防科技大学等单位研制的天河二号5亿亿次超级计算机,在体系结构、微异构计算阵列、高速互连网络、加速存储架构、并行编程模型与框架、系统容错设计与故障管理、综合化能耗控制技术以及高密度高精度结构工艺等方面,突破了一系列核心关键技术。

  与2010年11月获得TOP500第一的天河一号相比,天河二号峰值计算速度和持续计算速度均提升10倍以上,计算密度(单位面积上的计算能力)提升了10倍以上,系统能效比(单位能耗的计算速度)是天河一号的3倍。

  天河二号拟于2013年底前在广州投入实际运行,目前,正在开展技术人员培训、机房建设等工作。天河二号将服务于珠三角地区以及包括香港、澳门在内的周边区域。


QQ图片20130617171103.jpg (122.83 KB, 下载次数: 3)

下载附件 保存到相册

2013-6-17 17:13 上传



QQ图片20130617171111.jpg (62.97 KB, 下载次数: 3)

下载附件 保存到相册

2013-6-17 17:13 上传

跟BGC处理器的超级计算机比起来,效率有点低,INTEL的xeon phi还是比较悲催
终于出来了。
花落庭院 发表于 2013-6-17 17:30
跟BGC处理器的超级计算机比起来,效率有点低,INTEL的xeon phi还是比较悲催
不是一般的低啊,不过性能功耗比还是凭着22nm工艺做到了一流水平。
deam 发表于 2013-6-17 17:32
不是一般的低啊,不过性能功耗比还是凭着22nm工艺做到了一流水平。
看来单独的向量部件跟直接FPU向量扩展就测试linpack还是有差距。。。实际使用效率不知道怎么样
花落庭院 发表于 2013-6-17 17:37
看来单独的向量部件跟直接FPU向量扩展就测试linpack还是有差距。。。实际使用效率不知道怎么样
我觉得实际程序跑起来效果也是不如BGC,因为内存实在太少了。而且512bit VPU太宽了些,FMA3也有很多限制。

最大的瓶颈应该还是内存容量,其实一张卡应该配64G起步。
deam 发表于 2013-6-17 17:39
我觉得实际程序跑起来效果也是不如BGC,因为内存实在太少了。而且512bit VPU太宽了些,FMA3也有很多限制。 ...
xeon phi单卡测试效率也不怎么样。。。。。。。。。
花落庭院 发表于 2013-6-17 17:42
xeon phi单卡测试效率也不怎么样。。。。。。。。。
效率吧还能用工艺来弥补,这个内存容量就很麻烦了,对编程是非常大的限制。
明年Haswell EP出来我觉得拿来组超算挺合适的,130w下Haswell EP有500G Flops左右。或者Haswell EX,500G Flops加上130G/s的内存带宽。
deam 发表于 2013-6-17 17:43
效率吧还能用工艺来弥补,这个内存容量就很麻烦了,对编程是非常大的限制。
xeon phi有点BGC处理器和cell处理器的中间状态,跟谁都不像。。。。。
deam 发表于 2013-6-17 17:47
明年Haswell EP出来我觉得拿来组超算挺合适的,130w下Haswell EP有500G Flops左右。或者Haswell EX,500G F ...
Haswell EP才500GFLOPS?多少核?频率多少?感觉有点低
花落庭院 发表于 2013-6-17 17:48
xeon phi有点BGC处理器和cell处理器的中间状态,跟谁都不像。。。。。
悲催的内存技术啊。其实Intel多想把Xeon Phi插到主板上然后接上一大堆内存,可惜做不到啊。
花落庭院 发表于 2013-6-17 17:49
Haswell EP才500GFLOPS?多少核?频率多少?感觉有点低
12核3GHZ吧。
deam 发表于 2013-6-17 17:52
悲催的内存技术啊。其实Intel多想把Xeon Phi插到主板上然后接上一大堆内存,可惜做不到啊。
应该不是吧,xeon phi的带宽有300GB以上,单卡效率不行应该是结构问题。。。
deam 发表于 2013-6-17 17:52
12核3GHZ吧。
不是鼓吹有14核吗?
花落庭院 发表于 2013-6-17 17:55
应该不是吧,xeon phi的带宽有300GB以上,单卡效率不行应该是结构问题。。。
效率不行不是问题,问题是好多程序就因为它内存太少基本就跑不了了。
花落庭院 发表于 2013-6-17 17:56
不是鼓吹有14核吗?
Haswell EX应该是15核或者16核。
deam 发表于 2013-6-17 17:57
Haswell EX应该是15核或者16核。
去年我看到的消息EX是14核,你这个消息有链接吗?
花落庭院 发表于 2013-6-17 18:20
去年我看到的消息EX是14核,你这个消息有链接吗?
http://news.mydrivers.com/1/223/223682.htm
http://www.enet.com.cn/article/2012/0606/A20120606119582.shtml
deam 发表于 2013-6-17 18:41
http://news.mydrivers.com/1/223/223682.htm
http://www.enet.com.cn/article/2012/0606/A201206061195 ...
不清楚EX  16核频率能上多少?
花落庭院 发表于 2013-6-17 19:46
不清楚EX  16核频率能上多少?
估计就是2.5G左右。
deam 发表于 2013-6-17 19:47
估计就是2.5G左右。

是功耗墙影响频率的提升?
花落庭院 发表于 2013-6-17 19:49
是功耗墙影响频率的提升?
算是吧。
deam 发表于 2013-6-17 19:50
算是吧。
这个频率比龙芯16核强很多
花落庭院 发表于 2013-6-17 19:51
这个频率比龙芯16核强很多
那当然,Haswell本身是为4GHZ频率设计的架构。
deam 发表于 2013-6-17 19:54
那当然,Haswell本身是为4GHZ频率设计的架构。
龙芯是为多少频率设计的架构?
花落庭院 发表于 2013-6-17 19:59
龙芯是为多少频率设计的架构?
不是2G频率嘛。

Haswell要是像龙芯那样的流水线,估计也就是3G频率的样子。
deam 发表于 2013-6-17 20:01
不是2G频率嘛。

Haswell要是像龙芯那样的流水线,估计也就是3G频率的样子。

频率跟流水线  结构复杂度。。。。。都有关系,power 7+的11级流水线最高接近5G。。。你就确定Haswell本身是为4GHZ频率设计的架构?说话有点那个啥。。。呵呵
花落庭院 发表于 2013-6-17 20:05
频率跟流水线  结构复杂度。。。。。都有关系,power 7+的11级流水线最高接近5G。。。你就确定Haswell本 ...
可以对比嘛,看看Xeon Phi,从1.0G提频到1.2G都那么费劲。
deam 发表于 2013-6-17 20:08
可以对比嘛,看看Xeon Phi,从1.0G提频到1.2G都那么费劲。
你确定xeon phi是什么原因影响频率?phi是2发射顺序处理器,但是60核的512bit向量。。。功耗225~300W.。。。。。
你确定xeon phi是什么原因影响频率?phi是2发射顺序处理器,但是60核的512bit向量。。。功 ...
它之所以堆核,就是因为频率上不去。
在体系结构、微异构计算阵列、高速互连网络、加速存储架构、并行编程模型与框架、系统容错设计与故障管理、综合化能耗控制技术以及高密度高精度结构工艺等方面,突破了一系列核心关键技术。

上回,介绍“神威”时也有类似词句,似乎这些技术需要重复突破;
不知是否国内相关单位之间的封锁隔离,还是体系结构不同导致。
deam 发表于 2013-6-17 20:20
它之所以堆核,就是因为频率上不去。
原来xeon phi不是众核处理器,是多核。。。。因为频率上不去,所以做众核,BGC这个2发射顺序处理器,频率只做到2.3G,不是为控制功耗,因为频率上不去。。。。那只有流水线决定频率,为什么13级流水的power 6用65nm出来5G(IBM宣传6G)  11级流水的power 7  32nm出来4.5G(IBM宣传5G)。。。。。。。。。
前十里面,MD还是大头,然后是德国,然后是TG,然后是日本
花落庭院 发表于 2013-6-18 05:33
原来xeon phi不是众核处理器,是多核。。。。因为频率上不去,所以做众核,BGC这个2发射顺序处理器 ...
Xeon Phi最早的研发计划,也就是当初的Larrabee,原本是准备上32/48核,2GHZ主频的。

后来频率怎么都上不去,于是核心数不断增加来弥补损失的性能。
deam 发表于 2013-6-18 13:45
Xeon Phi最早的研发计划,也就是当初的Larrabee,原本是准备上32/48核,2GHZ主频的。

后来频率怎么都上 ...
嘴巴一张。。。。xeon phi是流水线太短?还是顺序处理器太复杂?还是向量单元太大?。。。。。。。。。到底是什么原因,你清楚吗?有依据吗?
花落庭院 发表于 2013-6-18 13:52
嘴巴一张。。。。xeon phi是流水线太短?还是顺序处理器太复杂?还是向量单元太大?。。。。。。。。。到 ...

我不知道啊,但是我知道它频率上不去啊,提升频率带来的功耗增加远大于增加核心带来的功耗增加啊,由此判断其架构一定是不适合高频率的啊。
deam 发表于 2013-6-18 13:54
我不知道啊,但是我知道它频率上不去啊,提升频率带来的功耗增加远大于增加核心带来的功耗增加啊,由此 ...
提升频率功耗太大,不是说频率不能提升,你把xeon phi做成4核 的,看看频率能到多少?向量单元太大,本来功耗就比较大。。。。。。。用这个东西判断架构不适合高频率。。。。。。。
花落庭院 发表于 2013-6-18 14:01
提升频率功耗太大,不是说频率不能提升,你把xeon phi做成4核 的,看看频率能到多少?向量单元太大,本来 ...

对啊,一个架构的设计频率在哪儿,就是看频率提升到什么时候功耗开始呈非线性快速增长。

Xeon Phi一个核心的功耗根本就不大。61个核心总共才300w。
deam 发表于 2013-6-18 14:03
对啊,一个架构的设计频率在哪儿,就是看频率提升到什么时候功耗开始呈非线性快速增长。

Xeon Phi一 ...
你告诉我:什么类型的众核处理器适合高频率?浮点能力悲催的ARM 7?