写错了吧?江南所的全国产超算排第二?

来源:百度文库 编辑:超级军网 时间:2024/04/25 08:28:10
在本次排行中,排名第二的神威蓝光(Sunway BlueLight MPP)受到与会业界专家的广泛关注,该机器获得科技部863计划支持,由国家并行计算机工程技术研究持,由国家并行计算机工程技术研究中心制造,于2011年9月安装于国家超算济南中心,全部采用自主设计生产的CPU(ShenWei processor SW1600),系统共8704个CPU,峰值1.07016PFlops,持续性能795.9TFlops, Linpack效率74.37%,总功耗1074KW。▲http://server.it168.com/a2011/1027/1264/000001264774_all.shtml在本次排行中,排名第二的神威蓝光(Sunway BlueLight MPP)受到与会业界专家的广泛关注,该机器获得科技部863计划支持,由国家并行计算机工程技术研究持,由国家并行计算机工程技术研究中心制造,于2011年9月安装于国家超算济南中心,全部采用自主设计生产的CPU(ShenWei processor SW1600),系统共8704个CPU,峰值1.07016PFlops,持续性能795.9TFlops, Linpack效率74.37%,总功耗1074KW。▲http://server.it168.com/a2011/1027/1264/000001264774_all.shtml
“星云”由曙光公司天津产业基地研制生产,其系统峰值为每秒3000万亿次,实测Linpack性能达到每秒1271万亿次,是中国第一达到每秒1271万亿次,是中国第一台、世界第三台实测双精度浮点计算超过千万亿次的超级计算机。在2010年5月31日发布的第35届全球超级计算机500强排名中,名列第二位。
在TOP10中,曙光3台(No.4,7,10), IBM 3 台(No.5,8,9), 国防科大2台(No.1,3),神威1台(No.2),中科院过程所1台(No.6);
如果把这款山寨alpha处理器做成小型机服务器,,,我们的信息安全就有希望了~!
如果大力推广这款服务器,,还是很有希望的~!毕竟alpha 的软件还是有很多的。。可以有比较好的软件基础。。便于应用和推广。。。
好像排名第4和第7都是曙光星云,说明原来的星云被拆分成两台了?
这台机器特点是组装密度很高,一个机柜就可以装1024颗CPU,9个机柜就可以达到1p的峰值。
只要解决好系统稳定性问题,100个机柜就可以使系统性能达到10p。


实际上江南所方面已经通过神威蓝光 隐晦的告诉大家:
10P的机器, 已经是囊中之物。

实际上江南所方面已经通过神威蓝光 隐晦的告诉大家:
10P的机器, 已经是囊中之物。
lgthunders 发表于 2011-10-28 11:55
实际上江南所方面已经通过神威蓝光 隐晦的告诉大家:
10P的机器, 已经是囊中之物。
对头,只要上面点头就可以出来亮相。
HP给授权么?  商业化有障碍么?
干掉小日本。
快讯,漆锋滨研究员报告《神威蓝光千万亿次计算机系统》。坚持自主创新,研制国产CPU,应用到高性能计算。申威SW1600国产处理器,工信部支持核高基重大专项支持,64位16核处理器。下一款申威1610也即将推出,在主频(预期会提高50%)、访存特性都会提高。
lgthunders 发表于 2011-10-28 11:55
实际上江南所方面已经通过神威蓝光 隐晦的告诉大家:
10P的机器, 已经是囊中之物。
这么猛啊,
那到底是否已经弄出来了?
3年前的设计,已经过时了,骗骗山东人。。。好东西还没出来。。。{:soso_e182:}

SW1600 发表于 2011-10-28 22:04
3年前的设计,已经过时了,骗骗山东人。。。好东西还没出来。。。


08年的设计。。。
09年出来?
太TMD的强悍了,
这么说,就是IBM之下的全球第二 名了。。。?


奸商啊,
欺骗厚道的山东人。。。
SW1600 发表于 2011-10-28 22:04
3年前的设计,已经过时了,骗骗山东人。。。好东西还没出来。。。


08年的设计。。。
09年出来?
太TMD的强悍了,
这么说,就是IBM之下的全球第二 名了。。。?


奸商啊,
欺骗厚道的山东人。。。
08年设计 10年收工,哎 周期还是太长了,成品出来又落后了
SW1600 发表于 2011-10-28 22:37
08年设计 10年收工,哎 周期还是太长了,成品出来又落后了
差不多吧。

1.6Gsw1610和
64核的申威出来,
那也可以抖几下了。

估计IBM折腾不了这么快;
如果工艺跟得上,可以拍死intel了。。。。。。
SW1600 发表于 2011-10-28 22:37
08年设计 10年收工,哎 周期还是太长了,成品出来又落后了
差不多吧。

1.6Gsw1610和
64核的申威出来,
那也可以抖几下了。

估计IBM折腾不了这么快;
如果工艺跟得上,可以拍死intel了。。。。。。
http://cuda.it168.com/a2011/1028/1265/000001265446.shtml
HPC China:揭开神威蓝光的神秘面纱

  【IT168 现场报道】2011年10月28日消息,2011年全国高性能计算学术年会(HPC China 2011)于2011年10月26至29日在山东济南山东大厦召开。本届会议是由中国计算机学会主办、中国软件行业协会数学软件分会协办、中国计算机学会高性能专业委员会、山东省科学院、山东信息通信技术研究院、山东省计算中心共同承办的。IT168作为独家网络支持媒体将全程进行直播报道。

  10月28日上午,2011年全国高性能计算学术年会(HPC China 2011)进入第二天的议程。国家并行中心漆锋滨研究员发表主题演讲“神威蓝光千万亿次计算机系统”,为我们揭开了神威蓝光的神秘面纱。


▲国家并行中心漆锋滨研究员

  首先,漆锋滨研究员解释了“神威蓝光”这个名字的由来,他说这很偶然,是梦中的境界,意味着非同凡响。现阶段全世界高性能计算机正处于千万亿次机时代,即将跨入万万亿次机时代。针对我国而言,研制国产CPU、并应用于国产高性能计算机是体现国家科技竞争力和综合国力的标准,是国家战略的需要。国产CPU之路虽有众多坎坷,但是必须迎难而上。


▲“神威蓝光”研制背景

  漆锋滨研究员介绍到神威蓝光(Sunway BlueLight MPP)获得国家863计划支持,由国家并行计算机工程技术研究中心制造,并获得浪潮和山东通信研究院的协助,于2011年9月安装于中国国家超级计算(济南)中心。系统共安装8704个中国自主设计生产的申威1600,峰值1.07PFlops,Linpack性能796TFlops,性能功耗比741MFlops/W,系统规模可以扩展到万万亿次。

  其中,中国自主设计生产的申威1600是工信部支持的核高基重大专项,有国家高性能集成电路(上海)设计中心与2010年8月研制成功。申威1600是我国第一款自主研制的64位通用16核处理器,下一代产品将在主频方面提高50%。该系统包括11个机舱,其中9个计算机舱、2个网络机舱,全机采用水冷冷却。


▲申威1600与同时期主流CPU的比较

  神威蓝光是国内唯一完全采用自主CPU构建的千万亿次计算机系统,我国成为继美国、日本之后第三个采用自主CPU构建千万亿次计算机的国家,突破了基板生产和芯片封装技术。神威蓝光的研制历时三年时间,上千名工程技术人员为此付出了艰辛的劳动,漆锋滨研究员表示“自主研发再难也值得”。
SW1600 发表于 2011-10-28 22:04
3年前的设计,已经过时了,骗骗山东人。。。好东西还没出来。。。
太HKC了。
再看一下 http://www.hpc2011.net/hyrc.html 这几天都在报告啥。。。
还有 http://weibo.com/hpcchina 。。。
http://server.it168.com/a2011/1027/1265/000001265259.shtml 亮点很多 ,图自己看。。
赶紧把神威的65纳米级工艺升级到28纳米
我记得神威的CPU原来是在中芯国际(上海)制造的,江南所CPU2006年5月中芯国际130纳米流片成功,1G主频 http://bbs.lemote.com/viewthread.php?tid=27628&highlight=
相对CPU设计,我觉得超算设计水平江南所更高一筹,江南所的神威4000ALinpack效率超过90%,排行榜首次出现Linpack效率超过90%的两套机器,IBM公司的刀片机群和江南所的两套机器,IBM公司的刀片机群和江南所的神威4000A,http://bbs.lemote.com/viewthread.php?tid=26171&highlight=,神威蓝光LINPACK性能测试,使用8575个申威1600CPU,795.9TFlops,效率74.37%。LINPACK在不同规模下的效率:单处理器核80.28%,单CPU 75.20%,单机舱75.07%,整机74.37%
专业人士终于出现了~!
对比一下,天河1A是140个机柜,Linpack性能2.57PFlops,峰值4.7PFlops;日本的“京1号”672个机柜,Linpack性能8P,效率93%,峰值8.61P,未来扩展至800个机柜,峰值10P
hswz 发表于 2011-10-29 08:59
相对CPU设计,我觉得超算设计水平江南所更高一筹,江南所的神威4000ALinpack效率超过90%,排行榜首次出现Linpa ...
就超级计算的关键技术:互联来说,神威蓝光是非常出色的。
     从神威蓝光的LINPACK效率可以看到,从单cpu到单机柜1024个cpu互联, 效率只下降了0.13%,单机柜到整机效率下降0.7%,这个说明其互联系统做得相当好。
     实际整机的效率的瓶颈在单核的效率,我想主要还是在65nm工艺下单个die里塞进16个核,芯片面积还是有点捉襟见肘, 在最大芯片面积受限的条件下,cache容量肯定受到相当的限制,由于不能放进更多的内存控制器,访存带宽受到的限制也很明显。
hswz 发表于 2011-10-29 10:08
对比一下,天河1A是140个机柜,Linpack性能2.57PFlops,峰值4.7PFlops;日本的“京1号”672个机柜,Linpack性能 ...
猛得一塌糊涂啊。。。。。。
不知道神威的新一代超级计算机会不会走异构的道路。。。。。貌似江南所在做GPU。。。
申威处理器的频率太低了。。。。主频提升难度很大吗???要想成为主流cpu,主频要3G左右。。。
不知道飞腾处理器怎样了。。。貌似水平也不差。。。
龙芯现在比较落后了。。。。
dddnc 发表于 2011-10-29 14:02
申威处理器的频率太低了。。。。主频提升难度很大吗???要想成为主流cpu,主频要3G左右。。。
不知道飞腾 ...
这个应该和设计有关吧。
如果提高频率,功耗就上去了;
再说还有工艺,65nm,自然频率会低些。

有个表上面,
申威功耗70w,140G,
按功耗来算,真的是超过了45nm的IBM,
真的很了不得啊
不过,估计里面也猫腻多多,
不同的cache之类的东西,
虽然运算速度都一样,
但算同一个程序,自然花的时间不一样


不过无论怎么说,以65nm的工艺,达到甚至超过45nm的功率效率,
要说是世界上的顶尖水平,我也信啊

不过无论怎么说,以65nm的工艺,达到甚至超过45nm的功率效率,
要说是世界上的顶尖水平,我也信啊
waaadoooo 发表于 2011-10-29 14:32
不过无论怎么说,以65nm的工艺,达到甚至超过45nm的功率效率,
要说是世界上的顶尖水平,我也信啊
龙芯也在一直打功耗比这张牌,3B是128gflops,40W,能效是最高的。

兔鳖 发表于 2011-10-29 15:50
龙芯也在一直打功耗比这张牌,3B是128gflops,40W,能效是最高的。


拜托,不要拿龙芯来恶心我,好不好?

你知道个啥?
龙芯是采用加速技术,并非通用处理器,
也就是说,要比,他应该跟GPU,CELL处理器这些玩意去比,
跟申威来比,不合适,
你明白了没有?
兔鳖 发表于 2011-10-29 15:50
龙芯也在一直打功耗比这张牌,3B是128gflops,40W,能效是最高的。


拜托,不要拿龙芯来恶心我,好不好?

你知道个啥?
龙芯是采用加速技术,并非通用处理器,
也就是说,要比,他应该跟GPU,CELL处理器这些玩意去比,
跟申威来比,不合适,
你明白了没有?

waaadoooo 发表于 2011-10-29 15:58
拜托,不要拿龙芯来恶心我,好不好?

你知道个啥?


首先龙芯的性能就是在那里,为什么恶心到你了,多一个国产的不行吗。其次龙芯3b虽然有向量核,但还是通用处理器,3B+主频提升到1.5g,192gflops,据内部人说原来的3b在通用性上不如3a,在b+上得到很大的改善。目前这款芯片已经流片,几个月内就有消息。3b本来就是要用在超算上做计算的,实现了目的就行。
waaadoooo 发表于 2011-10-29 15:58
拜托,不要拿龙芯来恶心我,好不好?

你知道个啥?


首先龙芯的性能就是在那里,为什么恶心到你了,多一个国产的不行吗。其次龙芯3b虽然有向量核,但还是通用处理器,3B+主频提升到1.5g,192gflops,据内部人说原来的3b在通用性上不如3a,在b+上得到很大的改善。目前这款芯片已经流片,几个月内就有消息。3b本来就是要用在超算上做计算的,实现了目的就行。
兔鳖 发表于 2011-10-29 16:06
首先龙芯的性能就是在那里,为什么恶心到你了,多一个国产的不行吗。其次龙芯3b虽然有向量核,但还是通 ...
你明白有向量核就成,
有这个玩意存在,而且运算速度还这么低,
那么,两个核的技术水平根本不是一个档次的,
不,是隔了好几个档次的东西。

看运算速度,咱们还是看显卡得了,这玩意速度快得很;
其实很多年前的CELL就已经很牛逼了
申威的对比者是最新的power,以及性能还稍不如的,日本的处理器。

至于龙芯,不知道该怎么比,只是不知道能达到cell的可编程性、效率以及运算速度么?
至于和申威、power之类的比?
对不起,不是一个类别的东西。
其实也不用这么贬低龙芯。。。。。毕竟龙芯也是为祖国的CPU事业做出了比较大的贡献的。。。而且得到了军方和政府的支持和应用。。。。
申威处理器其实也不要太骄傲了。。申威的强大有很多因素是因为血统的高贵(alpha),不完全是江南所的实力所带来的。。
我现在比较关心申威的下一代处理器的水平和未来是否能融入到国产小型机上去。。。
还有山寨sun的银河沸腾我觉得未来的应用面也很不错。。。sun的小鸡不少行业还在采用,,但是知识产权问题是个麻烦。。
申威处理器从知识产权上说已经没有问题了。。alpha的专利已经到期。hp已经放弃alpha了。。未来在国产高端服务器上的应用将很有发展机会。。。
龙芯从技术上来说已经和上面两家有较大差距了。。我建议龙芯还是主攻低端的PC桌面应用比较好点,可以避开上面两位大佬的锋芒。。。
申威和飞腾主攻高端服务器应用比较有前途。。。。。毕竟这两款体系结构处理器的应用软件还是比较丰富的。。不必从头开始
不明白的是为什么国内一直没有研究院所山寨IBM的power处理器???这东西如果山寨出来,那可是非常有市场的。。。金融、电信、政府都是IBM小鸡哦~!
其实胡当年应该听李院士的想法山寨power。。。。mips虽然容易,但是高端领域的应用很差。。mips主要是偏低端嵌入式应用的。。。。
龙芯拿mips来当超级计算机的处理器未来路会越来越难走的。。。。
建议龙芯主攻低端嵌入式和桌面应用比较实际些。。。。

waaadoooo 发表于 2011-10-29 16:15
申威的对比者是最新的power,以及性能还稍不如的,日本的处理器。

至于龙芯,不知道该怎么比,只是不知道 ...

申威1600采用自主RISC指令集,16个同构处理器核,核内一级指令和数据Cache,二级指令和数据的统一Cache,支持256位短向量SIMD===看性能简介这个支持256位短向量SIMD不知是否意味着运算性能为140GFLOPS的申威1600也和运算性能为128GFLOPS的龙芯3B一样有向量加速单元
waaadoooo 发表于 2011-10-29 16:15
申威的对比者是最新的power,以及性能还稍不如的,日本的处理器。

至于龙芯,不知道该怎么比,只是不知道 ...

申威1600采用自主RISC指令集,16个同构处理器核,核内一级指令和数据Cache,二级指令和数据的统一Cache,支持256位短向量SIMD===看性能简介这个支持256位短向量SIMD不知是否意味着运算性能为140GFLOPS的申威1600也和运算性能为128GFLOPS的龙芯3B一样有向量加速单元