第34届超级计算机排行:Cray首次登顶、中国天河第五

来源:百度文库 编辑:超级军网 时间:2024/04/29 11:29:35
TOP500.org今天公布了第34届全球超级计算机五百强排行榜,其中两点特别值得关注:著名超级计算机厂商Cray终于挤掉IBM,史上第一次登上了榜首宝座;我国第一台国产千万亿次(峰值性能/PetaFlops)超级计算机“天河一号”历史性地杀到了第五位,中国也是继美国之后世界上第二个能够研制千万亿次超级计算机的国家。

近年来IBM凭借蓝色基因系列长期霸占榜首位置,位于美国洛斯阿拉莫斯国家实验室、PowerXCell+Opteron处理器打造的“走鹃”(Roadrunner)还在2008年夏天第一个将Linpack实测最大性能带到了PFlops级别(每秒一千万亿次浮点计算)。经过三次努力后,Cray打造、位于美国橡树岭国家实验室计算科学中心的“美洲虎”(Jaguar)终于登顶成功,以1.759PFlops的最大性能傲视群雄(峰值性能2.331PFlops)。事实上在此前两次排行中,美洲虎与走鹃之间的性能差距也不过仅仅4%。

美洲虎半年间性能猛增69%的秘密在于处理器核心数量的暴涨:在配备AMD刚刚发布的六核心“伊斯坦布尔”Opteron 2435 2.6GHz(单颗浮点性能10.4GFlops)后,美洲虎的核心数从129600个增至224162个(+73%),且每核心搭配2GB内存,每个完整的计算节点由12个处理核心和16GB共享内存组成,整套系统300TB内存、10PB(10000TB)硬盘。

另外走鹃系统中有两个联机单元(CU)被分离出去执行其他任务,Linpack性能反而从1.105PFlops降低到1.042PFlops,也间接成就了美洲虎。

Cray和橡树岭早在今年六月份就表示,他们没有把美洲虎的计算能力浪费在Linpack测试上,而是迅速投入了科学难题中,而且当时就算胜出IBM走鹃也是微弱优势,不如再耐心等待半年,给世界一个大大的意外。

据称,美洲虎系统只用17小时17分钟就搞定了一个n=5474272的线性方程系统。

从1976年开始,Cray就一直是超级计算机市场的No.1。在1993年6月TOP500榜单第一次发布的时候,其中41%的系统都来自Cray,第二名的富士通也仅占13.8%。之后高性能计算市场风云突变,Cray丢掉了领先地位,混迹于高端政府实验室和学术研究中,IBM、HP等则迅速崛起。

在最新排行榜中Cray的系统只有19套,也就是说份额仅为可怜的3.8%,不过其中14套都在前一百名,而且占据冠军和季军位置——排在第三名的“Kraken”((挪威传说中的北海巨妖))位于美国田纳西州大学国家计算科学研究院,也是出自Cray之手,处理器同样是伊斯坦布尔Opteron 2435,共计98928个处理核心,最大性能831.70TFlops。

德国JUGENE跌至第四位,而国防科技大学研制、十月底刚刚亮相、位于天津国家超级计算中心的天河一号(Tianhe-1)傲然屹立在第五位。这也是我国超级计算机的最好成绩,此前曙光4000A和曙光5000A曾两次排到第十位。

天河一号采用Intel Xeon E5540 2.53GHz/E5450 3.00GHz四核心处理器(分别为Nehalem和Penryn架构)、Infiniband网络、Linux操作系统,共有71680个处理核心、98304GB内存,最大性能563.10TFlops,峰值性能1206.19TFlops,主要用来执行石油勘探、大飞机设计模拟等任务。

特别值得一提的是,这是一套混合设计系统,使用Intel处理器和AMD Radeon HD 4870 X2显卡共同进行加速处理,每个节点内包含两颗Xeon和一块双芯片的Radeon HD 4870 X2。NVIDIA Tesla/CUDA技术也在努力进军超级计算机领域,不过TOP500.org暂时还不承认这种单纯的GPU系统。

曙光5000A前次排名第十,半年前跌至第15,如今位列第19。另外中科院计算机网络信息中心的“深腾7000”(DeepComp 7000)排在第43位,使用Xeon 3.00/2.93GHz四核心处理器,最大性能102.80TFlops,峰值性能145.97TFlops。

此番TOP500中我国内地贡献了21套系统,份额4.2%,整体最大性能1379.877TFlops,另外香港特区1套(BladeCenter HS22/184位/32.325TFlops),台湾已经从榜单上消失。其他主要国家:美国277套、英国45套、德国27套、法国26套、日本16套。

其他要点:

1、Intel处理器占据了80.4%(402套)的整体份额(上次339套/79.8%)和76%的四核心系统份额,采纳Nehalem-EP架构处理器的系统已达95套,而上次位33套。IBM系统从55套降至52套,AMD从43套降至42套,但是前五名中有四个都采用了AMD处理器。

2、已经有426套系统使用了四核心处理器,在几乎所有方面都加速了性能提升,另外双核心系统59套、单核心系统只剩4套,还有3套使用AMD六核心伊斯坦布尔、6套使用九核心的IBM Cell。

3、厂商方面HP制造的系统仍略微多于IBM的,210套对185套,但就总体性能来说还是IBM更高,34.8%对22.8%,只不过二者份额均有所下滑(Cray崛起)。

4、在前十强中,只有第四的德国JUGENE和第五的中国天河一号位于美国之外。

5、第500名半年前可排在第336位,性能为20TFlops,六个月前的TOP500门槛则是17.1TFlops。

6、全部500套系统总性能27.6PFlops,半年前时22.6PFlops,一年前则是16.9PFlops。

7、一百强的门槛已经从39.58TFlops提高到47.72TFlops。

8、500套系统平均处理核心9174个,此前两次统计分别为8210个和6240个。

9、417套系统属于集群(Cluster),份额83.4%,成为最广泛的超级计算机架构。

10、千兆以太网仍是最流行的系统内部互连技术,用于259套,另外181套使用了InfiniBand。

11、前50名中:美国份额44%(低于整体55.4%);IBM占据30%的系统和33.6%的性能,第二名是Cray的18%和29.4%,HP在SGI之后仅列第四;只有一套系统在使用千兆以太网;Cray XT系统应用最普及,份额18%,之后IBM蓝色基因,16%;处理器方面Intel 38%、AMD 30%、IBM 28%;平均处理核心44338个,半年前是40871个,一年前是30490个。
第34届超级计算机五百强TOP500排行榜详细资料:
S03182401.jpg
S03182415.jpg
S03182426.jpgTOP500.org今天公布了第34届全球超级计算机五百强排行榜,其中两点特别值得关注:著名超级计算机厂商Cray终于挤掉IBM,史上第一次登上了榜首宝座;我国第一台国产千万亿次(峰值性能/PetaFlops)超级计算机“天河一号”历史性地杀到了第五位,中国也是继美国之后世界上第二个能够研制千万亿次超级计算机的国家。

近年来IBM凭借蓝色基因系列长期霸占榜首位置,位于美国洛斯阿拉莫斯国家实验室、PowerXCell+Opteron处理器打造的“走鹃”(Roadrunner)还在2008年夏天第一个将Linpack实测最大性能带到了PFlops级别(每秒一千万亿次浮点计算)。经过三次努力后,Cray打造、位于美国橡树岭国家实验室计算科学中心的“美洲虎”(Jaguar)终于登顶成功,以1.759PFlops的最大性能傲视群雄(峰值性能2.331PFlops)。事实上在此前两次排行中,美洲虎与走鹃之间的性能差距也不过仅仅4%。

美洲虎半年间性能猛增69%的秘密在于处理器核心数量的暴涨:在配备AMD刚刚发布的六核心“伊斯坦布尔”Opteron 2435 2.6GHz(单颗浮点性能10.4GFlops)后,美洲虎的核心数从129600个增至224162个(+73%),且每核心搭配2GB内存,每个完整的计算节点由12个处理核心和16GB共享内存组成,整套系统300TB内存、10PB(10000TB)硬盘。

另外走鹃系统中有两个联机单元(CU)被分离出去执行其他任务,Linpack性能反而从1.105PFlops降低到1.042PFlops,也间接成就了美洲虎。

Cray和橡树岭早在今年六月份就表示,他们没有把美洲虎的计算能力浪费在Linpack测试上,而是迅速投入了科学难题中,而且当时就算胜出IBM走鹃也是微弱优势,不如再耐心等待半年,给世界一个大大的意外。

据称,美洲虎系统只用17小时17分钟就搞定了一个n=5474272的线性方程系统。

从1976年开始,Cray就一直是超级计算机市场的No.1。在1993年6月TOP500榜单第一次发布的时候,其中41%的系统都来自Cray,第二名的富士通也仅占13.8%。之后高性能计算市场风云突变,Cray丢掉了领先地位,混迹于高端政府实验室和学术研究中,IBM、HP等则迅速崛起。

在最新排行榜中Cray的系统只有19套,也就是说份额仅为可怜的3.8%,不过其中14套都在前一百名,而且占据冠军和季军位置——排在第三名的“Kraken”((挪威传说中的北海巨妖))位于美国田纳西州大学国家计算科学研究院,也是出自Cray之手,处理器同样是伊斯坦布尔Opteron 2435,共计98928个处理核心,最大性能831.70TFlops。

德国JUGENE跌至第四位,而国防科技大学研制、十月底刚刚亮相、位于天津国家超级计算中心的天河一号(Tianhe-1)傲然屹立在第五位。这也是我国超级计算机的最好成绩,此前曙光4000A和曙光5000A曾两次排到第十位。

天河一号采用Intel Xeon E5540 2.53GHz/E5450 3.00GHz四核心处理器(分别为Nehalem和Penryn架构)、Infiniband网络、Linux操作系统,共有71680个处理核心、98304GB内存,最大性能563.10TFlops,峰值性能1206.19TFlops,主要用来执行石油勘探、大飞机设计模拟等任务。

特别值得一提的是,这是一套混合设计系统,使用Intel处理器和AMD Radeon HD 4870 X2显卡共同进行加速处理,每个节点内包含两颗Xeon和一块双芯片的Radeon HD 4870 X2。NVIDIA Tesla/CUDA技术也在努力进军超级计算机领域,不过TOP500.org暂时还不承认这种单纯的GPU系统。

曙光5000A前次排名第十,半年前跌至第15,如今位列第19。另外中科院计算机网络信息中心的“深腾7000”(DeepComp 7000)排在第43位,使用Xeon 3.00/2.93GHz四核心处理器,最大性能102.80TFlops,峰值性能145.97TFlops。

此番TOP500中我国内地贡献了21套系统,份额4.2%,整体最大性能1379.877TFlops,另外香港特区1套(BladeCenter HS22/184位/32.325TFlops),台湾已经从榜单上消失。其他主要国家:美国277套、英国45套、德国27套、法国26套、日本16套。

其他要点:

1、Intel处理器占据了80.4%(402套)的整体份额(上次339套/79.8%)和76%的四核心系统份额,采纳Nehalem-EP架构处理器的系统已达95套,而上次位33套。IBM系统从55套降至52套,AMD从43套降至42套,但是前五名中有四个都采用了AMD处理器。

2、已经有426套系统使用了四核心处理器,在几乎所有方面都加速了性能提升,另外双核心系统59套、单核心系统只剩4套,还有3套使用AMD六核心伊斯坦布尔、6套使用九核心的IBM Cell。

3、厂商方面HP制造的系统仍略微多于IBM的,210套对185套,但就总体性能来说还是IBM更高,34.8%对22.8%,只不过二者份额均有所下滑(Cray崛起)。

4、在前十强中,只有第四的德国JUGENE和第五的中国天河一号位于美国之外。

5、第500名半年前可排在第336位,性能为20TFlops,六个月前的TOP500门槛则是17.1TFlops。

6、全部500套系统总性能27.6PFlops,半年前时22.6PFlops,一年前则是16.9PFlops。

7、一百强的门槛已经从39.58TFlops提高到47.72TFlops。

8、500套系统平均处理核心9174个,此前两次统计分别为8210个和6240个。

9、417套系统属于集群(Cluster),份额83.4%,成为最广泛的超级计算机架构。

10、千兆以太网仍是最流行的系统内部互连技术,用于259套,另外181套使用了InfiniBand。

11、前50名中:美国份额44%(低于整体55.4%);IBM占据30%的系统和33.6%的性能,第二名是Cray的18%和29.4%,HP在SGI之后仅列第四;只有一套系统在使用千兆以太网;Cray XT系统应用最普及,份额18%,之后IBM蓝色基因,16%;处理器方面Intel 38%、AMD 30%、IBM 28%;平均处理核心44338个,半年前是40871个,一年前是30490个。
第34届超级计算机五百强TOP500排行榜详细资料:
S03182401.jpg
S03182415.jpg
S03182426.jpg
:victory:克雷立功了....
失落的天堂 发表于 2009-11-16 17:29


    想当年,让蓝色巨人手足无措
看今朝....
曙光加油啊!!!

不知道到时候能不能前十中有两个是中国的。
不会用的都是大米的处理器吧,有没有例外?无论谁家造的机器,他们都挣钱啊。
狗剩那个曙光六千能冲进前二十就算是个好的开始了。
At No. 4 is the most powerful system outside the U.S. -- an IBM BlueGene/P supercomputer located at the Forschungszentrum Juelich (FZJ) in Germany. It achieved 825.5 teraflop/s on the Linpack benchmark and was No. 3 in June 2009.

Rounding out the top 5 positions is the new Tianhe-1 (meaning River in Sky) system installed at the National Super Computer Center in Tianjin, China and to be used to address research problems in petroleum exploration and the simulation of large aircraft designs. The highest ranked Chinese system ever, Tianhe-1 is a hybrid design with Intel Xeon processors and AMD GPUs used as accelerators. Each node consists of two AMD GPUs attached to two Intel Xeon processors.

哈哈,德国佬那个也是美国IBM造
老毛子那个500T的呢?
祝贺“天河”,未来两年,就看美国两亿亿次的“红杉”和日本1-1.8亿亿次“京速”超级计算机,又一个巨大的跨越!!
C919 发表于 2009-11-16 19:10

欧洲貌似有两个造HPC的吧.............德国人怎么让MD来造了?

太没面子了!

Bull (France)and Eurotech (Italy) 这两大HPC制造商不作为?


(Japan Economic Newswire Via Acquire Media NewsEdge) TOKYO, Nov. 13_(Kyodo) _ (EDS: UPDATING) A key government panel on cutting wasteful spending on Friday sought to drastically curtail expenses for a project to develop the world's fastest next-generation supercomputer, for which a 26.7 billion yen budget allocation has been requested.

Riken, an independent administrative body under the Ministry of Education, Culture, Sports, Science and Technology, is working with private companies to develop a computer with the world's highest capability. But members of the Government Revitalization Unit have raised questions, saying, "Why does it have to be the world's fastest?" and, "It's hard to understand how (the supercomputer) will contribute to the daily lives of people." The panel initially decided to "freeze" the supercomputer project, but later changed the decision to drastically "curtail spending for it to make it almost the same as shelving of the spending in the next fiscal year" beginning in April 2010.

祝贺“天河”,未来两年,就看美国两亿亿次的“红杉”和日本1-1.8亿亿次“京速”超级计算机,又一个巨大的跨 ...
追寻 发表于 2009-11-16 19:26


(Japan Economic Newswire Via Acquire Media NewsEdge) TOKYO, Nov. 13_(Kyodo) _ (EDS: UPDATING) A key government panel on cutting wasteful spending on Friday sought to drastically curtail expenses for a project to develop the world's fastest next-generation supercomputer, for which a 26.7 billion yen budget allocation has been requested.

Riken, an independent administrative body under the Ministry of Education, Culture, Sports, Science and Technology, is working with private companies to develop a computer with the world's highest capability. But members of the Government Revitalization Unit have raised questions, saying, "Why does it have to be the world's fastest?" and, "It's hard to understand how (the supercomputer) will contribute to the daily lives of people." The panel initially decided to "freeze" the supercomputer project, but later changed the decision to drastically "curtail spending for it to make it almost the same as shelving of the spending in the next fiscal year" beginning in April 2010.

祝贺“天河”,未来两年,就看美国两亿亿次的“红杉”和日本1-1.8亿亿次“京速”超级计算机,又一个巨大的跨 ...
追寻 发表于 2009-11-16 19:26
bessel 发表于 2009-11-16 19:40
翻译了
日本经济新闻社威盛收购讯)东京11月13_(共同社)_(编辑:更新)关于削减周五关键的政府开支浪费小组要求大幅削减为一个项目开发世界上最快的下一代超级计算机的费用,为此26.7亿日元的预算已请求拨款。
理研,根据一个独立的教育,文化,体育,科学和技术部的行政机构,正与私营公司发展同世界最高性能的计算机。但是,政府振兴组成员提出的问题,说:“为什么要成为世界上最快的?”和,“很难理解如何(这台超级计算机),将有助于人们的日常生活。”该小组最初决定“冻结”超级计算机项目,但后来改变了决定,大幅“削减开支它,使其几乎与在下一财年的开支2010年4月开始在”搁置相同。


日本新政府够损的了!!日本理化研究所研发过程马上结束了,将要进入实体制造阶段,这节骨眼把经费削减了:D,超级计算机乃是一个国家科技实力的象征,难道必须有助于人们的日常生活吗??现实意义就这末重要吗??学学TG !!:D:D


仔细看看:
第四和第五的实测性能差距(+46.59%);
再看看第五和第六的差距。(+3.45%)

成绩要肯定,不足要正视。
以前的最好成绩是第十。

仔细看看:
第四和第五的实测性能差距(+46.59%);
再看看第五和第六的差距。(+3.45%)

成绩要肯定,不足要正视。
以前的最好成绩是第十。
追寻 发表于 2009-11-16 19:53


学啥呀。 需求决定..................没有了相关的强烈需求。 造着干啥子? 谁去养着那劳什子?
miaomiaomiao 发表于 2009-11-16 18:02


    NEC的,日本人用自己的处理器
请教一下前十的超级计算机价格(造价)是多少
另外请教一下NO.1的那个超级计算机的用途 谢谢
猛啊
山东人民发来贺电![:a15:][:a15:]:D
JSTCVW09CD 发表于 2009-11-16 20:13
中国利剑 发表于 2009-11-16 20:55


  有个问题(以前也问过,但好像没发出来),请内行说说-------现在超级计算机发展也快,如果这些大家伙过几年落后了,它的归宿在哪儿?会不会被拆成一个个小的机器派上一些用场,它的升级潜力如何。比如说,早期的银河曙光什么的,现在置身何处呢?

  有个问题(以前也问过,但好像没发出来),请内行说说-------现在超级计算机发展也快,如果这些大家伙过几年落后了,它的归宿在哪儿?会不会被拆成一个个小的机器派上一些用场,它的升级潜力如何。比如说,早期的银河曙光什么的,现在置身何处呢?
he part of program executing on CPU uses the Intel MKL-10.2.1.017 library and the part of GPU uses the AMD ACMLG-1.0 library especially optimized by NUDT. The optimization algorithms used to achieve a better result of LINPACK benchmark are as follows.

    * First, dynamic load balance technique is used when allocating the tasks between CPU and GPU.
    * Second, the instruction of streaming load/store is adopted to reduce the conflict between CPU and GPU’s data accessing. The third, software-pipelining technique is used to overlap the execution of GPU and the transmission of data between GPU and CPU. The forth, affinity-scheduling technique is used to reduce the performance fluctuation by utilizing processor cores' computing and controlling ability. The fifth, we optimize the functions of DGEMM in AMD ACMLG library and DTRTRI and DTRMM in Intel MKL library to speed up the performance of DTRSM.

For the sake of the stabilization, the frequency of GPU core is decreased from 750MHz to 575MHz. Besides this, the frequency of GPU’s memory is also decreased from 900MHz to 650MHz.
追寻 发表于 2009-11-16 19:26

今年日本财政已经到了穷途末路,连教育和科研经费都要被刀了,日本那项目可能被砍
曙光也打算用部分龙芯的啦

看看最后能排几名
砰砰! 发表于 2009-11-17 10:58


    期待中国的 首次用龙芯的超级jj 更期待nc的其他jj 加油中国!!
[:a6:]

坐等只吹牛不做事的江南所的cpu


博物馆或者垃圾场。

某个计算机博物馆甚至还保留着一些80年代的机器,可以免费玩。
性能么,about 0.5 MFlops 。

  有个问题(以前也问过,但好像没发出来),请内行说说-------现在超级计算机发展也快,如果这些 ...
谐奇趣 发表于 2009-11-17 09:29


博物馆或者垃圾场。

某个计算机博物馆甚至还保留着一些80年代的机器,可以免费玩。
性能么,about 0.5 MFlops 。

  有个问题(以前也问过,但好像没发出来),请内行说说-------现在超级计算机发展也快,如果这些 ...
谐奇趣 发表于 2009-11-17 09:29
追寻 发表于 2009-11-16 19:53
现实意义当然重要,不考虑老百姓的利益执政党就得滚蛋。
bessel 发表于 2009-11-18 07:08


    是这样啊
绿林好汉 发表于 2009-11-16 20:07
------------
就是差距1%也是千万和百万的量变啊
ssdy-2001 发表于 2009-11-18 09:55
------------
看来爆发金融危机还不考虑老百姓的利益的美国政府就得滚蛋
IBM占据30%的系统和33.6%的性能
==================
IBM厉害。
123456d 发表于 2009-11-16 19:14


    同问,记得这家伙比天河还先出来啊……
搞不懂为啥天河使用intel Xeon+AMD GPU的方案
而不用全套AMD opteron + GPU的方案?
追寻 发表于 2009-11-16 19:26


    貌似小鬼子的‘京速’出问题了,不知11年前能不能搞出来
一个国家的超级计算机数量应该能体现出这个国家的技术水平如何。


bull和另外一个都是cluster-maker, 他们能自己订制nehalem-ex的节点,但是做blue gene或者cray xt,有些难度。

欧洲貌似有两个造HPC的吧.............德国人怎么让MD来造了?
太没面子了!
Bull (France)and ...
JSTCVW09CD 发表于 2009-11-16 19:34


bull和另外一个都是cluster-maker, 他们能自己订制nehalem-ex的节点,但是做blue gene或者cray xt,有些难度。

欧洲貌似有两个造HPC的吧.............德国人怎么让MD来造了?
太没面子了!
Bull (France)and ...
JSTCVW09CD 发表于 2009-11-16 19:34
AMD有进步啊!
谐奇趣 发表于 2009-11-18 19:32


  银河1 2 3在国防科大都有陈列的,以前在六系楼里,现在好像搬到校史馆还是北边的银河楼去了
绿林好汉 发表于 2009-11-16 20:07