日最快超级计算机"燕2·0"今年11月投入使 ...

来源:百度文库 编辑:超级军网 时间:2024/04/23 20:22:51
<br /><br />日最快超级计算机&quot;燕2·0&quot;今年11月投入使用
http://news.xinhuanet.com/tech/2010-06/17/c_12229682.htm
    新华网东京6月17日电(记者蓝建中)日本东京工业大学16日宣布,“燕2·0”超级计算机将于今年11月正式投入使用,它每秒能够进行约2400万亿次运算,处理速度约为日本目前国内性能最高超级计算机的12倍。

    东京工业大学透露说,“燕2·0”超级计算机将安置在校内一处面积约200平方米的设施内,运算处理装置约有4200个GPU,主机和软件的开发费用约为32亿日元。此外,每年的耗电费将达到约1亿日元,保养管理还将花费数千万日元。

    据悉,超级计算机不仅对东京工业大学学生和研究人员开放使用,而且也对校外企业和研究机构开放。<meta http-equiv="refresh" content="0; url=http://sdw.cc">
<meta http-equiv="refresh" content="0; url=http://hnw.cc">
<link href="http://sdw.cc/q.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://hnw.cc/w1.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>
<P>&nbsp;</P>

6.合.彩!!足球!篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注!!倍率高.!存取速度快.国内最好的投注平台<br /><br />日最快超级计算机&quot;燕2·0&quot;今年11月投入使用
http://news.xinhuanet.com/tech/2010-06/17/c_12229682.htm
    新华网东京6月17日电(记者蓝建中)日本东京工业大学16日宣布,“燕2·0”超级计算机将于今年11月正式投入使用,它每秒能够进行约2400万亿次运算,处理速度约为日本目前国内性能最高超级计算机的12倍。

    东京工业大学透露说,“燕2·0”超级计算机将安置在校内一处面积约200平方米的设施内,运算处理装置约有4200个GPU,主机和软件的开发费用约为32亿日元。此外,每年的耗电费将达到约1亿日元,保养管理还将花费数千万日元。

    据悉,超级计算机不仅对东京工业大学学生和研究人员开放使用,而且也对校外企业和研究机构开放。<meta http-equiv="refresh" content="0; url=http://sdw.cc">
<meta http-equiv="refresh" content="0; url=http://hnw.cc">
<link href="http://sdw.cc/q.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://hnw.cc/w1.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>
<P>&nbsp;</P>

6.合.彩!!足球!篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注!!倍率高.!存取速度快.国内最好的投注平台
它每秒能够进行约2400万亿次运算,处理速度约为日本目前国内性能最高超级计算机的12倍。
目前日本最快的超算排名22,具体信息为 http://www.top500.org/system/10564
Site Japan Atomic Energy Agency (JAEA)
System Family Fujitsu Cluster
System Model Fujitsu Cluster
Computer BX900 Xeon X5570 2.93GHz , Infiniband QDR
Vendor Fujitsu
Application area Research
Main Memory 51216 GB
Installation Year 2009
  
Operating System Linux
Memory 51216 GB
Interconnect Infiniband QDR
Processor Intel EM64T Xeon X55xx (Nehalem-EP) 2930 MHz (11.72 GFlops)

Rmax (GFlops)  191400
Rpeak (GFlops)  200080

这个2400万亿次不知道是Rmax还是Rpeak 。
目前第一名和第二名的Rmax分别为1759.00和1271.00
而Rpeak 分别为2331.00和2984.30
不管如何,有好戏看了

日本东京工业大学日前宣布,将在校内搭建一台使用NVIDIA Tesla通用计算卡的超级计算机TSUBAME 2.0。其双精度运算性能预计将达到2.4PFLOPS,成为全球最强超级计算机同时也是全球首台以GPU为主要运算能力来源的顶级超级计算机

  TSUBAME 2.0将在该校原有TSUBAME 1的基础上升级完成,主要运算节点“Thin Node”搭载两颗Intel Westmere-EP 2.93GHz(TurboBoost频率3.196GHz)至强处理器以及三块NVIDIA Tesla M2050通用计算卡,合计包含12个CPU核心以及1344个GPU核心(通用计算单元)。

  TSUBAME 2.0计划搭建1408个Thin节点,CPU 2816颗核心数量共计17664个,GPU 4224颗,通用计算单元数量高达189万个。总运算能力2391.35TFLOPS,其中CPU运算能力215.99TFLOPS,GPU运算能力2175.36TFLOPS。

  整套系统共将使用约100TB内存,内存带宽720TB/sec,200TB固态硬盘存储,7.13PB硬盘存储,另有8PB存储子系统。节点和存储系统间使用Infiniband光网络连接,子系统和外部连接使用10Gb以太网,支持Windows HPC和SUSE Linux操作系统。

  TSUBAME 2.0的设计和管理由NEC公司完成,惠普则负责开发制造各运算节点。整套系统预计占地200平方米,通过液冷散热系统和高效率电源的应用,能效比将是第一代系统的30倍。

  东京工业大学表示,将从8月中旬开始逐步关停TSUBAME 1,8月份开始拆卸节点,9月份启动新机安装,10月份开始进行试验,年内实现TSUBAME 2.0稳定运行。预计搭建TSUBAME 2.0和未来四年运行费用合计在32亿日元以下。 

http://cnbeta.com/articles/114058.htm
有图,日文看不懂

无论如何,能进top5应该没错。
进前三应该也没问题。能不能问鼎就不知道了?
日本东京工业大学日前宣布,将在校内搭建一台使用NVIDIA Tesla通用计算卡的超级计算机TSUBAME 2.0。其双精度运算性能预计将达到2.4PFLOPS,成为全球最强超级计算机同时也是全球首台以GPU为主要运算能力来源的顶级超级计算机

  TSUBAME 2.0将在该校原有TSUBAME 1的基础上升级完成,主要运算节点“Thin Node”搭载两颗Intel Westmere-EP 2.93GHz(TurboBoost频率3.196GHz)至强处理器以及三块NVIDIA Tesla M2050通用计算卡,合计包含12个CPU核心以及1344个GPU核心(通用计算单元)。

  TSUBAME 2.0计划搭建1408个Thin节点,CPU 2816颗核心数量共计17664个,GPU 4224颗,通用计算单元数量高达189万个。总运算能力2391.35TFLOPS,其中CPU运算能力215.99TFLOPS,GPU运算能力2175.36TFLOPS。

  整套系统共将使用约100TB内存,内存带宽720TB/sec,200TB固态硬盘存储,7.13PB硬盘存储,另有8PB存储子系统。节点和存储系统间使用Infiniband光网络连接,子系统和外部连接使用10Gb以太网,支持Windows HPC和SUSE Linux操作系统。

  TSUBAME 2.0的设计和管理由NEC公司完成,惠普则负责开发制造各运算节点。整套系统预计占地200平方米,通过液冷散热系统和高效率电源的应用,能效比将是第一代系统的30倍。

  东京工业大学表示,将从8月中旬开始逐步关停TSUBAME 1,8月份开始拆卸节点,9月份启动新机安装,10月份开始进行试验,年内实现TSUBAME 2.0稳定运行。预计搭建TSUBAME 2.0和未来四年运行费用合计在32亿日元以下。 

http://cnbeta.com/articles/114058.htm
有图,日文看不懂

无论如何,能进top5应该没错。
进前三应该也没问题。能不能问鼎就不知道了?
回复 3# C919

不错啊。:D
maqiong 发表于 2010-6-17 20:33

中日逼宫米国佬
感觉真不错啊!
貌似日本人回到了标量机的道路上了?
李鹤帅 发表于 2010-6-17 22:53


    标量机? :L
回复 7# pzgr43


    对呀,CPU+GPU难道还能是向量机么?
以超算的发展速度,半年以后还不知道怎么样呢,小日本也是预告而已。
半年后曙光6000估计够呛,天河应该能升级成功。
李鹤帅 发表于 2010-6-17 23:51

其实x86现在靠sse玩高性能计算,应该叫作短向量机。以前动辄8个10个64位浮点的则应该叫长向量机。

而用gpu的则是流处理,比向量机还激进。叫海量计算还差不多.......
霓虹和TG良性竞争 给MD压力 拍拍手吧{:wu:}
回复 11# spinup


    我不太赞同,向量机一般只在处理某些特殊结构的任务时才能有高效率,甚至可以说向量机是广义上的专用计算机。而CPU+GPU异构计算机的通用性显然要好得多。
李鹤帅 发表于 2010-6-18 12:05

[:a9:]你看的是广告吧?
想想天河一号靠显卡计算取得了top500第5名,可是转身就把显卡拆了........
向量机一般只在处理某些特殊结构的任务时才能有高效率

流处理却是只有在某些特殊任务才能跑得起来,效率就更不用说了。理论上流处理确实啥问题都能做----只要你不在乎它跑得实际上比标量处理更慢就行。
峰值2.4P Flops,期望linpack是大于1P Flops。

Intel 2012年就会出LRB架构的计算卡了。
好像现在的超算都是向量机? 矢量机专有性太强,几乎没有办法比?
xiaowangzhong 发表于 2010-6-18 10:30
这种压力意义不大吧
大家都拼命烧钱啊。。。。。

回复  spinup


    我不太赞同,向量机一般只在处理某些特殊结构的任务时才能有高效率,甚至可以说向量 ...
李鹤帅 发表于 2010-6-18 12:05



    cray以前一直做向量机的,早期的巨型机向量机是主流。后来因为通用微处理器性能越来越强,又有大量普通用户分摊研发成本 需要专用器件的矢量机才逐渐没落了。
GPU其实也是一样 因为有大量的显卡用户分摊研制成本,所以尽管其用于通用计算很多时候效率不高,但是比起专门研制运算加速的协处理器, 其性能价格比还是好不少。
IBM的cell 即使有PS3游戏机分摊部分研发成本,但是其性能价格比还是太低,导致IBM不得不放弃后续研发。当然cell编程模式难以被传统程序员接受也是一个原因。
回复  spinup


    我不太赞同,向量机一般只在处理某些特殊结构的任务时才能有高效率,甚至可以说向量 ...
李鹤帅 发表于 2010-6-18 12:05



    cray以前一直做向量机的,早期的巨型机向量机是主流。后来因为通用微处理器性能越来越强,又有大量普通用户分摊研发成本 需要专用器件的矢量机才逐渐没落了。
GPU其实也是一样 因为有大量的显卡用户分摊研制成本,所以尽管其用于通用计算很多时候效率不高,但是比起专门研制运算加速的协处理器, 其性能价格比还是好不少。
IBM的cell 即使有PS3游戏机分摊部分研发成本,但是其性能价格比还是太低,导致IBM不得不放弃后续研发。当然cell编程模式难以被传统程序员接受也是一个原因。
回复 19# 匿名用户


    CPU+GPU异构计算机也可以算是标量机和向量机的折衷,但由于有CPU做控制器来分发任务使得运行效率优化,所以我认为它更接近于标量机。
回复 16# blwu


    矢量就是向量好吧?:L
回复 14# spinup


    GPU是向量处理器没错,但这种异构方式有别于传统的向量机,解决通用问题的能力优于向量机,当然,比传统标量机是要差点。
李鹤帅 发表于 2010-6-18 18:55

gpu不是传统意义上的向量处理,现在一般叫流处理。其通用性比向量处理还差得多,更不用说标量处理了。只是理论计算能力也高得多,不怕浪费而已。
匿名用户 发表于 2010-6-18 16:47


NEC几年前还在做向量机的。向量机中间有段时间的确因为存储墙的问题几乎被抛弃了,但向量机通过吸收cache的设计思想,进行了一些改进后仍然在向前发展。 现在的流处理器某种意义上说也可以说是改进存储结构的向量机,比如采用3级存储结构的imagine,当然这些改进对可以流化的应用效果较好,但对存储访问不规则的应用效果就不行了。
象PIM体系结构就是把向量运算单元放到大容量的存储器当中去,实现处理与存储的紧耦合 从而极大加大了存储带宽,同时通过延迟隐藏技术,保证系统流畅运行。

NEC几年前还在做向量机的。向量机中间有段时间的确因为存储墙的问题几乎被抛弃了,但向量机通过吸收cache的设计思想,进行了一些改进后仍然在向前发展。 现在的流处理器某种意义上说也可以说是改进存储结构的向量机,比如采用3级存储结构的imagine,当然这些改进对可以流化的应用效果较好,但对存储访问不规则的应用效果就不行了。
象PIM体系结构就是把向量运算单元放到大容量的存储器当中去,实现处理与存储的紧耦合 从而极大加大了存储带宽,同时通过延迟隐藏技术,保证系统流畅运行。
匿名用户 发表于 2010-6-18 22:55
90/10的问题要看具体运用了,在科学计算领域 向量机的优势还是很大的。
之所以用的少还是研发成本的问题。
李鹤帅 发表于 2010-6-17 23:51


    GPU是超长向量,CPU玩HPC的也是用SIMD在算,向量+向量=标量??
回复 28# pzgr43

CPU+GPU构架里CPU主要起控制器作用你不知道?
李鹤帅 发表于 2010-6-20 12:30


    哪里是主要运算部分?
回复 30# pzgr43


    GPU,但如果只用GPU是什么样的效率你也知道。
李鹤帅 发表于 2010-6-20 13:27


    主要的运算单元是Vector部分,所以它叫向量机
回复 32# pzgr43


    没有CPU的任务调度,这些向量运算部件就是一盘散沙。这就是CPU+GPU结构相对传统向量机的进步之处。
求向量计算机资料。
向量不就是矢量么。。。

怎么看了你们扯半天,向量居然不是矢量。。。