曙光5000A和IBM走鹃的功耗效率比较

来源:百度文库 编辑:超级军网 时间:2024/04/29 06:07:51
<br /><br />“走鹃”排名榜首,达到488 Mflops/瓦。
IBM蓝色基因/P排在第二位,功耗效率为376 Mflops/瓦。

曙光5000A不带水冷时:328 MFlops/瓦
         带水冷时: 230 Mflops/瓦
虽然采用AMD芯片,功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>

<P>&nbsp;</P>


(6.合.彩)♀足球♀篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台
<br /><br />“走鹃”排名榜首,达到488 Mflops/瓦。
IBM蓝色基因/P排在第二位,功耗效率为376 Mflops/瓦。

曙光5000A不带水冷时:328 MFlops/瓦
         带水冷时: 230 Mflops/瓦
虽然采用AMD芯片,功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>

<P>&nbsp;</P>


(6.合.彩)♀足球♀篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台
呵呵还没升二级士官啊
原帖由 hahahawk 于 2008-6-24 16:36 发表
呵呵还没升二级士官啊


看到过发帖才两个就升到士官的
]]
走鹃用的是Intel?:D
在IBM眼里,INTEL和AMD的CPU都是小孩过家家的东西。但这俩个小孩好像过的越来越不错。
原帖由 supmart 于 2008-6-24 21:41 发表
在IBM眼里,INTEL和AMD的CPU都是小孩过家家的东西。但这俩个小孩好像过的越来越不错。

IBM是真正堪称怪兽级的企业。
原帖由 qiyuchen 于 2008-6-24 20:49 发表
走鹃用的是Intel?:D

恩,偶搞错了
主要是cell
MS楼主都算错鸟
和第二名比就可以了,走那个路线更好些
估计11月的榜单5000a进不了前10的,肯定一大堆用cell的机器会爬上来的
CELL这个东西优势在什么地方?
原帖由 cookship 于 2008-6-25 18:28 发表
CELL这个东西优势在什么地方?


好像就是intel准备在以后要推出的多核处理器的样子,一个ppC的核心加一大堆特化的其他核心。
原帖由 cookship 于 2008-6-25 18:28 发表
CELL这个东西优势在什么地方?


随口说说,可能有错误,见谅啊。:D
具体的东西请看看关于CELL体系架构的书籍。

它是一个有序执行的处理器,由一个简化的POWERPC核心(PPE)和8个SPE组成(SPE是协处理器,它不像传统的通用处理器,部分功能被简化了,并且没有缓存,SPE只能协助PPE计算),从某种意义上来说它有点像INTEL和AMD将要推出的GPCPU。

不知道“走鹃”的CELL里集成的是什么内存控制器啊,DDR还是XDR?
这样看不太准确,PPE是一个扩展了功能的PPC64(扩展了Vector/SIMD)指令集。SPE也绝对不是“协处理器”的概念,他更像是一个经过强化了运算功能的特殊处理器(看作DSP也未尝不可),这个处理器有自己的存储(LS:256K),还有一个DMA控制器(MFC)。你说SPE没有Cache亦可,因为它自己只能存取LS,如果要访问其他存储空间需要动用DMA方式。

这种结构的好处是避免了如何解决处理器访问内存的瓶颈问题,这是让现有的多核处理器大为头痛的问题,或者说,它回避了这个问题,解决问题的方式就是,干脆限制SPE访问内存,让软件设计者显式的利用256K的LS,对于很多任务,比如编码/解码,加密/解密等任务来说,256K足以放下执行程序和内存缓冲了,DMA用于取任务,放结果。

对于很多科学计算而言,256K似乎也够了,如果你需要的空间大于265K,就需要采用和主存之间来回交换的技术。在这方面IBM提供了很多工具来帮助开发人员。


原帖由 始于绝望的希望 于 2008-6-25 20:34 发表


随口说说,可能有错误,见谅啊。:D
具体的东西请看看关于CELL体系架构的书籍。

它是一个有序执行的处理器,由一个简化的POWERPC核心(PPE)和8个SPE组成(SPE是协处理器,它不像传统的通用处理器,部分功能 ...
CELL 集成的内存控制器是XDR
RoadRunner的结构是非常有趣的,他的基本组成单元叫做“三刀片”(Triblade),说是三刀片,其实有四块板,两块Cell板,一块Opteron板,各有两个处理器。还有一个通讯板,对外连接Infiniband,内部通过PCIe总线连接。

采用这么奇怪的结构,可能主要的运算能力还是来自于Cell,而Opteron担负的是协调和控制的任务。

然后按照 TriBlade -> BladeCenter -> Rack -> Connected Unit -> Cluster 这样的分级形式连接起来的。
面对市场化IBM就是个渣

IBM的服务器市场萎缩的已经很厉害了,如果不是大型机上的软件移植成本的原因,IBM在大型机上早倒了

IBM早在很久前就是依靠服务在赚钱而不是依靠硬件技术在赚钱了
原帖由 暗夜流星 于 2008-6-25 23:34 发表
RoadRunner的结构是非常有趣的,他的基本组成单元叫做“三刀片”(Triblade),说是三刀片,其实有四块板,两块Cell板,一块Opteron板,各有两个处理器。还有一个通讯板,对外连接Infiniband,内部通过PCIe总线连接。 ...

我估计RoadRunner不太可能像BlueGene那样撑好几年,最多两年肯定就要把宝座让出,Nehalem携QuickPath来袭,IBM可能会迁移平台。
]]
我个人觉得CELL的结构还是有生命力,因为多核访问内存的确是很难搞的问题,现在撑那么两三个,三四个,甚至五六个都还凑合,再多就会出问题。
IBM是大机的祖宗,如果能做多核同时访问内存,性能还有保证,他们不会不做的,他们又不傻。

原帖由 dark_knight 于 2008-6-26 00:11 发表

我估计RoadRunner不太可能像BlueGene那样撑好几年,最多两年肯定就要把宝座让出,Nehalem携QuickPath来袭,IBM可能会迁移平台。
IBM的服务器还是很有市场的,口碑很好。在中国的银行体系的影响根深蒂固。
这个板子看起来很怪,原来是加上了Infiniband,那这个应该不是“走鹃”的板子,但是“走鹃”的板子是根据这个改的。



原帖由 dark_knight 于 2008-6-26 00:14 发表


IBM九核心Cell刀片服务器
原帖由 暗夜流星 于 2008-6-26 00:58 发表
这个板子看起来很怪,原来是加上了Infiniband,那这个应该不是“走鹃”的板子,但是“走鹃”的板子是根据这个改的。






万变不离其宗,QuickPath在两块CPU之间也将建立高速连接,差别在于Intel计划给南桥也安装多口的QuickPath
另外,CPU是通过北桥经PCIe来访问InfiniBand上的主存的,而Intel直接把DDR3内存控制器集成到CPU内,不再通过北桥。但是Cell有XDR,Intel对XDR则不感兴趣。
其实HyperTransport也好QuickPath也好,无非是NUMA体系的一种微型化么。现在的趋势是,原来NUMA里面的SMP结构被微缩到了一个芯片里面,而SMP节点之间的高速互联就被弄成了HT之类的东西。
看看这个“巴塞罗那”的DIE,多核之间通过CrossBar的方式来连接共享的L3,活生生一个SMP的翻版。
原帖由 暗夜流星 于 2008-6-26 14:11 发表
其实HyperTransport也好QuickPath也好,无非是NUMA体系的一种微型化么。现在的趋势是,原来NUMA里面的SMP结构被微缩到了一个芯片里面,而SMP节点之间的高速互联就被弄成了HT之类的东西。
看看这个“巴塞罗那”的DIE ...

片上SMP,接下来我倒是挺感兴趣“逆超线程”技术
cell访问内存的速度还行,嗯。


原帖由 暗夜流星 于 2008-6-25 22:48 发表
这样看不太准确,PPE是一个扩展了功能的PPC64(扩展了Vector/SIMD)指令集。SPE也绝对不是“协处理器”的概念,他更像是一个经过强化了运算功能的特殊处理器(看作DSP也未尝不可),这个处理器有自己的存储(LS:256K ...
SPE是全功能的CPU, 它可以运行PPE支持的所有指令, 它和PPE只有执行效率的不同, 分支很少的暴力运算代码SPE可以和PPE获得相同的速度, 而其他情况则可能比PPE慢非常多.

在最理想情况下, SPE和PPE的性能与同频的P4相当, 但是CELL有9个PPE和SPE, 而且频率比P4还高, 所以理想情况下CELL的性能就能达到P4的10倍左右而功耗比P4还低(想想PS3的散热条件)

CELL是相当特殊的结构, 但是由于SPE支持所有的PPC指令(虽然有时很慢), 所以软件移植到CELL上还是非常容易, 优化的事情可以慢慢做.

我相当欣赏CELL的性能和功耗比例, CELL不适合网络服务和数据库应用, 但是在科学计算领域会是非常牛的一个方案
]]
你觉得CELL编程很容易么?

:D
原帖由 roadrunner 于 2008-6-26 16:04 发表
我相当欣赏CELL的性能和功耗比例, CELL不适合网络服务和数据库应用, 但是在科学计算领域会是非常牛的一个方案..
其实对于电信应用,CELL也大有市场,编程也不是什么问题。一个CPU带一堆DSP是颇为常用的方案,比如信道编码,回波抵消等等。对于这些应用来说,CELL就是从天上掉下来的馅饼。CPU内核之间的通信,无论如何也好过多处理器之间的通信。功耗和面积上的优势就更不用说了。

在电信系统中,PPC也是常用的处理器,关键就是相关的片子什么时候投入市场的问题。


原帖由 bessel 于 2008-6-26 18:59 发表
你觉得CELL编程很容易么?

:D
你觉得cell适合哪样的科学计算?

原帖由 暗夜流星 于 2008-6-26 20:29 发表
其实对于电信应用,CELL也大有市场,编程也不是什么问题。一个CPU带一堆DSP是颇为常用的方案,比如信道编码,回波抵消等等。对于这些应用来说,CELL就是从天上掉下来的馅饼。CPU内核之间的通信,无论如何也好过多处理 ...
没搞过,所以没什么概念。科学计算的类型其实也多种多样,就是不同的问题,针对不同的架构也可以有特殊的设计。
最好能拿几个例子来讨论。

原帖由 bessel 于 2008-6-26 21:08 发表
你觉得cell适合哪样的科学计算?

有一些研究机构或者大学会采用一些更廉价的方案来使用Cell,那就是用PS3组成集群,PS3的问题是内存太少,只有256M,当然如果是针对科学计算,可以对Linux进行大幅度的简化。所以应该也还够用。


原帖由 暗夜流星 于 2008-6-26 22:53 发表
有一些研究机构或者大学会采用一些更廉价的方案来使用Cell,那就是用PS3组成集群,PS3的问题是内存太少,只有256M,当然如果是针对科学计算,可以对Linux进行大幅度的简化。所以应该也还够用。

http://www.linuxs ...

04年的时候,弗吉尼亚州立综合技术大学的G5 System X目前在世界超级计算机500强的排行中居第七位。是由1100台2.3GHz的双处理器Xserve G5组成。弗大超级机在2003年的排名是第三,当时是由11100台2GHz的双处理器Power Mac G5组成。04年的时候,IBM的BlueGene/L beta-System创造了每秒70.72万亿次浮点运算的Linpack性能标准测试记录。排在其后面的是由SGI建造的哥伦比亚(Columbia)系统(每秒51.87万亿次浮点运算)和和由NEC建造的地球模拟器(Earth Simulator)超级计算机(每秒35.86万亿次浮点运算)。
原帖由 暗夜流星 于 2008-6-26 00:46 发表
IBM的服务器还是很有市场的,口碑很好。在中国的银行体系的影响根深蒂固。

岂止在中国,在大多数国家的政府、银行,IBM不说一统天下,至少在核心业务系统上还是占有半壁江山的。
]]
原帖由 bessel 于 2008-6-26 18:59 发表
你觉得CELL编程很容易么?

:D


如果只发挥CELL的30%性能就满意的话, CELL的编程是相当容易的!

即使只发挥30%的性能, CELL还是非常有性价比的体系, 虽然CELL的结构很特殊但是它是具备不作任何修改直接运行现有PPC代码的能力的, 在这个基础上还有非常巨大的优化潜力, 这对软件开发人员是非常有吸引力的.