曙光5000A和IBM走鹃的功耗效率比较

来源：百度文库编辑：超级军网时间：2024/04/29 06:07:51

“走鹃”排名榜首，达到488 Mflops/瓦。
IBM蓝色基因/P排在第二位，功耗效率为376 Mflops/瓦。

曙光5000A不带水冷时：328 MFlops/瓦
带水冷时： 230 Mflops/瓦
虽然采用AMD芯片，功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
 
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />

 

 

(6.合.彩)♀足球♀篮球...各类投注开户下注
 
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台
 “走鹃”排名榜首，达到488 Mflops/瓦。
IBM蓝色基因/P排在第二位，功耗效率为376 Mflops/瓦。

曙光5000A不带水冷时：328 MFlops/瓦
带水冷时： 230 Mflops/瓦
虽然采用AMD芯片，功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
 
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />

 

 

(6.合.彩)♀足球♀篮球...各类投注开户下注
 
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台

呵呵还没升二级士官啊

原帖由 hahahawk 于 2008-6-24 16:36 发表
呵呵还没升二级士官啊

看到过发帖才两个就升到士官的

]]

走鹃用的是Intel？:D

在IBM眼里，INTEL和AMD的CPU都是小孩过家家的东西。但这俩个小孩好像过的越来越不错。

原帖由 supmart 于 2008-6-24 21:41 发表
在IBM眼里，INTEL和AMD的CPU都是小孩过家家的东西。但这俩个小孩好像过的越来越不错。

IBM是真正堪称怪兽级的企业。

原帖由 qiyuchen 于 2008-6-24 20:49 发表
走鹃用的是Intel？:D

恩，偶搞错了
主要是cell

MS楼主都算错鸟

和第二名比就可以了，走那个路线更好些
估计11月的榜单5000a进不了前10的，肯定一大堆用cell的机器会爬上来的

CELL这个东西优势在什么地方？

原帖由 cookship 于 2008-6-25 18:28 发表
CELL这个东西优势在什么地方？

好像就是intel准备在以后要推出的多核处理器的样子，一个ppC的核心加一大堆特化的其他核心。

原帖由 cookship 于 2008-6-25 18:28 发表
CELL这个东西优势在什么地方？

随口说说，可能有错误，见谅啊。:D
具体的东西请看看关于CELL体系架构的书籍。

它是一个有序执行的处理器，由一个简化的POWERPC核心（PPE）和8个SPE组成（SPE是协处理器，它不像传统的通用处理器，部分功能被简化了，并且没有缓存，SPE只能协助PPE计算），从某种意义上来说它有点像INTEL和AMD将要推出的GPCPU。

不知道“走鹃”的CELL里集成的是什么内存控制器啊，DDR还是XDR？

这样看不太准确，PPE是一个扩展了功能的PPC64（扩展了Vector/SIMD）指令集。SPE也绝对不是“协处理器”的概念，他更像是一个经过强化了运算功能的特殊处理器（看作DSP也未尝不可），这个处理器有自己的存储（LS:256K），还有一个DMA控制器（MFC）。你说SPE没有Cache亦可，因为它自己只能存取LS，如果要访问其他存储空间需要动用DMA方式。

这种结构的好处是避免了如何解决处理器访问内存的瓶颈问题，这是让现有的多核处理器大为头痛的问题，或者说，它回避了这个问题，解决问题的方式就是，干脆限制SPE访问内存，让软件设计者显式的利用256K的LS，对于很多任务，比如编码/解码，加密/解密等任务来说，256K足以放下执行程序和内存缓冲了，DMA用于取任务，放结果。

对于很多科学计算而言，256K似乎也够了，如果你需要的空间大于265K，就需要采用和主存之间来回交换的技术。在这方面IBM提供了很多工具来帮助开发人员。

原帖由 始于绝望的希望 于 2008-6-25 20:34 发表

随口说说，可能有错误，见谅啊。:D
具体的东西请看看关于CELL体系架构的书籍。

它是一个有序执行的处理器，由一个简化的POWERPC核心（PPE）和8个SPE组成（SPE是协处理器，它不像传统的通用处理器，部分功能 ...

CELL 集成的内存控制器是XDR

RoadRunner的结构是非常有趣的，他的基本组成单元叫做“三刀片”（Triblade），说是三刀片，其实有四块板，两块Cell板，一块Opteron板，各有两个处理器。还有一个通讯板，对外连接Infiniband，内部通过PCIe总线连接。

采用这么奇怪的结构，可能主要的运算能力还是来自于Cell，而Opteron担负的是协调和控制的任务。

然后按照 TriBlade -> BladeCenter -> Rack -> Connected Unit -> Cluster 这样的分级形式连接起来的。

面对市场化IBM就是个渣

IBM的服务器市场萎缩的已经很厉害了，如果不是大型机上的软件移植成本的原因，IBM在大型机上早倒了

IBM早在很久前就是依靠服务在赚钱而不是依靠硬件技术在赚钱了

原帖由 暗夜流星 于 2008-6-25 23:34 发表
RoadRunner的结构是非常有趣的，他的基本组成单元叫做“三刀片”（Triblade），说是三刀片，其实有四块板，两块Cell板，一块Opteron板，各有两个处理器。还有一个通讯板，对外连接Infiniband，内部通过PCIe总线连接。 ...

我估计RoadRunner不太可能像BlueGene那样撑好几年，最多两年肯定就要把宝座让出，Nehalem携QuickPath来袭，IBM可能会迁移平台。

]]

我个人觉得CELL的结构还是有生命力，因为多核访问内存的确是很难搞的问题，现在撑那么两三个，三四个，甚至五六个都还凑合，再多就会出问题。
IBM是大机的祖宗，如果能做多核同时访问内存，性能还有保证，他们不会不做的，他们又不傻。

原帖由 dark_knight 于 2008-6-26 00:11 发表

我估计RoadRunner不太可能像BlueGene那样撑好几年，最多两年肯定就要把宝座让出，Nehalem携QuickPath来袭，IBM可能会迁移平台。

IBM的服务器还是很有市场的，口碑很好。在中国的银行体系的影响根深蒂固。

这个板子看起来很怪，原来是加上了Infiniband，那这个应该不是“走鹃”的板子，但是“走鹃”的板子是根据这个改的。

原帖由 dark_knight 于 2008-6-26 00:14 发表

IBM九核心Cell刀片服务器

原帖由 暗夜流星 于 2008-6-26 00:58 发表
这个板子看起来很怪，原来是加上了Infiniband，那这个应该不是“走鹃”的板子，但是“走鹃”的板子是根据这个改的。

万变不离其宗，QuickPath在两块CPU之间也将建立高速连接，差别在于Intel计划给南桥也安装多口的QuickPath

另外，CPU是通过北桥经PCIe来访问InfiniBand上的主存的，而Intel直接把DDR3内存控制器集成到CPU内，不再通过北桥。但是Cell有XDR，Intel对XDR则不感兴趣。

其实HyperTransport也好QuickPath也好，无非是NUMA体系的一种微型化么。现在的趋势是，原来NUMA里面的SMP结构被微缩到了一个芯片里面，而SMP节点之间的高速互联就被弄成了HT之类的东西。
看看这个“巴塞罗那”的DIE，多核之间通过CrossBar的方式来连接共享的L3，活生生一个SMP的翻版。

原帖由 暗夜流星 于 2008-6-26 14:11 发表
其实HyperTransport也好QuickPath也好，无非是NUMA体系的一种微型化么。现在的趋势是，原来NUMA里面的SMP结构被微缩到了一个芯片里面，而SMP节点之间的高速互联就被弄成了HT之类的东西。
看看这个“巴塞罗那”的DIE ...

片上SMP，接下来我倒是挺感兴趣“逆超线程”技术

cell访问内存的速度还行，嗯。

原帖由 暗夜流星 于 2008-6-25 22:48 发表
这样看不太准确，PPE是一个扩展了功能的PPC64（扩展了Vector/SIMD）指令集。SPE也绝对不是“协处理器”的概念，他更像是一个经过强化了运算功能的特殊处理器（看作DSP也未尝不可），这个处理器有自己的存储（LS:256K ...

SPE是全功能的CPU, 它可以运行PPE支持的所有指令, 它和PPE只有执行效率的不同, 分支很少的暴力运算代码SPE可以和PPE获得相同的速度, 而其他情况则可能比PPE慢非常多.

在最理想情况下, SPE和PPE的性能与同频的P4相当, 但是CELL有9个PPE和SPE, 而且频率比P4还高, 所以理想情况下CELL的性能就能达到P4的10倍左右而功耗比P4还低(想想PS3的散热条件)

CELL是相当特殊的结构, 但是由于SPE支持所有的PPC指令(虽然有时很慢), 所以软件移植到CELL上还是非常容易, 优化的事情可以慢慢做.

我相当欣赏CELL的性能和功耗比例, CELL不适合网络服务和数据库应用, 但是在科学计算领域会是非常牛的一个方案

]]

你觉得CELL编程很容易么？

:D

原帖由 roadrunner 于 2008-6-26 16:04 发表
我相当欣赏CELL的性能和功耗比例, CELL不适合网络服务和数据库应用, 但是在科学计算领域会是非常牛的一个方案..

其实对于电信应用，CELL也大有市场，编程也不是什么问题。一个CPU带一堆DSP是颇为常用的方案，比如信道编码，回波抵消等等。对于这些应用来说，CELL就是从天上掉下来的馅饼。CPU内核之间的通信，无论如何也好过多处理器之间的通信。功耗和面积上的优势就更不用说了。

在电信系统中，PPC也是常用的处理器，关键就是相关的片子什么时候投入市场的问题。

原帖由 bessel 于 2008-6-26 18:59 发表
你觉得CELL编程很容易么？

:D

你觉得cell适合哪样的科学计算？

原帖由 暗夜流星 于 2008-6-26 20:29 发表
其实对于电信应用，CELL也大有市场，编程也不是什么问题。一个CPU带一堆DSP是颇为常用的方案，比如信道编码，回波抵消等等。对于这些应用来说，CELL就是从天上掉下来的馅饼。CPU内核之间的通信，无论如何也好过多处理 ...

没搞过，所以没什么概念。科学计算的类型其实也多种多样，就是不同的问题，针对不同的架构也可以有特殊的设计。
最好能拿几个例子来讨论。

原帖由 bessel 于 2008-6-26 21:08 发表
你觉得cell适合哪样的科学计算？

有一些研究机构或者大学会采用一些更廉价的方案来使用Cell，那就是用PS3组成集群，PS3的问题是内存太少，只有256M，当然如果是针对科学计算，可以对Linux进行大幅度的简化。所以应该也还够用。

原帖由 暗夜流星 于 2008-6-26 22:53 发表
有一些研究机构或者大学会采用一些更廉价的方案来使用Cell，那就是用PS3组成集群，PS3的问题是内存太少，只有256M，当然如果是针对科学计算，可以对Linux进行大幅度的简化。所以应该也还够用。

http://www.linuxs ...

04年的时候，弗吉尼亚州立综合技术大学的G5 System X目前在世界超级计算机500强的排行中居第七位。是由1100台2.3GHz的双处理器Xserve G5组成。弗大超级机在2003年的排名是第三，当时是由11100台2GHz的双处理器Power Mac G5组成。04年的时候，IBM的BlueGene/L beta-System创造了每秒70.72万亿次浮点运算的Linpack性能标准测试记录。排在其后面的是由SGI建造的哥伦比亚（Columbia）系统（每秒51.87万亿次浮点运算）和和由NEC建造的地球模拟器（Earth Simulator）超级计算机（每秒35.86万亿次浮点运算）。

原帖由 暗夜流星 于 2008-6-26 00:46 发表
IBM的服务器还是很有市场的，口碑很好。在中国的银行体系的影响根深蒂固。

岂止在中国，在大多数国家的政府、银行，IBM不说一统天下，至少在核心业务系统上还是占有半壁江山的。

]]

原帖由 bessel 于 2008-6-26 18:59 发表
你觉得CELL编程很容易么？

:D

如果只发挥CELL的30%性能就满意的话, CELL的编程是相当容易的!

即使只发挥30%的性能, CELL还是非常有性价比的体系, 虽然CELL的结构很特殊但是它是具备不作任何修改直接运行现有PPC代码的能力的, 在这个基础上还有非常巨大的优化潜力, 这对软件开发人员是非常有吸引力的.

曙光5000A和IBM走鹃的功耗效率比较不要拿stovl飞机的起降效率和普通飞机比较低改造度、高运作效率的001A甲板布局（384楼增加美式和 ... 搅屎棍的效率和局限战争还有一个比较：资源分配和效率 054A与23型和不惧级的比较空版有贴A-10和su-25比较,那么a-10的炮和su-25的比较呢 ... 惊魂百万亿次：曙光5000A冲击Top500纪实看看曙光5000A长啥样，哈哈 [图片更新] 曙光5000A实际上为别人做了嫁衣。。。 [图] 关于弹和滑的效率民主真的和效率矛盾么？