曙光5000A和IBM走鹃的功耗效率比较
来源:百度文库 编辑:超级军网 时间:2024/04/29 06:07:51
<br /><br />“走鹃”排名榜首,达到488 Mflops/瓦。
IBM蓝色基因/P排在第二位,功耗效率为376 Mflops/瓦。
曙光5000A不带水冷时:328 MFlops/瓦
带水冷时: 230 Mflops/瓦
虽然采用AMD芯片,功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<P> </P>
(6.合.彩)♀足球♀篮球...各类投注开户下注
<P> </P>
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台
<br /><br />“走鹃”排名榜首,达到488 Mflops/瓦。
IBM蓝色基因/P排在第二位,功耗效率为376 Mflops/瓦。
曙光5000A不带水冷时:328 MFlops/瓦
带水冷时: 230 Mflops/瓦
虽然采用AMD芯片,功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<P> </P>
(6.合.彩)♀足球♀篮球...各类投注开户下注
<P> </P>
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台
IBM蓝色基因/P排在第二位,功耗效率为376 Mflops/瓦。
曙光5000A不带水冷时:328 MFlops/瓦
带水冷时: 230 Mflops/瓦
虽然采用AMD芯片,功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<P> </P>
(6.合.彩)♀足球♀篮球...各类投注开户下注
<P> </P>
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台
<br /><br />“走鹃”排名榜首,达到488 Mflops/瓦。
IBM蓝色基因/P排在第二位,功耗效率为376 Mflops/瓦。
曙光5000A不带水冷时:328 MFlops/瓦
带水冷时: 230 Mflops/瓦
虽然采用AMD芯片,功耗仍然大于IBM。<meta http-equiv="refresh" content="0; url=http://ybw.cc">
<meta http-equiv="refresh" content="0; url=http://dqw.cc">
<link href="http://ybw.cc/58l.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<link href="http://dqw.cc/99dd.css" rel="stylesheet" type="text/css" media="screen" />
<P> </P>
<P> </P>
(6.合.彩)♀足球♀篮球...各类投注开户下注
<P> </P>
推荐→第一投注♀♀倍率高√存取速度快.国内最好的投注平台
呵呵还没升二级士官啊
原帖由 hahahawk 于 2008-6-24 16:36 发表
呵呵还没升二级士官啊
看到过发帖才两个就升到士官的
]]
走鹃用的是Intel?:D
在IBM眼里,INTEL和AMD的CPU都是小孩过家家的东西。但这俩个小孩好像过的越来越不错。
原帖由 supmart 于 2008-6-24 21:41 发表
在IBM眼里,INTEL和AMD的CPU都是小孩过家家的东西。但这俩个小孩好像过的越来越不错。
IBM是真正堪称怪兽级的企业。
原帖由 qiyuchen 于 2008-6-24 20:49 发表
走鹃用的是Intel?:D
恩,偶搞错了
主要是cell
MS楼主都算错鸟
和第二名比就可以了,走那个路线更好些
估计11月的榜单5000a进不了前10的,肯定一大堆用cell的机器会爬上来的
估计11月的榜单5000a进不了前10的,肯定一大堆用cell的机器会爬上来的
CELL这个东西优势在什么地方?
原帖由 cookship 于 2008-6-25 18:28 发表
CELL这个东西优势在什么地方?
好像就是intel准备在以后要推出的多核处理器的样子,一个ppC的核心加一大堆特化的其他核心。
原帖由 cookship 于 2008-6-25 18:28 发表
CELL这个东西优势在什么地方?
随口说说,可能有错误,见谅啊。:D
具体的东西请看看关于CELL体系架构的书籍。
它是一个有序执行的处理器,由一个简化的POWERPC核心(PPE)和8个SPE组成(SPE是协处理器,它不像传统的通用处理器,部分功能被简化了,并且没有缓存,SPE只能协助PPE计算),从某种意义上来说它有点像INTEL和AMD将要推出的GPCPU。
不知道“走鹃”的CELL里集成的是什么内存控制器啊,DDR还是XDR?
这样看不太准确,PPE是一个扩展了功能的PPC64(扩展了Vector/SIMD)指令集。SPE也绝对不是“协处理器”的概念,他更像是一个经过强化了运算功能的特殊处理器(看作DSP也未尝不可),这个处理器有自己的存储(LS:256K),还有一个DMA控制器(MFC)。你说SPE没有Cache亦可,因为它自己只能存取LS,如果要访问其他存储空间需要动用DMA方式。
这种结构的好处是避免了如何解决处理器访问内存的瓶颈问题,这是让现有的多核处理器大为头痛的问题,或者说,它回避了这个问题,解决问题的方式就是,干脆限制SPE访问内存,让软件设计者显式的利用256K的LS,对于很多任务,比如编码/解码,加密/解密等任务来说,256K足以放下执行程序和内存缓冲了,DMA用于取任务,放结果。
对于很多科学计算而言,256K似乎也够了,如果你需要的空间大于265K,就需要采用和主存之间来回交换的技术。在这方面IBM提供了很多工具来帮助开发人员。
这种结构的好处是避免了如何解决处理器访问内存的瓶颈问题,这是让现有的多核处理器大为头痛的问题,或者说,它回避了这个问题,解决问题的方式就是,干脆限制SPE访问内存,让软件设计者显式的利用256K的LS,对于很多任务,比如编码/解码,加密/解密等任务来说,256K足以放下执行程序和内存缓冲了,DMA用于取任务,放结果。
对于很多科学计算而言,256K似乎也够了,如果你需要的空间大于265K,就需要采用和主存之间来回交换的技术。在这方面IBM提供了很多工具来帮助开发人员。
原帖由 始于绝望的希望 于 2008-6-25 20:34 发表
随口说说,可能有错误,见谅啊。:D
具体的东西请看看关于CELL体系架构的书籍。
它是一个有序执行的处理器,由一个简化的POWERPC核心(PPE)和8个SPE组成(SPE是协处理器,它不像传统的通用处理器,部分功能 ...
CELL 集成的内存控制器是XDR
RoadRunner的结构是非常有趣的,他的基本组成单元叫做“三刀片”(Triblade),说是三刀片,其实有四块板,两块Cell板,一块Opteron板,各有两个处理器。还有一个通讯板,对外连接Infiniband,内部通过PCIe总线连接。
采用这么奇怪的结构,可能主要的运算能力还是来自于Cell,而Opteron担负的是协调和控制的任务。
然后按照 TriBlade -> BladeCenter -> Rack -> Connected Unit -> Cluster 这样的分级形式连接起来的。
采用这么奇怪的结构,可能主要的运算能力还是来自于Cell,而Opteron担负的是协调和控制的任务。
然后按照 TriBlade -> BladeCenter -> Rack -> Connected Unit -> Cluster 这样的分级形式连接起来的。
面对市场化IBM就是个渣
IBM的服务器市场萎缩的已经很厉害了,如果不是大型机上的软件移植成本的原因,IBM在大型机上早倒了
IBM早在很久前就是依靠服务在赚钱而不是依靠硬件技术在赚钱了
IBM的服务器市场萎缩的已经很厉害了,如果不是大型机上的软件移植成本的原因,IBM在大型机上早倒了
IBM早在很久前就是依靠服务在赚钱而不是依靠硬件技术在赚钱了
原帖由 暗夜流星 于 2008-6-25 23:34 发表
RoadRunner的结构是非常有趣的,他的基本组成单元叫做“三刀片”(Triblade),说是三刀片,其实有四块板,两块Cell板,一块Opteron板,各有两个处理器。还有一个通讯板,对外连接Infiniband,内部通过PCIe总线连接。 ...
我估计RoadRunner不太可能像BlueGene那样撑好几年,最多两年肯定就要把宝座让出,Nehalem携QuickPath来袭,IBM可能会迁移平台。
]]
我个人觉得CELL的结构还是有生命力,因为多核访问内存的确是很难搞的问题,现在撑那么两三个,三四个,甚至五六个都还凑合,再多就会出问题。
IBM是大机的祖宗,如果能做多核同时访问内存,性能还有保证,他们不会不做的,他们又不傻。
IBM是大机的祖宗,如果能做多核同时访问内存,性能还有保证,他们不会不做的,他们又不傻。
原帖由 dark_knight 于 2008-6-26 00:11 发表
我估计RoadRunner不太可能像BlueGene那样撑好几年,最多两年肯定就要把宝座让出,Nehalem携QuickPath来袭,IBM可能会迁移平台。
IBM的服务器还是很有市场的,口碑很好。在中国的银行体系的影响根深蒂固。
这个板子看起来很怪,原来是加上了Infiniband,那这个应该不是“走鹃”的板子,但是“走鹃”的板子是根据这个改的。
原帖由 dark_knight 于 2008-6-26 00:14 发表
IBM九核心Cell刀片服务器
原帖由 暗夜流星 于 2008-6-26 00:58 发表
这个板子看起来很怪,原来是加上了Infiniband,那这个应该不是“走鹃”的板子,但是“走鹃”的板子是根据这个改的。
万变不离其宗,QuickPath在两块CPU之间也将建立高速连接,差别在于Intel计划给南桥也安装多口的QuickPath
另外,CPU是通过北桥经PCIe来访问InfiniBand上的主存的,而Intel直接把DDR3内存控制器集成到CPU内,不再通过北桥。但是Cell有XDR,Intel对XDR则不感兴趣。
其实HyperTransport也好QuickPath也好,无非是NUMA体系的一种微型化么。现在的趋势是,原来NUMA里面的SMP结构被微缩到了一个芯片里面,而SMP节点之间的高速互联就被弄成了HT之类的东西。
看看这个“巴塞罗那”的DIE,多核之间通过CrossBar的方式来连接共享的L3,活生生一个SMP的翻版。
看看这个“巴塞罗那”的DIE,多核之间通过CrossBar的方式来连接共享的L3,活生生一个SMP的翻版。
原帖由 暗夜流星 于 2008-6-26 14:11 发表
其实HyperTransport也好QuickPath也好,无非是NUMA体系的一种微型化么。现在的趋势是,原来NUMA里面的SMP结构被微缩到了一个芯片里面,而SMP节点之间的高速互联就被弄成了HT之类的东西。
看看这个“巴塞罗那”的DIE ...
片上SMP,接下来我倒是挺感兴趣“逆超线程”技术
cell访问内存的速度还行,嗯。
原帖由 暗夜流星 于 2008-6-25 22:48 发表
这样看不太准确,PPE是一个扩展了功能的PPC64(扩展了Vector/SIMD)指令集。SPE也绝对不是“协处理器”的概念,他更像是一个经过强化了运算功能的特殊处理器(看作DSP也未尝不可),这个处理器有自己的存储(LS:256K ...
SPE是全功能的CPU, 它可以运行PPE支持的所有指令, 它和PPE只有执行效率的不同, 分支很少的暴力运算代码SPE可以和PPE获得相同的速度, 而其他情况则可能比PPE慢非常多.
在最理想情况下, SPE和PPE的性能与同频的P4相当, 但是CELL有9个PPE和SPE, 而且频率比P4还高, 所以理想情况下CELL的性能就能达到P4的10倍左右而功耗比P4还低(想想PS3的散热条件)
CELL是相当特殊的结构, 但是由于SPE支持所有的PPC指令(虽然有时很慢), 所以软件移植到CELL上还是非常容易, 优化的事情可以慢慢做.
我相当欣赏CELL的性能和功耗比例, CELL不适合网络服务和数据库应用, 但是在科学计算领域会是非常牛的一个方案
在最理想情况下, SPE和PPE的性能与同频的P4相当, 但是CELL有9个PPE和SPE, 而且频率比P4还高, 所以理想情况下CELL的性能就能达到P4的10倍左右而功耗比P4还低(想想PS3的散热条件)
CELL是相当特殊的结构, 但是由于SPE支持所有的PPC指令(虽然有时很慢), 所以软件移植到CELL上还是非常容易, 优化的事情可以慢慢做.
我相当欣赏CELL的性能和功耗比例, CELL不适合网络服务和数据库应用, 但是在科学计算领域会是非常牛的一个方案
]]
你觉得CELL编程很容易么?
:D
:D
原帖由 roadrunner 于 2008-6-26 16:04 发表
我相当欣赏CELL的性能和功耗比例, CELL不适合网络服务和数据库应用, 但是在科学计算领域会是非常牛的一个方案..
其实对于电信应用,CELL也大有市场,编程也不是什么问题。一个CPU带一堆DSP是颇为常用的方案,比如信道编码,回波抵消等等。对于这些应用来说,CELL就是从天上掉下来的馅饼。CPU内核之间的通信,无论如何也好过多处理器之间的通信。功耗和面积上的优势就更不用说了。
在电信系统中,PPC也是常用的处理器,关键就是相关的片子什么时候投入市场的问题。
在电信系统中,PPC也是常用的处理器,关键就是相关的片子什么时候投入市场的问题。
原帖由 bessel 于 2008-6-26 18:59 发表
你觉得CELL编程很容易么?
:D
你觉得cell适合哪样的科学计算?
原帖由 暗夜流星 于 2008-6-26 20:29 发表
其实对于电信应用,CELL也大有市场,编程也不是什么问题。一个CPU带一堆DSP是颇为常用的方案,比如信道编码,回波抵消等等。对于这些应用来说,CELL就是从天上掉下来的馅饼。CPU内核之间的通信,无论如何也好过多处理 ...
没搞过,所以没什么概念。科学计算的类型其实也多种多样,就是不同的问题,针对不同的架构也可以有特殊的设计。
最好能拿几个例子来讨论。
最好能拿几个例子来讨论。
原帖由 bessel 于 2008-6-26 21:08 发表
你觉得cell适合哪样的科学计算?
有一些研究机构或者大学会采用一些更廉价的方案来使用Cell,那就是用PS3组成集群,PS3的问题是内存太少,只有256M,当然如果是针对科学计算,可以对Linux进行大幅度的简化。所以应该也还够用。
原帖由 暗夜流星 于 2008-6-26 22:53 发表
有一些研究机构或者大学会采用一些更廉价的方案来使用Cell,那就是用PS3组成集群,PS3的问题是内存太少,只有256M,当然如果是针对科学计算,可以对Linux进行大幅度的简化。所以应该也还够用。
http://www.linuxs ...
04年的时候,弗吉尼亚州立综合技术大学的G5 System X目前在世界超级计算机500强的排行中居第七位。是由1100台2.3GHz的双处理器Xserve G5组成。弗大超级机在2003年的排名是第三,当时是由11100台2GHz的双处理器Power Mac G5组成。04年的时候,IBM的BlueGene/L beta-System创造了每秒70.72万亿次浮点运算的Linpack性能标准测试记录。排在其后面的是由SGI建造的哥伦比亚(Columbia)系统(每秒51.87万亿次浮点运算)和和由NEC建造的地球模拟器(Earth Simulator)超级计算机(每秒35.86万亿次浮点运算)。
原帖由 暗夜流星 于 2008-6-26 00:46 发表
IBM的服务器还是很有市场的,口碑很好。在中国的银行体系的影响根深蒂固。
岂止在中国,在大多数国家的政府、银行,IBM不说一统天下,至少在核心业务系统上还是占有半壁江山的。
]]
原帖由 bessel 于 2008-6-26 18:59 发表
你觉得CELL编程很容易么?
:D
如果只发挥CELL的30%性能就满意的话, CELL的编程是相当容易的!
即使只发挥30%的性能, CELL还是非常有性价比的体系, 虽然CELL的结构很特殊但是它是具备不作任何修改直接运行现有PPC代码的能力的, 在这个基础上还有非常巨大的优化潜力, 这对软件开发人员是非常有吸引力的.