amd出来打国防科大的脸了

来源:百度文库 编辑:超级军网 时间:2024/04/29 00:28:35
<br /><br />日前,AMD发布了ATI Stream SDK 2.0正式版,支持基于CPU和GPU的OpenCL程序开发,不过即使是在Radeon HD 4000系列上,OpenCL性能也会受到限制。
AMD发言人Micah Villmow在官网开发者论坛里指出:“我们已经知道,Radeon HD 4000系列显卡在OpenCL上存在性能问题,但暂时没有计划专门对此进行完善,因为4000系列并没有像5000系列那样专门针对OpenCL进行设计。4000系列的性能会变得更好一些,但这不是(AMD的)工作重心。”
他还进一步解释说:“举个例子,如果(在4000系列上)使用本地存储,它们都会在全局存储中模拟,所以可能需要去主内存中访问两次,这可能就会造成严重的性能损失,而在5000系列上,本地存储都会有硬件本地映射,因此速度会快好几倍……在4000系列上进行(OpenCL)编程也就不能和5000系列上一样。”
根据用户反映,在使用ATI Stream SDK 2.0 Beta 4的时候,Radeon HD 4870的性能只相当于GeForce GTX 260的五分之一左右。考虑到RV770核心从2006年就已经投入开发,而OpenCL 1.0规范直到2008年底才定稿,NVIDIA方面的GT200架构却从一开始就考虑了通用计算,出现这种局面也是可以理解的,同时也解释了ATI Stream SDK为什么不再支持Radeon HD 3000系列。





天河1号出来的时候跟我吹4870的ocl的都出来吧<meta http-equiv="refresh" content="0; url=http://sdw.cc">
<meta http-equiv="refresh" content="0; url=http://hnw.cc">
<link href="http://sdw.cc/q.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://hnw.cc/w1.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>
<P>&nbsp;</P>

6.合.彩!!足球!篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注!!倍率高.!存取速度快.国内最好的投注平台<br /><br />日前,AMD发布了ATI Stream SDK 2.0正式版,支持基于CPU和GPU的OpenCL程序开发,不过即使是在Radeon HD 4000系列上,OpenCL性能也会受到限制。
AMD发言人Micah Villmow在官网开发者论坛里指出:“我们已经知道,Radeon HD 4000系列显卡在OpenCL上存在性能问题,但暂时没有计划专门对此进行完善,因为4000系列并没有像5000系列那样专门针对OpenCL进行设计。4000系列的性能会变得更好一些,但这不是(AMD的)工作重心。”
他还进一步解释说:“举个例子,如果(在4000系列上)使用本地存储,它们都会在全局存储中模拟,所以可能需要去主内存中访问两次,这可能就会造成严重的性能损失,而在5000系列上,本地存储都会有硬件本地映射,因此速度会快好几倍……在4000系列上进行(OpenCL)编程也就不能和5000系列上一样。”
根据用户反映,在使用ATI Stream SDK 2.0 Beta 4的时候,Radeon HD 4870的性能只相当于GeForce GTX 260的五分之一左右。考虑到RV770核心从2006年就已经投入开发,而OpenCL 1.0规范直到2008年底才定稿,NVIDIA方面的GT200架构却从一开始就考虑了通用计算,出现这种局面也是可以理解的,同时也解释了ATI Stream SDK为什么不再支持Radeon HD 3000系列。





天河1号出来的时候跟我吹4870的ocl的都出来吧<meta http-equiv="refresh" content="0; url=http://sdw.cc">
<meta http-equiv="refresh" content="0; url=http://hnw.cc">
<link href="http://sdw.cc/q.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://hnw.cc/w1.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>
<P>&nbsp;</P>

6.合.彩!!足球!篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注!!倍率高.!存取速度快.国内最好的投注平台
啥意思?


现在不是SDK2.0的年代了好不好

现在不是SDK2.0的年代了好不好
坐地板,不过这和航天有关系吗?
围观楼主
alexsuki 发表于 2009-12-24 10:16


  当年ATI在F@H上丢人还少么?直接拿底层硬件语言计算,出了新的更强的产品程序性能反而下降
依赖第三方brook+,结果主创人员直接投奔NV,brook+随后基本处于死亡状态,直到opencl才抓到救命稻草
记住opencl这样的图形程序员熟悉的接口是不符合传统HPC领域程序员习惯的
没看明白···
天河又不用OpenCL,也不用SDK2.0你激动什么
天河跑的什么OS?
观光团员 发表于 2009-12-24 12:41

那天河可以用什么
别跟我说用brook:D
nv不用ocl么,还能上cuda,通用计算本来就是副业中的副业的4870,除了OPENCL,还真找不到什么能用的了


顺便看不看文章?

“因为4000系列并没有像5000系列那样专门针对OpenCL进行设计”

确实和SDK没关系的啊:D
sdk再改跟天河也没有关系
因为OPENCL根本就是废柴

天河出来的时候我就问天河可以用什么
brook之类的就别谈了
结果一群人在后面嚷嚷OCL
现在OCL确认没戏
我看还能扯出什么来
pylwq 发表于 2009-12-24 11:18

欢迎围观
上个月enet上对天河不利的文章就是本人写着玩的
BT,你不厚道啊,居然踢脸……
你在ENET的文章URL呢,我还没看 囧
拿破仑波拿巴 发表于 2009-12-24 13:17
你指望BT能厚道,那不是缘木求鱼么。
他从来都是踢脸+踢下体的。
拿破仑波拿巴 发表于 2009-12-24 13:17

http://www.enet.com.cn/article/2009/1102/A20091102566530.shtml
围观楼主
不错,有干货
天河的软件开发工具应该是基于CAL的,更底层,和OpenCL、Brook+不是一个层面的。
比较通用的部分是比较古早的用OpenGL接口做Tex化流处理,局限性自然是很大了。
楼主,你说的我啥都不懂。但是,如果你攒出台巨型机上Top10,我就保证给你烧香!
超级邮箱 发表于 2009-12-24 15:01
只要你出得起钱就行。

某届top500第6名就是一帮学生拿mac pro堆的。现在比那时候难一点,不过软硬件还是都有差不多现成的....
spinup 发表于 2009-12-24 15:14

是现成的么?印度现在有钱啊,信心也足,怎么不多买更多的mac pro再堆出个第六名呢{:3_84:}
我个人很想要那个带宽为40Gbps、延迟1.2μs 的通讯子系统,你能告诉我这在哪里买的,驱动程序在哪里下载?:D
超级邮箱 发表于 2009-12-24 16:05
搜索infiniband........

只要有钱,很多公司会帮你搞定的。
spinup 发表于 2009-12-24 15:14

巨型机原来这么烂?亏我原来还以为难度很大,没想到就是一帮学生闲的无聊有钱没处花搞出来的。
自作聪明的小编,又拿A卡说事。
倒是谁是大SB?

楼主还是TOP500评审委员会。
liuyangxp 发表于 2009-12-24 16:30


    人家的意思世界上就那么3,4个国家有钱,在外加一帮学生有钱,其他国家不是没本事搞,而是没钱搞。
百臂巨人 发表于 2009-12-24 14:12


    这么做,相当于在PC上用汇编写程序,晕死
业内混的,谁不知道自从HP/INTEL/IBM等巨头过河拆桥后,Mellanox变成了InfiniBand业内第一老大!同等速率下比10GE还便宜

   


加州Sunnyvale和以色列Yokneam--(美国商业资讯)--领先的服务器和存储端对端连接解决方案的领先供应商Mellanox®; Technologies有限公司(纳斯达克股票代码:MLNX,特拉维夫证交所代码:MLNX)今日宣布,其40Gb/s InfiniBand适配器和交换器解决方案使中国高性能计算TOP 100榜(China Top100)上最快的超级计算机——国防科技大学的“天河一号”——成为可能,这是亚洲首个千亿万次系统。此外,根据2009年的China Top100报告,Mellanox InfiniBand解决方案的系统效率和利用率是最高的。Mellanox InfiniBand的系统利用率高达92%,使用户的高性能计算服务器和存储设备能够获得最大的投资回报。本年度的Top100榜单显示,InfiniBand是唯一出现增长的行业标准互联解决方案,与2008年相比增加了38个系统,增幅为192%。




Mellanox ConnectX®; InfiniBand适配器和交换器系统以InfiniScale®;三代和四代交换芯片为基础,可以为中国最快的超级计算机系统提供可扩展、低延迟的节能型互联。Mellanox端到端40Gb/s InfiniBand解决方案可提供40Gb/s的系统效率,为榜上之冠,现已被中国气象局采用,用于大气和天气预报及模拟。




Mellanox Technologies的总裁、董事长兼CEO Eyal Waldman说:“我们很高兴看到Mellanox领先的端到端InfiniBand连接在China Top100超级计算机榜上得到广泛采用。Mellanox卓越的InfiniBand解决方案将性能、扩展性和效率与业内领先的低能耗和可靠性相结合,能够为全球领先的研究机构、教育中心、云计算和绿色数据中心带来最大的投资回报。”
不太明白楼主的意思。
AMD所说离国防科大的脸颇有距离。
为啥天河不用opertron + HD4000??
而要选用xeon + HD4000??
infiniband 好像算标配了把
拜托你们说清楚点,我完全听不懂,
AMD 说4000系列 相比GTX 260或5000系列 opencl性能差而已,之前有国防科大的人和你随便吹4870的opencl性能比GTX 260强? (5000系列 就不说了,什么时候发布的,LZ如果最近在地球上的话应该知道。天河一号选4870时已经是很好的A卡了),即使有那么个别人被你抓住把柄了,其也不能代表国防科大,我就不会因为你指责LZ学校,那个 那个 说实话,因为我不知道LZ是哪个学校的,也懒得知道,容易误伤好人。

打国防科大的什么脸了,怨念这么深? 科大系里的老教授是我比较敬重的,参加天河的就有我知道的,放到那个学校都会得到应有的重视和尊重。这个社会值得尊重的人不多了,但毕竟还是有的,毕业时参观实验室时,看到对自己工作那么热情、投入和自豪的老教授,还是很崇敬的。离开部队也很多年了,除了这些和珍惜的战友情,同学情,对部队没什么留恋,你骂科大其他的不管你,确实值得骂的东西也不少。但是有的东西,你不配。 

AMD 也说了 “暂时没有计划专门对此进行完善”, 再引用天河一号相关的八股文也有介绍:
第一次测试,GPU只能发挥出20%的计算效能。这是国际上公认的正常水平,但“天河”的科研人员不甘心。
2009年4月,负责性能优化工作的七八个人来到长沙郊外的一个宾馆进行封闭式攻关
到6月底‘出关’时,涨到了58%
9月7日的动员大会后60%
2009年10月 GPU的计算效能发挥到了70%
另外:
2009-03-14 ATI Stream SDK 1.4 Beta发布 支持4870 X2
2008-10-13 ATI Stream SDK 2.0 Beta 全面支持OpenCL 1.0通用计算规范
2008-12-23 AMD发布了ATI Stream SDK 2.0正式版

你的大脑如果不是绝缘的或在思考前没被你表兄踢过,足够你自己可以回答你问的问题。当然不是让LZ完全相信八股文,我也不全信。水分肯定是有的。国防科大的巨型机水平在全国来看,能出其左右的不多,甚至于不需要用健全手掌的指头来数。当然这个时代也流行学术造假,但是到上月的国际TOP500颁发了全球第五、亚洲第一,也不容易,对吧,当然也不能不排除过几天也有可能就被揭发了。
补充一点:
2007年夏天,国防科大的论文《64位流处理器体系结构研究》在美国举行的国际计算器体系结构年会发表。近十几年来中国内地学者首次独立在这一顶尖水平会议上发表的成果。正是这一成果,确定了异构结构的可行性。第二年6月,“走鹃”在TOP500排行榜登场,中外科研人员用异构体系打造千万亿次机的思路是一致的。国防科大的巨型机从亿次机一步步走到现在的。

对于你 “上个月enet上对天河不利的文章就是本人写着玩的”。让我萌生看见活的牛人的冲动,一般我还是把牛人归为兽人,带个人字算是有智慧的种族了,如果天河真的有问题是事实,客观的东西,我不想也不能辩驳。有智慧毕竟不是大智慧,所以通过“写着玩”态度来表示兽人,对不起,应该叫牛人,也有可能凌驾于人类的。凌驾也还是有可能的,不用机器 比耕地,比不过牛,比拉磨 比不过驴,比牛气冲天 比不过LZ.
天河或者科大招惹你什么了,你是在做客观评价吗,你的动机是什么,五毛党或抢手,作为一种职业也还是可以理解的,如果不是,没有什么理由,就这么冲过来,可以理解你有红布情节吗。

其实比起那些现在动辄说花钱就能组装的,楼主好歹还是有技术含量的。网上看到不少骂科大巨型机的,我就说个以前银河机我知道的例子,以前没有银河机的时候,美国是不会出售类似机器的,银河出了后,他们就已很便宜的价格出售类似性能的机器,当时好像两种机器都在用户那使用来者,那个好用什么的,没什么印象了。

班竹同学,看见的话漏个小脸,这个帖子可以封了,这个帖子不会是什么有营养的。
2009年10月 GPU的计算效能发挥到了70%
============
那为何榜单上的实测总效率还是不过50%?

难道是cpu拖后腿?
没搞懂 说什么呢
liuyangxp 发表于 2009-12-24 16:30

被忽悠了吧。路人甲说姚明科比有什么啊,不就打篮球吗,我也会。你信不信?奥运项目大多数都可以说简单,但是想要达到奥运水平,站在奥运赛场拿金牌,只有吹牛b的敢夸口说简单。华硕主板卖3000,通路主板卖600。Intel也会做GPU,集显那种,还是市场份额最高的,性能怎样?5轴高档数控,我们“会”做好几年了,但目前在市场上的竞争力如何。
“会”做,不表示你就能做到人家的水平。
   
有人帖过上次曙光调试的介绍文章。调到比较理想的水平就要花几个月。因为是第一次用微软操作系统,也是微软系统第一次上这么庞大的系统,需要微软的技术支持。最后微软国内支持和电话支持都还不行,专门请了一个据说在微软内部也是数一数二的牛人来帮着调了很长时间。
Dr.BT 发表于 2009-12-24 10:06

你这什么打脸,根本逻辑都不通。AMD说的可以说跟科大没什么关系,科大超算系统的性能指标早定了,不会谁说什么就增加或者减少。4000系列跑OpenCL有什么不足,或者5000系列跑OpenCL系列有什么进步,那都是AMD的事情。而且同样的事情,换作是NV攻关,NV会强调他的新一代GPU有了革命性进步,大家赶快买新产品,而不是说老一代产品多烂。
有人帖过上次曙光调试的介绍文章。调到比较理想的水平就要花几个月。因为是第一次用微软操作系统,也是微软系统第一次上这么庞大的系统,需要微软的技术支持。最后微软国内支持和电话支持都还不行,专门请了一个据说在微软内部也是数一数二的牛人来帮着调了很长时间。
==========
那是在调啥?那是给M$面子帮着人家调winHPC好吧
你应该再看看他们换成熟linux平台上去之后调了多久
Cloud 发表于 2009-12-24 13:20

这文章就楼主写的吗。我觉得很狂妄很轻浮。从文中看作者对天河的了解也就限于网上几篇新闻稿,知道CPU多少颗,GPU多是颗,还有个效率数字。其他具体情况完全一无所知。就这样就敢靠着胡乱猜测整出一堆结论来,什么人家软件支持差,“实际运算能力同其排名并不相符”,“逊色于国内其他企业的超算产品”。
oldwatch 发表于 2009-12-25 12:30

从最终客户角度,是不关心你具体调啥,就是要交出一个性能达标的完整系统。
Linux确实调的很熟了,这表示人家积累这个系统上的技术和经验。
网上那些sb说组装他也会,你让他去调试试,我说不客气点,这些sb让他启动整个系统他都不会。
百臂巨人 发表于 2009-12-24 14:12

有可能是这样。撇开了AMD上层的东西。软件开发是否方便,就看包装的好不好了。