俄罗斯团队用消费级GPU搭建计算平台 运算速度/性价比吊 ...

来源:百度文库 编辑:超级军网 时间:2024/05/04 05:01:25
2016-06-30 16:02:52 7767 次阅读 2 次推荐 稿源:cnBeta.COM

许多用户在选购消费级显卡的时候,主要考虑的是它的游戏性能。但是俄罗斯物理学家却借助消费级Nvidia GPU组建的计算机,竟然在15分钟内就完成了超级计算机上要耗时2-3天才能完成的运算。由于出色的多线程处理能力(同时间可执行更多的并发计算),GPU比CPU更受科学计算领域人士的喜爱。来自莫斯科国立大学的这支研究团队,就想到了如何利用这一点(许多方程需要彼此并发运行),测试消费级技术能否在很多情况下取代超级计算机。


科学家用消费级Nvidia GPU组建了可解决极复杂方程的‘家用计算机’,解题速度却吊打超级计算机。本例中,GPU被用来解决few-body散射方程,其用于描述多个量子微粒间的相互作用。


当涉及3个或更多体时,方程的计算就会变得极其困难,可以拓展出包含数万甚至数十万行列的表单数据。然而运行Nvidia软件和研究人员编写的定制程序,GPU的变现却远超预期。


领队Vladimir Kukulin表示:“我们达成了不曾梦想过的速度,在三秒钟的时间内,程序就在一台‘家用台式机’上执行了2.6亿次复杂的二重积分运算,超级计算机根本没法和它比”。


我的同事使用了德国波鸿大学一台最大的超级算计,其采用了著名的‘蓝色基因’架构,价格相当昂贵——然而他的团队用了2到3天的时间,我们只花了15分钟!!!


除了使用消费级技术,该团队还希望让那些曾经只有耗费大量超算时间才能完成的领域,变得更加可及。

换言之,世界上只有少数团体有足够的资源来执行的这些计算,阻碍了相关研究领域的整体进步——包括量子力学与核子物理。


该团队所使用的处理器,零售价在300到500美金之间。比之研究所中动辄数亿美元的超级计算机,它对钱包更加友好。

早在十几年前,GPU在科学计算上的能力就已经崭露头角,只是现在才开始被更多人正视它的价值。

[编译自:Gizmag , 来源:LMSU]
2016-06-30 16:02:52 7767 次阅读 2 次推荐 稿源:cnBeta.COM

许多用户在选购消费级显卡的时候,主要考虑的是它的游戏性能。但是俄罗斯物理学家却借助消费级Nvidia GPU组建的计算机,竟然在15分钟内就完成了超级计算机上要耗时2-3天才能完成的运算。由于出色的多线程处理能力(同时间可执行更多的并发计算),GPU比CPU更受科学计算领域人士的喜爱。来自莫斯科国立大学的这支研究团队,就想到了如何利用这一点(许多方程需要彼此并发运行),测试消费级技术能否在很多情况下取代超级计算机。


科学家用消费级Nvidia GPU组建了可解决极复杂方程的‘家用计算机’,解题速度却吊打超级计算机。本例中,GPU被用来解决few-body散射方程,其用于描述多个量子微粒间的相互作用。


当涉及3个或更多体时,方程的计算就会变得极其困难,可以拓展出包含数万甚至数十万行列的表单数据。然而运行Nvidia软件和研究人员编写的定制程序,GPU的变现却远超预期。


领队Vladimir Kukulin表示:“我们达成了不曾梦想过的速度,在三秒钟的时间内,程序就在一台‘家用台式机’上执行了2.6亿次复杂的二重积分运算,超级计算机根本没法和它比”。


我的同事使用了德国波鸿大学一台最大的超级算计,其采用了著名的‘蓝色基因’架构,价格相当昂贵——然而他的团队用了2到3天的时间,我们只花了15分钟!!!


除了使用消费级技术,该团队还希望让那些曾经只有耗费大量超算时间才能完成的领域,变得更加可及。

换言之,世界上只有少数团体有足够的资源来执行的这些计算,阻碍了相关研究领域的整体进步——包括量子力学与核子物理。


该团队所使用的处理器,零售价在300到500美金之间。比之研究所中动辄数亿美元的超级计算机,它对钱包更加友好。

早在十几年前,GPU在科学计算上的能力就已经崭露头角,只是现在才开始被更多人正视它的价值。

[编译自:Gizmag , 来源:LMSU]


超算不早就用了GPU吗?

===

我国首套高效能分布式GPU超级计算系统启用
新华网 2010年04月25日 08:32:06


      新华网北京4月24日电(记者 吴晶晶)我国首套分布式GPU超级计算系统24日在中国科学院建成并正式启用,这标志着我国运用高性能计算解决实际科研与工程问题的能力达到了国际先进水平,在软硬件协同和能效方面进入了国际领先行列

超算不早就用了GPU吗?

===

我国首套高效能分布式GPU超级计算系统启用
新华网 2010年04月25日 08:32:06


      新华网北京4月24日电(记者 吴晶晶)我国首套分布式GPU超级计算系统24日在中国科学院建成并正式启用,这标志着我国运用高性能计算解决实际科研与工程问题的能力达到了国际先进水平,在软硬件协同和能效方面进入了国际领先行列
中国科学院高效能分布式GPU超级计算系统启用
2010-04-25 | 小 中 大  【关闭窗口】
   
4月24日上午,中国科学院高效能分布式GPU超级计算系统启用仪式在中国科学院过程工程研究所举行。中国科学院院长路甬祥、副院长李静海、秘书长邓麦村、副秘书长谭铁牛,国家财政部教科文司司长赵路出席启用仪式。
高性能计算已成为国家竞争力的重要标志之一,对科学技术进步、经济社会发展、生态环境保护和国家与公共安全的作用日益显著。但是,在超级计算机的峰值突飞猛进的同时,其投资大、运行维护成本高、使用效率低等问题也日渐突出,成为制约超算能力提升的瓶颈。中国科学院从应用需求出发,基于长期在多尺度模拟方法及专业计算技术方面的积累,在国家和院专项资金的支持下,另辟蹊径,于2010年成功建立了基于GPU的双精度峰值超过千万亿次、单精度峰值超过三千万亿次的高效能超级计算系统,并与联想和曙光两家公司合作,在中科院内不同领域的研究所推广了十套百万亿次系统,从而构建了聚合计算能力近六千万亿次的分布式GPU超级计算系统。该系统满足了广大科技人员对超级计算的迫切需求,以低廉的成本和现成的网络设施实现高效的超级计算,探索形成了一条应用导向、效率优先的富有中国特色的超级计算模式。
目前,中科院过程工程研究所与高能物理研究所、国家天文台、地质与地球物理研究所、电工研究所、金属研究所、紫金山天文台、深圳先进技术研究院、近代物理研究所、中国科学技术大学、计算机网络信息中心等十家用户单位已经利用相关系统开展了高能物理模拟与实验数据分析、天体物理与空间科学研究、石油物探数据分析与油藏开采过程模拟、微电子系统诊断、材料和纳微系统模拟、工业反应器模拟、生物大分子模拟、工业和医学影像处理等方面的应用。系统还正服务于国家重大专项、国家科技支撑计划、国家自然科学重大基金项目和多家大型企业,涉及化工、冶金、石油、矿产等多个行业和物理、化学、材料、生物等多个学科,该系统的研制成功极大地提升了我国在超级计算领域的发展潜力和应用水平。
该系统在研制过程中,财政部和中科院一起进行了项目管理体制和机制的有益探索,充分发挥主管部门的行政组织能力,联合了联想公司、曙光公司和英伟达公司,整合了10多个相关研究所的优势力量,统一组织、统一领导、统筹协调各类创新资源协同攻关,不仅取得了项目的成功,而且积累了宝贵的经验,体现了体制机制创新在科研装备自主创新中的重要性。目前,财政部正会同国家有关部门,系统分析和总结该试点项目取得的成效,推广试点经验,为在全国范围部署科研装备的自主创新提供有益的借鉴。
毛子就别PPT炮嘴了!
俄罗斯人又想发挥其超乎寻常设计整合能力了,就像米格25那样。
hswz 发表于 2016-7-1 10:53
超算不早就用了GPU吗?

===
超算用的那GPU很贵,其实和消费级GPU 几乎一样的硬件,但是firmware不同, 俄罗斯人做的其实就是hacker了这个firmware ,其实国内有些做的很奇怪的专业显卡也是这么来的
也就是说,架构设计好了,用i7+GTX1080可以搭建一个超算
也就是说,架构设计好了,用i7+GTX1080可以搭建一个超算
这个是废话。
超算的难点就在架构和软件,换个CPU或者GPU本身不是什么复杂的事情。
超算用的那GPU很贵,其实和消费级GPU 几乎一样的硬件,但是firmware不同, 俄罗斯人做的其实就是hacker了 ...

没有ECC检验硬件支持的消费级显卡破解固件做专业通用计算加速卡,死机的画面想想都醉了
hswz 发表于 2016-7-1 13:44
没有ECC检验硬件支持的消费级显卡破解固件做专业通用计算加速卡,死机的画面想想都醉了
你慢慢醉吧,大把大把使用破解显卡的人表示没有你想象中的那么多死机,有钱的国企大学买专业显卡,屌丝公司用破解显卡一样干活的
你慢慢醉吧,大把大把使用破解显卡的人表示没有你想象中的那么多死机,有钱的国企大学买专业显卡,屌丝公 ...
你也知道国企大学买专业显卡就够了


世界第一的超算: 中国神威的计算全靠CPU申威26010,每个CPU的浮点运算能力是3万亿次双精度/秒

世界第二的超算:中国的天河-2的计算主要靠加速器是INTEL MIC, 每个加速器的浮点运算能力是是1.1万亿次双精度/秒

世界第三的超算:美国的TITAN的计算主要靠加速器是NVIDIA的TESLA K20,每个加速器浮点运算能力是1.17万亿次双精度/秒

对比下现在民用GPU里最强的nvidia geforce gtx 1080,双精度浮点运算是0.27万亿次/秒

毛子砖家是用哪个超算算的,比哪个民用的NVIDIA的GPU慢得多?难道是用苏联解体前的超算算的。。。


这是我在驱家新闻下的回复,自己转帖过来

世界第一的超算: 中国神威的计算全靠CPU申威26010,每个CPU的浮点运算能力是3万亿次双精度/秒

世界第二的超算:中国的天河-2的计算主要靠加速器是INTEL MIC, 每个加速器的浮点运算能力是是1.1万亿次双精度/秒

世界第三的超算:美国的TITAN的计算主要靠加速器是NVIDIA的TESLA K20,每个加速器浮点运算能力是1.17万亿次双精度/秒

对比下现在民用GPU里最强的nvidia geforce gtx 1080,双精度浮点运算是0.27万亿次/秒

毛子砖家是用哪个超算算的,比哪个民用的NVIDIA的GPU慢得多?难道是用苏联解体前的超算算的。。。


这是我在驱家新闻下的回复,自己转帖过来
微缩,迷你以及显微型超算么?
F22缺氧禽 发表于 2016-7-1 20:48
世界第一的超算: 中国神威的计算全靠CPU申威26010,每个CPU的浮点运算能力是3万亿次双精度/秒

世界第二 ...
TESLA P100更是牛逼,达到了5.3T
1771964382 发表于 2016-7-1 21:44
TESLA P100更是牛逼,达到了5.3T
5.3T的P100仅仅是接受预定,根本没交付呢。

而且那玩意也不算民用,批量极小不说,那玩意一个平均一块GPU得叫价接近10万人民币,而且只按整个系统卖,一个系统8个GPU,卖价80万元人民币。

这报价,比超算上的专用加速器贵一倍多,毫无性价比可言。
世界第一的超算: 中国神威的计算全靠CPU申威26010,每个CPU的浮点运算能力是3万亿次双精度/秒

世界第二 ...
不过是为了旁证了“中国超算不是高技术”的论调。
这种吹牛逼的造谣,就不要转了。

记得当时中国控制稀土吗?外媒铺天盖地的报道,这里发现稀土,那里发现稀土吗?
以前有个大学联网了几百台台式机,跑分布式操作系统,某些应用也号称可比超算;

但术业有专攻,专用超算的地位并未动摇;

俄罗斯也许可以石油换超算,让土鳖给搭一个“北极熊”超算,也去冲击下前五。
F22缺氧禽 发表于 2016-7-2 05:40
5.3T的P100仅仅是接受预定,根本没交付呢。

而且那玩意也不算民用,批量极小不说,那玩意一个平均一块 ...
交没交付人家会告诉你?售价你更不可能知道,而且这取决于你买的数量。
还有谁告诉你,只能买八块?
http://www.pcpop.com/doc/2/2621/2621337.shtml
全世界做超算的可以去剖腹了。十五分比2天多,算2天吧,合计230400秒,就是说,毛子做的比超算快192倍以上。你信吗?
搞笑么,专用gpu计算卡和消费级显卡搭起来原理都是一样的,消费级显卡阉了ECC,新点的显卡还阉了双精度浮点,连这点差价都出不起还搞超算?
交没交付人家会告诉你?售价你更不可能知道,而且这取决于你买的数量。
还有谁告诉你,只能买八块?
ht ...
不是说只能买8块,而是说公开发售的只能以8GPU完整系统为单位购买。可以算强行搭卖……
水果派派88 发表于 2016-7-2 11:42
不是说只能买8块,而是说公开发售的只能以8GPU完整系统为单位购买。可以算强行搭卖……
但私下发售的不见得是这种方式,价格也很可能有很大折扣。
但私下发售的不见得是这种方式,价格也很可能有很大折扣。
价格不知道。大规模搭建方式多数还是这种。
因为芯片接口就是以现在这种方式优化,软件也是现在这种架构效率最高。
所谓定制化多数还是节点物理特性和节点间互联的,GPU之间逻辑互联结构应该没什么人会去乱动。
水果派派88 发表于 2016-7-2 11:53
价格不知道。大规模搭建方式多数还是这种。
因为芯片接口就是以现在这种方式优化,软件也是现在这种架构 ...
但公开发售这个太不灵活,只适合小规模系统,大规模系统还是自己做板子、机架这些比较好。
但公开发售这个太不灵活,只适合小规模系统,大规模系统还是自己做板子、机架这些比较好。
大规模系统肯定要自己做板子和机架的。物理尺寸,供电和散热都不一样。
原理图倒是可以照着参考设计抄。

1771964382 发表于 2016-7-2 10:51
交没交付人家会告诉你?售价你更不可能知道,而且这取决于你买的数量。
还有谁告诉你,只能买八块?
ht ...


我比的就是公开市场价格啊

你这么点批量能打折扣,你以为人家搭超算打的折扣还不如你?

当年INTEL给天河-2的MIC,打的折扣,按照美国媒体说法,是400美元一片的卖血价,而MIC公开市场价是5000美元/片, 本来NUDT的天河-2是打算用GPU的呢,奈何INTEL为了抢超算世界第一的名号,卖血送MIC,愣是把NVIDIA给挤跑了。
1771964382 发表于 2016-7-2 10:51
交没交付人家会告诉你?售价你更不可能知道,而且这取决于你买的数量。
还有谁告诉你,只能买八块?
ht ...


我比的就是公开市场价格啊

你这么点批量能打折扣,你以为人家搭超算打的折扣还不如你?

当年INTEL给天河-2的MIC,打的折扣,按照美国媒体说法,是400美元一片的卖血价,而MIC公开市场价是5000美元/片, 本来NUDT的天河-2是打算用GPU的呢,奈何INTEL为了抢超算世界第一的名号,卖血送MIC,愣是把NVIDIA给挤跑了。
F22缺氧禽 发表于 2016-7-1 20:48
世界第一的超算: 中国神威的计算全靠CPU申威26010,每个CPU的浮点运算能力是3万亿次双精度/秒

世界第二 ...
别忘了有GTX Titan,Titan Black就有1.7Tflops的双精度了,Titan Z是2.7T
这个其实是并行运算的架构研究
这个cb小编是文盲吗
天河1不就是典型的 GPU超算嘛  玩剩下的东西
F22缺氧禽 发表于 2016-7-1 20:48
世界第一的超算: 中国神威的计算全靠CPU申威26010,每个CPU的浮点运算能力是3万亿次双精度/秒

世界第二 ...
毛子是用单卡的吗?
总不会真的纯家用配置吧?
这种文章也就蒙蒙外行,不过就是吹吹并行计算罢了...一个消费级GPU就匹敌超算了,这也信的人就别讨论计算机,不对,别讨论任何问题了...

楼上说什么消费级和企业级硬件差不多的那位,你大概是对可靠性这个参数完全没概念吧?
这种文章也就蒙蒙外行,不过就是吹吹并行计算罢了...一个消费级GPU就匹敌超算了,这也信的人就别讨论计算机 ...
就芯片而言没啥区别
世界第一的超算: 中国神威的计算全靠CPU申威26010,每个CPU的浮点运算能力是3万亿次双精度/秒

世界第二 ...
3万亿,这么变态