龙芯2超级计算机KD-50-I-E开始销售

来源:百度文库 编辑:超级军网 时间:2024/04/28 04:46:05


说明:
KD-50-I 原型机使用 336枚 Loongson-2F 750MHz CPU,是胡伟武、陈国良等科大校友为中国科大50周年校庆的献礼。原型机理论峰值 1TFLOPS,实测 LinPACK 峰值约 350GFLOPS,
正式推广的KD-50-I-E 是增强型(Enhanced),改进了内部结构。

====================
新华社十五日消息:30秒内为驾驶员提供实时路况和最优出行路线信息;8分钟完成单幅机载合成雷达数据成像,准实时精确提供灾情评估和经济损失分析信息。记者日前获悉,国产KD-50-I-E增强型万亿次国产高性能计算机已成功应用于城市交通控制与管理、防灾减灾。

  2007年12月底,中国首台采用国产高性能通用处理器芯片“龙芯2F”和其它国产器件、设备和技术的万亿次高性能计算机“KD-50-I”在中国科大研制成功。为了让该项成果直接服务于国民经济建设,陈国良院士领导科研团队大胆改进了计算节点的设计,使整机性能得到大幅度的提升。

  新近研制成功的两台万亿次计算机包括144(?)颗“龙芯2F”CPU,已分别应用于安徽省道路交通管理系统和安徽省减灾防灾雷达图象数据处理系统,直接服务于生产实际和国民经济建设。记者在机房现场看到,“KD-50-I-E”的体积仅相当于一台普通家用冰箱,其功耗小于6千瓦,成本不到80万元人民币。

  另外,中国科技部日前正式下达863计划重大专项──“浪潮天梭高端容错计算系统研制与应用推广”项目经费通知,正式启动这一项目。项目总投资7.475亿元,对于消除信息安全隐患、保障国家战略安全等具有重要意义。

  高端容错计算机通常指处理器数量为8颗至64颗的服务器系统,一方面性能强大,能够承担大型数据库、海量数据处理等大规模、超大规模的计算任务;另一方面具有极高的可靠性,每年系统停机时间不超过5分钟,专门面向高端商业应用,承载著金融、电信、税务、财政等关键行业的核心业务系统。

-------------------------------
rtsp://202.38.70.93/200712/20071227.rm
安徽新闻说说性价比很高,价格只有国外同型机的十分之一,成本是75万元,科大只卖80万元,呵呵

说明:
KD-50-I 原型机使用 336枚 Loongson-2F 750MHz CPU,是胡伟武、陈国良等科大校友为中国科大50周年校庆的献礼。原型机理论峰值 1TFLOPS,实测 LinPACK 峰值约 350GFLOPS,
正式推广的KD-50-I-E 是增强型(Enhanced),改进了内部结构。

====================
新华社十五日消息:30秒内为驾驶员提供实时路况和最优出行路线信息;8分钟完成单幅机载合成雷达数据成像,准实时精确提供灾情评估和经济损失分析信息。记者日前获悉,国产KD-50-I-E增强型万亿次国产高性能计算机已成功应用于城市交通控制与管理、防灾减灾。

  2007年12月底,中国首台采用国产高性能通用处理器芯片“龙芯2F”和其它国产器件、设备和技术的万亿次高性能计算机“KD-50-I”在中国科大研制成功。为了让该项成果直接服务于国民经济建设,陈国良院士领导科研团队大胆改进了计算节点的设计,使整机性能得到大幅度的提升。

  新近研制成功的两台万亿次计算机包括144(?)颗“龙芯2F”CPU,已分别应用于安徽省道路交通管理系统和安徽省减灾防灾雷达图象数据处理系统,直接服务于生产实际和国民经济建设。记者在机房现场看到,“KD-50-I-E”的体积仅相当于一台普通家用冰箱,其功耗小于6千瓦,成本不到80万元人民币。

  另外,中国科技部日前正式下达863计划重大专项──“浪潮天梭高端容错计算系统研制与应用推广”项目经费通知,正式启动这一项目。项目总投资7.475亿元,对于消除信息安全隐患、保障国家战略安全等具有重要意义。

  高端容错计算机通常指处理器数量为8颗至64颗的服务器系统,一方面性能强大,能够承担大型数据库、海量数据处理等大规模、超大规模的计算任务;另一方面具有极高的可靠性,每年系统停机时间不超过5分钟,专门面向高端商业应用,承载著金融、电信、税务、财政等关键行业的核心业务系统。

-------------------------------
rtsp://202.38.70.93/200712/20071227.rm
安徽新闻说说性价比很高,价格只有国外同型机的十分之一,成本是75万元,科大只卖80万元,呵呵
我在想,要是一台工作站配上4块 gtx295 和一枚 i7 965,

然后用CUDA的话,LinPACK 过1T有问题么?
太不厚道了,这次系统优化,请了陈国良这样的高手,没记错的话光CPU数量就减了一半
售价居然还是80万,成本75万打死不相信,难道之前的那台成本还超过了80万?
Rmax 13810G
Rpeak 24576G

PRIMERGY RX200 S4 Cluster, Quad Core 3Ghz, Infiniband, Windows HPC 2008
Details
Performance/Linpack Data
Ranking History

Site        Universitaet Aachen/RWTH
System Family        Fujitsu Siemens Cluster
System Model        PRIMERGY RX200 S4
Computer        PRIMERGY RX200 S4 Cluster, Quad Core 3Ghz, Infiniband, Windows HPC 2008
Vendor        UNICORNER/Fujitsu-Siemens
Application area        Research
Main Memory        4096 GB
Installation Year        2008

Operating System        Windows HPC 2008
Memory        4096 GB
Interconnect        Infinband DDR 4x
Processor        Intel EM64T Xeon E54xx (Harpertown) 3000 MHz (12 GFlops)
350G。。。现在肯定不算HPC了。要买也不会买这个庞然大物的,除非政府给补贴。。。
这么低的linpack,那么多的节点,还不如自己攒呢……
我这有不少赛扬 800 ,楼上的你给我攒个呗, 攒不出来 ,tjj tds
用Celeron 800攒不是有毛病?要攒就用Xeon X5500+5200,上Infiniband,一个节点两颗2.93G的Xeon,8个节点保准Linpack超过400G Flops。
人家好差再怎么吹,至少有东西拿出来卖。
某些人是干吹。
没兴趣,跟房地产商,牛奶商一样,打着国产本土的名号搂钱罢了。。。。。

交完税,怎么支持国货是ZF的事,做老百姓的本分,谁便宜,谁好用,卖谁。

觉得不爽,你就加税啥。
deam 发表于 2009-4-17 13:23

多jb 浪费啊!  还是赛扬好 ,省钱啊!? 现在论斤卖,觉得慢,多加几个节点中呗,使什么不就是攒嘛
dnpp 发表于 2009-4-17 13:45

没兴趣,你跟个毛贴啊 ,没兴趣,你都不应该进这个贴
不过打击龙芯,这是你们的工作,想不进不行,是吧
deam 发表于 2009-4-17 13:23
celeron800确实有点鸡肋。
就算cpu免费,合用的主板不好找。性能也很烂。
现在的拼cluster还是低端扣肉或者k8x2合理。主板,内存啥的还更便宜。
好消息,信息化的关键设备就是得自产才安全
我支持一下,希望他们一路走好,很少这么支持龙芯的,以前一直是冷嘲热讽的


这个问题好像以前讨论过,据几个自称业内人士说性能价格并不占优。

这个问题好像以前讨论过,据几个自称业内人士说性能价格并不占优。

太不厚道了,这次系统优化,请了陈国良这样的高手,没记错的话光CPU数量就减了一半
售价居然还是80万,成本75万打死不相信,难道之前的那台成本还超过了80万?
blueworld 发表于 2009-4-17 02:44


144颗CPU的那两台,好像是交通厅的定制机,根据对计算任务的评估,不需要那么多CPU。
太不厚道了,这次系统优化,请了陈国良这样的高手,没记错的话光CPU数量就减了一半
售价居然还是80万,成本75万打死不相信,难道之前的那台成本还超过了80万?
blueworld 发表于 2009-4-17 02:44


144颗CPU的那两台,好像是交通厅的定制机,根据对计算任务的评估,不需要那么多CPU。
spinup 发表于 2009-4-17 13:57

拼cluster要看价格/功耗了。
给定预算单core太贵了总性能不会好,烂core一堆也有加速比问题。耗电太大了散热空间都有问题。
要中间找平衡点。
要我攒多半选Opteron/Xeon的中端,配机架1U/2U的机箱/板子。不然一堆立式机箱也很烦人。
一个板子4个Core吧。
桃树下的月色 发表于 2009-4-17 20:46
桃MM真的要永远告别CD了吗?确实是技术派的一大损失啊
deam 发表于 2009-4-17 13:23
做出来再说。
别忘了把散热系统,稳定测试时间,运算速度,价格,网络优化(配置)等报告打上来show给大家看下


很强的,1个X5500 四核(5200就不考虑了),8节点双CPU,
这位先看看 Rpeack多少,有没有400G,你能做到linpack 400G.
去应聘dell的总师吧。

很强的,1个X5500 四核(5200就不考虑了),8节点双CPU,
这位先看看 Rpeack多少,有没有400G,你能做到linpack 400G.
去应聘dell的总师吧。
blueworld 发表于 2009-4-18 09:55

8节点双cpu都是4核,总共64个core。
算Rpeak应该是超过400G的。
thomasyoung 发表于 2009-4-18 10:38

1+1小于2
thomasyoung 发表于 2009-4-17 23:51

能把你这套玩意的硬件详细清单拉下么!?  
攒完后把性能等各项数据发上来!?
如果不能,把你也 TJJ TDS
曙光刚开始跟世界先进比又有什么牛?慢慢的还不是发展到今天有4000a,5000a,即将有6000a了。
华为刚开始不是有国家支持,又哪里有今天。

不过科大这个没有具体公司运营吧?这是不是能持续就是问号了。
攒,攒,攒。家庭用户相当多攒的,不然电脑城哪那么热闹,还养活了一批中关村泡泡之类的网站。不过大企业有几台电脑是用攒的?别说人家大企业没你有成本概念。别以为用嘴巴能攒,你就能去跟人家竞争了。
blueworld 发表于 2009-4-18 09:55

六个Q6600,用千兆网连接都有186G Flops linpack(国外某人自己攒的渲染农场),16个Xeon X5570用10G Infiniband连接过400G不是很容易?
托起航母 发表于 2009-4-18 13:18

http://news.mydrivers.com/blog/20080531.htm

参考这个。
潇声客 发表于 2009-4-18 13:43

很多大学、动画公司做渲染农场,其实和攒机没什么两样。
blueworld 发表于 2009-4-18 09:55
Oceanian 发表于 2009-4-17 06:44
deam 发表于 2009-4-18 20:02

那个参考里的 "Core 2 4核心处理器" 是什么时间的产品?!
32# 托起航母


06年的,现已退市。
托起航母 发表于 2009-4-18 21:17
2006年底07年初core2 q6600已经上市。
现在core2 q6600已经被淘汰。比较新的是nehalem--corei7。同样4核,频率也没提高多少。不过spec fp性能提高到2倍有余。
其实144节点组网绝不是容易的事,不是高手做不来,但8个甚至10几个节点就容易得多了,基本就是个攒。
所以单节点性能是很重要的,单节点性能好,10节点可以秒100节点的机器。龙芯想真正做这个至少要龙3 8核。
deam 发表于 2009-4-18 22:50
单节点效率提高也不是一件容易的事情。
内存带宽,片内交换开关,缓存一致性等等都是大问题。

多核的效率与单核比也极难成线性的关系。
龙芯 366芯*1核*0.7G    = 274.5G
KD-50-I 原型机 原型机理论峰值 1TFLOPS,实测 LinPACK 峰值约 350GFLOPS,
新型 144核没数据

参考里的
intel 6个core*4核*2.4G = 57.6G
集群机的浮点运算能力达到了186Gflops

运算能力 350G/186G =约等于 2倍   
总频率   274.5G/57.6G = 约等于 5 倍吧
对比  core 2 4核 这个成熟技术的典范(每个核)  成长中的 龙芯2f 还是不错的 , 这样的成绩对龙芯来说还是相当好的
龙芯万岁 :victory:
托起航母 发表于 2009-4-18 23:07

我还是第一次知道,FLOPS不需要考虑IPC的;P
大狼芬里尔 发表于 2009-4-18 23:56

IPC 是什么 ??:$
托起航母 发表于 2009-4-19 00:11
Instruction Per Cycle