龙芯万亿次计算机,用于机载雷达测绘 !

来源:百度文库 编辑:超级军网 时间:2024/04/29 08:47:37


“超级电脑”催生“超级产业”

“KD-50-I”,功夫了得,它的理论峰值计算能力达到1万亿次。也就是说,一秒钟内它能够进行一万亿次的加减运算,这能满足我国与日俱增的大型、密集、高性能计算需求。专家称,“KD-50-I”万亿次机的研制成功,是高性能计算机向个人化方向发展的首次成功尝试,对国家安全具有战略意义。

“KD-50-I”在中国科大诞生,吸引安徽境内企业的眼球。安徽科力公司与中电集团38所成为首批用户,分别将之应用于城市交通控制与管理以及防灾减灾等领域。科力公司以国产高性能计算机为平台,成功研发交通动态诱导系统,浮动车数据处理时间缩短三分之二,计算精度提高20%。这套交通动态诱导系统,已在北京成功运行,2009年将应用于合肥、杭州、青岛等地,以缓解城市交通拥塞。

用机载合成孔径雷达遥测淮河洪水灾情,在普通服务器上生成单幅雷达图像需耗时2个小时,而“KD-50-I-E”只需8分钟。 “若‘KD-50-I’早些诞生并应用就好了,它就能够在汶川地震中发挥作用。 ”陈国良院士叹惜说,雷达收集大量震区灾情,再用普通计算机来处理生成数据,会花去很多时间,而“KD-50-I”处理起来不到十分钟,这会为抢险工作赢得时间。
(战时,能够实时生成数据,以便打击,这可是很重要的哦)

五十年间圆一梦

  做强国货、自主创新是增强国家竞争力、实现民族伟大复兴的战略抉择。五十年坚持,陈国良终于实现制造国产高性能计算机的梦想。

陈国良院士深情地表示:“在我小的时候,用的火柴叫"洋火",火柴盒子上都写着"安全火柴,提倡国货",这句话给我留下了深刻的印象。那时候,我们的民族工业还十分脆弱,但民族感始终那么强烈。如今,"KD-50-I"高性能计算机是完全由我国自主研制的,确立了国产高性能通用处理器在高端并行机应用中的核心地位,为我国未来研制国产千万亿次计算机提供了示范作用,对推动我国民族高性能计算机事业的发展和国家安全都具有重要的战略意义。”

替振兴民族计算机呐喊,陈国良打了一个小胜仗,但还是不过瘾。 2007年5月起,陈国良团队与中科院计算技术研究所合作,研制国产万亿次高性能计算机,2007年12月“KD-50-I”计算机通过专家委员会鉴定。这台计算机的硬件系统及软件系统完全是国货,是陈国良团队从深圳、武汉等地一点点“淘”来的。

运算万亿次耗能不到六千瓦

据了解,“KD-50-I”万亿次计算机采用单一机柜,集成了330余颗“龙芯2F”处理器,理论峰值计算能力达到1万亿次,整机系统结构先进,采用了高密度节点设计技术。硬件系统采用了我国自主设计的龙芯2F处理器、华为自主研发的千兆以太网交换机等。

“KD-50-I”具有“三低一高”的特点,首先是低成本,每(运算)万亿次,75万元人民币就可以买到;低功耗,每(运算)万亿次,耗能六千瓦之内就可以了;还有低占地面积,我们336个CPU把它安装在一个机箱里面,目前它的体积大小只相当于一个冰箱;那么这个“冰箱”相当于我们这个中心机房五套进口的国外的整个计算机的计算量。

安徽花100万元获转化权

  中国科大在发布研制成功国产万亿次高性能计算机KD-50-I消息后,国内外很多企业及政府单位希望获得该项成果产业化转化权利,其中苏州市政府承诺愿意拿出3000万元的资金来推广运用。前段时间,王三运省长来中国科大调研,希望中国科大为安徽的发展培养更多人才,出更多科研成果。所以,这次中国科大拒绝所有单位的邀请,要把成果留在安徽,安徽省只花了100万元,就获得了该项成果的转化权利。

虽然国产高性能计算机已在安徽“开花结果”,但它的产业化之路并非坦途。 “KD-50-I”的运算系统是并行计算,而国内掌握这种运算的人数并不多,相关应用软件也不完善。据悉,计算机系统的应用目前主要分为科学与工程计算、网络服务应用、桌面与移动应用三类。专家介绍说,科学与工程计算领域以及网络服务应用领域原有的并行程序基本可以顺利移植“KD-50-I”。而在桌面与移动计算领域,大量现存应用都是串行的,开发者不熟悉并行程序的开发,需要对现有应用并行化和开发新的并行应用程序。陈国良院士呼吁,中国高校特别是安徽高校,应开设并行计算课程,让更多学子熟悉并行程序的开发,为国产高性能计算机推广打下坚实的人才基础。专家还指出,高性能计算机产业发展必须由市场和技术两个轮子驱动。用户从高性能计算机研制阶段就参与其中,有利于形成适销对路的产品,有利于产品的推广应用,有利于高性能计算机产业生态环境的形成。

KD-50-I万亿次机软件主要构成
操作系统:Debian/GNU Linux 4.0
编译环境
GCC4.2
MPICH2
数值函数库
BLAS
LAPACK
ScaLAPACK
FFTW
资源管理:TORQUE
作业调度:Maui
运行监控:Ganglia

这个网址,可以实时监测KD-50-I
http://www.kd50.ustc.edu.cn/

“超级电脑”催生“超级产业”

“KD-50-I”,功夫了得,它的理论峰值计算能力达到1万亿次。也就是说,一秒钟内它能够进行一万亿次的加减运算,这能满足我国与日俱增的大型、密集、高性能计算需求。专家称,“KD-50-I”万亿次机的研制成功,是高性能计算机向个人化方向发展的首次成功尝试,对国家安全具有战略意义。

“KD-50-I”在中国科大诞生,吸引安徽境内企业的眼球。安徽科力公司与中电集团38所成为首批用户,分别将之应用于城市交通控制与管理以及防灾减灾等领域。科力公司以国产高性能计算机为平台,成功研发交通动态诱导系统,浮动车数据处理时间缩短三分之二,计算精度提高20%。这套交通动态诱导系统,已在北京成功运行,2009年将应用于合肥、杭州、青岛等地,以缓解城市交通拥塞。

用机载合成孔径雷达遥测淮河洪水灾情,在普通服务器上生成单幅雷达图像需耗时2个小时,而“KD-50-I-E”只需8分钟。 “若‘KD-50-I’早些诞生并应用就好了,它就能够在汶川地震中发挥作用。 ”陈国良院士叹惜说,雷达收集大量震区灾情,再用普通计算机来处理生成数据,会花去很多时间,而“KD-50-I”处理起来不到十分钟,这会为抢险工作赢得时间。
(战时,能够实时生成数据,以便打击,这可是很重要的哦)

五十年间圆一梦

  做强国货、自主创新是增强国家竞争力、实现民族伟大复兴的战略抉择。五十年坚持,陈国良终于实现制造国产高性能计算机的梦想。

陈国良院士深情地表示:“在我小的时候,用的火柴叫"洋火",火柴盒子上都写着"安全火柴,提倡国货",这句话给我留下了深刻的印象。那时候,我们的民族工业还十分脆弱,但民族感始终那么强烈。如今,"KD-50-I"高性能计算机是完全由我国自主研制的,确立了国产高性能通用处理器在高端并行机应用中的核心地位,为我国未来研制国产千万亿次计算机提供了示范作用,对推动我国民族高性能计算机事业的发展和国家安全都具有重要的战略意义。”

替振兴民族计算机呐喊,陈国良打了一个小胜仗,但还是不过瘾。 2007年5月起,陈国良团队与中科院计算技术研究所合作,研制国产万亿次高性能计算机,2007年12月“KD-50-I”计算机通过专家委员会鉴定。这台计算机的硬件系统及软件系统完全是国货,是陈国良团队从深圳、武汉等地一点点“淘”来的。

运算万亿次耗能不到六千瓦

据了解,“KD-50-I”万亿次计算机采用单一机柜,集成了330余颗“龙芯2F”处理器,理论峰值计算能力达到1万亿次,整机系统结构先进,采用了高密度节点设计技术。硬件系统采用了我国自主设计的龙芯2F处理器、华为自主研发的千兆以太网交换机等。

“KD-50-I”具有“三低一高”的特点,首先是低成本,每(运算)万亿次,75万元人民币就可以买到;低功耗,每(运算)万亿次,耗能六千瓦之内就可以了;还有低占地面积,我们336个CPU把它安装在一个机箱里面,目前它的体积大小只相当于一个冰箱;那么这个“冰箱”相当于我们这个中心机房五套进口的国外的整个计算机的计算量。

安徽花100万元获转化权

  中国科大在发布研制成功国产万亿次高性能计算机KD-50-I消息后,国内外很多企业及政府单位希望获得该项成果产业化转化权利,其中苏州市政府承诺愿意拿出3000万元的资金来推广运用。前段时间,王三运省长来中国科大调研,希望中国科大为安徽的发展培养更多人才,出更多科研成果。所以,这次中国科大拒绝所有单位的邀请,要把成果留在安徽,安徽省只花了100万元,就获得了该项成果的转化权利。

虽然国产高性能计算机已在安徽“开花结果”,但它的产业化之路并非坦途。 “KD-50-I”的运算系统是并行计算,而国内掌握这种运算的人数并不多,相关应用软件也不完善。据悉,计算机系统的应用目前主要分为科学与工程计算、网络服务应用、桌面与移动应用三类。专家介绍说,科学与工程计算领域以及网络服务应用领域原有的并行程序基本可以顺利移植“KD-50-I”。而在桌面与移动计算领域,大量现存应用都是串行的,开发者不熟悉并行程序的开发,需要对现有应用并行化和开发新的并行应用程序。陈国良院士呼吁,中国高校特别是安徽高校,应开设并行计算课程,让更多学子熟悉并行程序的开发,为国产高性能计算机推广打下坚实的人才基础。专家还指出,高性能计算机产业发展必须由市场和技术两个轮子驱动。用户从高性能计算机研制阶段就参与其中,有利于形成适销对路的产品,有利于产品的推广应用,有利于高性能计算机产业生态环境的形成。

KD-50-I万亿次机软件主要构成
操作系统:Debian/GNU Linux 4.0
编译环境
GCC4.2
MPICH2
数值函数库
BLAS
LAPACK
ScaLAPACK
FFTW
资源管理:TORQUE
作业调度:Maui
运行监控:Ganglia

这个网址,可以实时监测KD-50-I
http://www.kd50.ustc.edu.cn/
楼主标题党了,那不过是个假设的说法。
产业化安徽搞不搞的起来呢。觉得还是江苏这些沿海的商业头脑和环境比较好。
不懂路过。
潇声客 发表于 2009-4-28 19:39

"用机载合成孔径雷达遥测淮河洪水灾情,在普通服务器上生成单幅雷达图像需耗时2个小时,而“KD-50-I-E”只需8分钟。"
雷达测绘?这玩意还是GPGPU比较有性价比,CELL eDP都嫌浪费;HPC?典型的大材小用

HD4870X2 CFX + Brook+,软硬件总成本不会超过10000,效能还要高出一大截;当然软件中间层的优化会困难一些(底层可以交给Brook+)
大狼芬里尔 发表于 2009-4-29 08:37
军品不会用这东西的
便宜的那点钱只是最后考虑的因素
这个系统目前是两个顶级科大在这个上面死磕啊!哈哈哈,祝贺两个科大已经接近世界先进水平了!:D
真的还是假的?????现在学术作假太多
有一定的研究成果

但是吹嘘的太厉害   言过其实的东西太多
“吹”是目前学术界的优良传统
KD喝过减肥茶后成功瘦身,砍掉相当多的节点,保持性能不变
大狼芬里尔 发表于 2009-4-29 08:37

哈哈  你还挺会捧的. 啥是GPGPU
还大材小用,你用过啊。
你那个什么gpgpu可以直接运行现有的linux和win上面的软件么!?
qnxchina 发表于 2009-4-29 20:20
你也不看看谁帮忙瘦身的。
GPGPU能做的事,Beowulf都能做,
Beowulf能做的事,GPGPU许多都不能做,就算能做也大失速度。
比如直接进行有限差分格式的三维离散拉普拉斯变换

声明,这是这方面专业人士的原话,不懂,贴下而已。
“离散拉普拉斯变换” 好别扭的说法。
我只知道S变换在离散域对应的是Z变换。
托起航母 发表于 2009-4-29 22:19
自己Google去。AMD/ATI NV折腾有几年了。
关键字 GPGPU CUDA OpenCL
blueworld 发表于 2009-4-29 23:28

理论上现有任何计算装置能做的事情,比如DSP GPU GPGPU之类的,CPU都可以做。
但是针对特定问题,DSP或者GPU这类特殊结构的东西其运算能力、功耗、成本都不是CPU可以抗衡的。NV高端显卡拿出来说浮点一块卡就够super computing了。
理论上能大一统的事情多了,实际上提醒某些贵宾,等做到了再扯淡。
blueworld 发表于 2009-4-30 02:59

大一统理论?你知道说的是什么么?
托起航母 发表于 2009-4-29 22:19

有点常识再来发言,谢谢

GPGPU能做的事,Beowulf都能做,
Beowulf能做的事,GPGPU许多都不能做,就算能做也大失速度。
比如直接进行有限差分格式的三维离散拉普拉斯变换

声明,这是这方面专业人士的原话,不懂,贴下而已。
blueworld 发表于 2009-4-29 23:28


这是没有疑问的,GPGPU和Beowulf比通用性一点前途没有
但雷达测绘这一块,绝大多数工作GPGPU都可以漂亮地完成;或者这大概是最适合GPGPU的工作之一
至于拉普拉斯变换,GPGPU涉及于此的应用并不算少
GPGPU能做的事,Beowulf都能做,
Beowulf能做的事,GPGPU许多都不能做,就算能做也大失速度。
比如直接进行有限差分格式的三维离散拉普拉斯变换

声明,这是这方面专业人士的原话,不懂,贴下而已。
blueworld 发表于 2009-4-29 23:28


这是没有疑问的,GPGPU和Beowulf比通用性一点前途没有
但雷达测绘这一块,绝大多数工作GPGPU都可以漂亮地完成;或者这大概是最适合GPGPU的工作之一
至于拉普拉斯变换,GPGPU涉及于此的应用并不算少
5.精通C/C 编程优先,熟悉GPU原理者优先。
blueworld 发表于 2009-4-29 23:26

哈哈,早就知道了,KD在做规划时没有估计到由于整体效率上不去,原来规划中的节点存在浪费,去掉就完,
也就是说遇到玻璃顶棚了,
大狼芬里尔 发表于 2009-4-29 08:37
--------------------------------------------------------------
又来这里说市场性价比了!!!你怎么不叫美国情报部门用市场上的电脑啊??不用装什么保密装备,省钱啊!!

叫美国的高科技产品,如航天发射到中国来做啊??省钱啊!!
大狼芬里尔 发表于 2009-4-30 09:25

那请问,你所说的常识是那些常识呢. 而我说的又是什么意思呢!?
你连人家贴都没弄清楚倒底是意思, 就乱回贴,请你搞好中文再来发言!

提醒你,,我是在问,而不是在答. 所以, 你的话就是废话。
qnxchina 发表于 2009-4-30 10:03

对于这一套全新的硬新, 规划能精确么 !?  
看到人家少用cpu就认为整体效率上不去,节点是浪费,你很武断啊
破璃顶棚!  看你像玻璃顶棚
雷达测绘?这玩意还是GPGPU比较有性价比,CELL eDP都嫌浪费;HPC?典型的大材小用

HD4870X2 CFX + Brook+,软硬件总成本不会超过10000,效能还要高出一大截;当然软件中间层的优化会困难一些(底层可以交给Brook+ ...
大狼芬里尔 发表于 2009-4-29 08:37
------------------------------------------------------
请你这CD贵宾先去骂骂美国媒体怎么要叫骂不要用中国生产的芯片吧!!!

龙芯一再用事实打着CD贵宾和有些人的脸!!!他们居然只有用市场的性价比来说话了,哈哈,叫WW日本西方国家不用保留军火工业了,有美国的军火市场嘛,最好的市场性价比了,WW日本西方国家的军火工业怎么还不去死啊
thomasyoung 发表于 2009-4-30 01:23

你别把dps 和 gpu 还用 gpgpu弄一块说,好不.
26# 托起航母
攒机器过程后总得做性能测试,最后连50%都不到的效能,经过调整也达不到,还不自己找找原因?最后请人弄清是赘肉太多了,不是结构上的限制还有什么呢
qnxchina 发表于 2009-4-30 11:50
------------------------------------------------------------------------
攒机器???哈哈,WW用没有知识产权的代工才叫攒机器!!!

叫WW也攒一个机器来啊!!非洲都可以说美国在攒机器啊!!哈哈
29# qnxchina

攒不出机器的,连0%的性能都达不到!!!

WW连潜艇都攒不出啊
30# killerop24

不用攒用什么呢,总不能说是种机器吧
扣字眼很无聊
非常厚道地说,这个对比非常地不厚道:压根没提那个“普通PC服务器”的配置:是P4 2.4?是Xeon E5400系列?

不知坛上有没有人有2F盒子,会不会用blender渲图,如果有这样的条件可以找个3D序列渲染测试一下,看看2F和当今的主流CPU差距多少,然后就可以推算出这个KD50的实际性能了。

偶估计KD50的性能应该和双Xeon X5570是一个级别。
托起航母 发表于 2009-4-30 10:06

您的提问已经足够说明常识水平,over
至于GPGPU,现在的技术通用性的确很差,但随着DX11、OpenCL的发展,以及Larrabee这样的高通用性计算技术的诞生,GPGPU的前景极为广阔。
另外,要讨论的话,多少说出点东西来,我还真没兴趣回复狂乱的叫嚣

物以类聚,人以群分;很简单的道理
GPGPU,还只能是在很少数专业领域发挥作用。要进一步扩大应用范围,估计还需要五年十年的。这段时间龙芯也是一样在发展的。龙芯桌面版现在才1G左右,以后提高到2G,做办公肯定是绰绰有余了。软件以后最好是大量用Python等解释型的语言来做,彻底解决跨平台问题,而且开发效率又非常高。
潇声客 发表于 2009-4-30 12:25

5年到10年?你也太小看Intel、Nvidia和AMD了。

2G的2F也不够桌面,桌面应用流畅至少要Celeron E1200。
deam 发表于 2009-4-30 12:01

事实上,双Xeon X5570的SPEC fp_rate的分数是PD 940的10倍,如果首楼所提到的与KD50对比的那个“服务器”的性能与PD 940是一个级别,那么很容易推出KD50的性能水平如何了。
deam 发表于 2009-4-30 12:27

那你就回顾下软硬件发展历史,说说怎么小看了。
五年十年算是基本单位时间了。不要以为什么事情都是可以一两年就能飞到天上。

龙芯2F现在还不到1G,其实已经基本可以满足办公了,以前P3P4那还不是照样跑,办公软件对性能的要求基本停滞了。能提升到2G将绰绰有余。
以后办公等低端CPU拼不再是性能,而是拼成本。以后低端CPU市场搞不好山寨化,就是门槛变低了,象手机芯片,多媒体芯片一样,大大小小的公司想做都能做。