中科院超算中心:连算13天 模拟140亿年宇宙演化

来源:百度文库 编辑:超级军网 时间:2024/04/28 18:55:16
http://news.ifeng.com/mil/2/detail_2013_06/13/26351478_0.shtml
大到浩瀚宇宙,小到一枚指纹,已经离不开超级计算。拥有超级计算资源的中科院超算中心,不仅是科学家的得力帮手,还正在将超级计算资源应用于民生。

“哦,非常不幸,来自日本的‘京’仅领先1年就被美国‘红杉’超越。再看看其他实力强劲的参赛者吧,有来自中国的‘天河-1A’、‘星云’,还有来自美国的‘走鹃’、‘美洲虎’……”

当你看到这段解说词时千万别误会,这里所描述的并非一场汽车拉力赛,而是世界各国超级计算机的“彪悍”排名。

为何彪悍?比如新秀“红杉”,其持续运算测试达到16324万亿次运算,而普通电脑每秒才可执行几十万条指令。

在这个彪悍的领域中,游走着一支优秀队伍:中国科学院计算机网络信息中心超级计算中心(以下简称超算中心)。他们是中科院科学家的得力助手,保证课题顺利、按时完成所需的计算任务;他们亦成为各行业的合作伙伴,将超级计算应用惠及民生。

在超级计算这个“最快”的数据世界里,超算中心留下了踏实的脚印。

满负荷状态运行

“我们用2048个CPU核不间断地计算了13天,模拟了宇宙140亿年的演化过程。”超算中心研发部主管王龙回忆起3年前的一次大型模拟宇宙试验,“天文学家告诉我,这一模拟的分辨率现居世界第三。”

通过对海量数据分析,科学家发现了更多宇宙变化新特征,堪称用13天“看到”宇宙的140亿年。

“此次超大规模的宇宙模拟试验是在超算中心联想‘深腾7000’超级计算机上完成的。”王龙说,该试验被称为“盘古计划”的一部分。

在中科院紫金山天文台研究员冯珑珑、超算中心王龙等人的倡议下,中科院紫金山天文台、中科院国家天文台、中科院上海天文台和中科院计算机网络信息中心共同成立了中国计算宇宙学联盟。“盘古计划”便是由该联盟提出的第一项大型宇宙学数值模拟计划。

“这些年,我们的计算能力在稳步提升。”超算中心主任迟学斌说。2007年,超算中心引进IBMCellBE计算集群;2009年,超算中心引进百万亿次国产产品“深腾7000”超级计算机。

可以想见,设备规模越来越大,短时间内出现故障的可能性也会随之出现。

如果一个已进行长时间计算的课题突然因为某颗处理器出了故障,导致课题无法及时完成,这是超算中心最担心也最不希望出现的情况。

因此,“超算中心通过各种手段如软件等解决这些问题,保障计算任务按时完成。”迟学斌说。2012年,该中心服务时间达到99.9%,设备使用率达到80%以上,“我们一直处于满负荷状态运行”。

游走在指纹世界

承担来自科学家的计算任务固然重要,但是对于服务社会和大众,超算中心也毫不吝惜自己的智慧和力量。


来自超算中心的年轻副研究员王彦棡带领团队,利用“深腾7000”超级计算机提供的数千个处理器,协助北京市公安局刑侦总队完成了指纹破案会战的计算工作。

“指纹识别系统是一个将超级计算技术成功应用于实战的成果。”王彦棡说。

指纹会战是将掌握的现场指纹和档案指纹进行全面比对,通过指纹识别系统快速有效地查找出流窜作案人员的蛛丝马迹,为破案提供直接线索。“面对海量数据,如果没有超级计算的参与,可能需要普通计算机工作数月。”王彦棡说。

2011年,公安机关共组织了两次较大规模的指纹会战。中科院超算中心协助北京市公安局比中本地现场指纹数十枚,比中外地协查指纹700余枚,为相关案件的破获提供了直接线索和重要证据。

游走在指纹世界中的超级计算同样可以帮助人们预报天气。

姜金荣看上去更像是一位正在读书的学生,他和团队已为中国气象局的并行亚洲沙尘暴业务预报模式(即CUACE-DUST)提供开发与优化服务有六七年时间。

该预报模式原来72小时预报需要十多个小时的计算时间;现在使用128核处理器只需10多分钟。“我们准确预报了2006年至今我国春季大多数沙尘暴过程,成为中国气象局沙尘暴业务数值预报系统。”姜金荣说。

最深刻的学科交叉经历

在超算中心里,你最常听到的一个词语是服务。迟学斌认为,支撑超算中心做好服务的是一支国内最优秀的人才队伍。

2011年,一篇来自超算中心的论文被国际超级计算大会(SupercomputingConference,简称SC11)录用,这是该领域的顶级会议。

“我们用近半年时间完成了软件研发和论文撰写工作。”论文的第一作者王龙说。该文章主要描述材料第一原理计算中大规模并行算法与异构算法及其软件实现,即如何将传统的材料计算软件使用GPU(图形处理器)进行有效加速。

“在此之前,很多人认为GPU难以在平面波第一原理计算这样复杂的算法中发挥作用,甚至断言GPU不适合此类计算。”王龙说。其实,无论是当时还是现在,在此领域拿出成果都并非易事。

这是因为,作为一种新型显卡的“心脏”,GPU体系结构迥异于传统CPU,导致传统软件设计往往不再适用。由于材料计算算法和GPU体系结构的双重复杂性,这一工作一直鲜有进展。

带着一大堆不易解开的难题和一份基于直觉的激情,超算中心王龙、贾伟乐,复旦大学教授高卫国及其学生吴悦等一起开始“虎山行”。

通过与美国劳伦斯伯克力国家实验室材料计算专家汪林望多次探讨,大家逐渐找到了新思路。

经历100多天的奋战,他们终于完成了这一开创性工作,超算中心团队在至为关键的核心模块研发中发挥了主要作用。2011年4月,超算中心向SC11提交该论文。

“这是我感触最深刻的一次学科交叉经历,物理、数学、计算机三方面的力量真正融合在一起,可以说功劳属于每一个人。”王龙说。


“在当时,该软件将业内最快纪录提速了7倍,效果非常好。”迟学斌如此评价,“这也体现了超算中心的算法、软件优化、并行化等能力得到国际认可。”目前,他们已经将加速提升至20倍以上,同时扩充了新功能。

另外,超算中心队伍开发出不少软件供一些高校、研究所和企业使用,比如特征值计算、快速数值求解软件等;超算中心网格软件也走出国门,当苏丹建设超算中心时,该国3个中心使用了来自超算中心的网格软件。而国内其他超算中心鲜有如此情况。

作为超算中心元老级人物,迟学斌感慨道:“来到超算中心的年轻人都喜欢这一行业。因为这是一项具有挑战性的工作,又极富成就感。”

去年,超算中心服务时间达99.9%,设备使用率达到80%以上,协助科学家、合作伙伴完成各类超级计算任务。(记者 杨琪)  http://news.ifeng.com/mil/2/detail_2013_06/13/26351478_0.shtml
大到浩瀚宇宙,小到一枚指纹,已经离不开超级计算。拥有超级计算资源的中科院超算中心,不仅是科学家的得力帮手,还正在将超级计算资源应用于民生。

“哦,非常不幸,来自日本的‘京’仅领先1年就被美国‘红杉’超越。再看看其他实力强劲的参赛者吧,有来自中国的‘天河-1A’、‘星云’,还有来自美国的‘走鹃’、‘美洲虎’……”

当你看到这段解说词时千万别误会,这里所描述的并非一场汽车拉力赛,而是世界各国超级计算机的“彪悍”排名。

为何彪悍?比如新秀“红杉”,其持续运算测试达到16324万亿次运算,而普通电脑每秒才可执行几十万条指令。

在这个彪悍的领域中,游走着一支优秀队伍:中国科学院计算机网络信息中心超级计算中心(以下简称超算中心)。他们是中科院科学家的得力助手,保证课题顺利、按时完成所需的计算任务;他们亦成为各行业的合作伙伴,将超级计算应用惠及民生。

在超级计算这个“最快”的数据世界里,超算中心留下了踏实的脚印。

满负荷状态运行

“我们用2048个CPU核不间断地计算了13天,模拟了宇宙140亿年的演化过程。”超算中心研发部主管王龙回忆起3年前的一次大型模拟宇宙试验,“天文学家告诉我,这一模拟的分辨率现居世界第三。”

通过对海量数据分析,科学家发现了更多宇宙变化新特征,堪称用13天“看到”宇宙的140亿年。

“此次超大规模的宇宙模拟试验是在超算中心联想‘深腾7000’超级计算机上完成的。”王龙说,该试验被称为“盘古计划”的一部分。

在中科院紫金山天文台研究员冯珑珑、超算中心王龙等人的倡议下,中科院紫金山天文台、中科院国家天文台、中科院上海天文台和中科院计算机网络信息中心共同成立了中国计算宇宙学联盟。“盘古计划”便是由该联盟提出的第一项大型宇宙学数值模拟计划。

“这些年,我们的计算能力在稳步提升。”超算中心主任迟学斌说。2007年,超算中心引进IBMCellBE计算集群;2009年,超算中心引进百万亿次国产产品“深腾7000”超级计算机。

可以想见,设备规模越来越大,短时间内出现故障的可能性也会随之出现。

如果一个已进行长时间计算的课题突然因为某颗处理器出了故障,导致课题无法及时完成,这是超算中心最担心也最不希望出现的情况。

因此,“超算中心通过各种手段如软件等解决这些问题,保障计算任务按时完成。”迟学斌说。2012年,该中心服务时间达到99.9%,设备使用率达到80%以上,“我们一直处于满负荷状态运行”。

游走在指纹世界

承担来自科学家的计算任务固然重要,但是对于服务社会和大众,超算中心也毫不吝惜自己的智慧和力量。


来自超算中心的年轻副研究员王彦棡带领团队,利用“深腾7000”超级计算机提供的数千个处理器,协助北京市公安局刑侦总队完成了指纹破案会战的计算工作。

“指纹识别系统是一个将超级计算技术成功应用于实战的成果。”王彦棡说。

指纹会战是将掌握的现场指纹和档案指纹进行全面比对,通过指纹识别系统快速有效地查找出流窜作案人员的蛛丝马迹,为破案提供直接线索。“面对海量数据,如果没有超级计算的参与,可能需要普通计算机工作数月。”王彦棡说。

2011年,公安机关共组织了两次较大规模的指纹会战。中科院超算中心协助北京市公安局比中本地现场指纹数十枚,比中外地协查指纹700余枚,为相关案件的破获提供了直接线索和重要证据。

游走在指纹世界中的超级计算同样可以帮助人们预报天气。

姜金荣看上去更像是一位正在读书的学生,他和团队已为中国气象局的并行亚洲沙尘暴业务预报模式(即CUACE-DUST)提供开发与优化服务有六七年时间。

该预报模式原来72小时预报需要十多个小时的计算时间;现在使用128核处理器只需10多分钟。“我们准确预报了2006年至今我国春季大多数沙尘暴过程,成为中国气象局沙尘暴业务数值预报系统。”姜金荣说。

最深刻的学科交叉经历

在超算中心里,你最常听到的一个词语是服务。迟学斌认为,支撑超算中心做好服务的是一支国内最优秀的人才队伍。

2011年,一篇来自超算中心的论文被国际超级计算大会(SupercomputingConference,简称SC11)录用,这是该领域的顶级会议。

“我们用近半年时间完成了软件研发和论文撰写工作。”论文的第一作者王龙说。该文章主要描述材料第一原理计算中大规模并行算法与异构算法及其软件实现,即如何将传统的材料计算软件使用GPU(图形处理器)进行有效加速。

“在此之前,很多人认为GPU难以在平面波第一原理计算这样复杂的算法中发挥作用,甚至断言GPU不适合此类计算。”王龙说。其实,无论是当时还是现在,在此领域拿出成果都并非易事。

这是因为,作为一种新型显卡的“心脏”,GPU体系结构迥异于传统CPU,导致传统软件设计往往不再适用。由于材料计算算法和GPU体系结构的双重复杂性,这一工作一直鲜有进展。

带着一大堆不易解开的难题和一份基于直觉的激情,超算中心王龙、贾伟乐,复旦大学教授高卫国及其学生吴悦等一起开始“虎山行”。

通过与美国劳伦斯伯克力国家实验室材料计算专家汪林望多次探讨,大家逐渐找到了新思路。

经历100多天的奋战,他们终于完成了这一开创性工作,超算中心团队在至为关键的核心模块研发中发挥了主要作用。2011年4月,超算中心向SC11提交该论文。

“这是我感触最深刻的一次学科交叉经历,物理、数学、计算机三方面的力量真正融合在一起,可以说功劳属于每一个人。”王龙说。


“在当时,该软件将业内最快纪录提速了7倍,效果非常好。”迟学斌如此评价,“这也体现了超算中心的算法、软件优化、并行化等能力得到国际认可。”目前,他们已经将加速提升至20倍以上,同时扩充了新功能。

另外,超算中心队伍开发出不少软件供一些高校、研究所和企业使用,比如特征值计算、快速数值求解软件等;超算中心网格软件也走出国门,当苏丹建设超算中心时,该国3个中心使用了来自超算中心的网格软件。而国内其他超算中心鲜有如此情况。

作为超算中心元老级人物,迟学斌感慨道:“来到超算中心的年轻人都喜欢这一行业。因为这是一项具有挑战性的工作,又极富成就感。”

去年,超算中心服务时间达99.9%,设备使用率达到80%以上,协助科学家、合作伙伴完成各类超级计算任务。(记者 杨琪)