(转)超算,“曙光”不甘寂寞:E级(每秒百亿亿次)计 ...

来源:百度文库 编辑:超级军网 时间:2024/05/04 04:28:42
十亿亿次之后 E级计算现“曙光”_服务器_比特网
http://server.chinabyte.com/290/13831790.shtml

十亿亿次之后 E级计算现“曙光”
发布时间:2016-07-11 13:56:00 来源:比特网 作者:zhanggl
关键字:E级计算 HPC hpc 超算 曙光

  2016年的夏天,最热的不仅有天气,还有超级计算机。

  6月20日,在第47届全球超算TOP500榜单中,中国超算“太湖之光”一骑绝尘,斩获冠军宝座;同时,中国军团以167套超算的成绩首次超过了美国(165套),拿下超级计算机份额冠军。

  在这届榜单中,无论是“点”还是“面”,中国超算都取得了冠军,这是值得中国超算界骄傲的成绩。更为深远的意义是,“太湖之光”的计算峰值已经达到十亿亿次,为下一个计算高度——“E级计算”揭开了序幕。

  “E级计算”将达到每秒钟百亿亿次的浮点运算,是“太湖之光”的十倍。从目前来看,实现这个目标并不容易,还需跨越能耗、可靠性等多个壁垒。

  但“E级计算”并不遥远,在近日召开的曙光2016技术创新大会(IDIC2016)上,李国杰院士指出,中国希望能在2020年实现E级系统,比美国的预期要早四年,而中科曙光则是实现这一目标的排头兵。

  对于这一目标,曙光公司总裁历军表示,曙光目前在E级计算方面的研究开发已经取得了阶段性的成果,在E级技术、E级应用和E级服务方面都已经做好了准备。

  技术破壁

  历军指出,实现E级计算,还要翻过几道墙,如访存墙、可靠性墙、能耗墙、扩展性墙和E级应用创新。例如,E级计算系统可能会包含六万个处理器,其稳定性以及高速互联的可靠性将带来巨大挑战;按照当前超算系统来推测,E级系统功耗可能将达到40~50兆瓦,对于任何一个客户来说都难以承担。

  所以,要实现E级计算,技术上就要有新的创新突破。

  在IDIC2016上,曙光副总裁沙超群展示了曙光E级系统原型机:采用层次化设计,处理器、加速部件到节点,多个节点形成一个超节点,多个超节点组成一个硅元,由多个硅元形成超级计算机系统,曙光将其称之为“6D-Torus”结构,可以扩展到10万个以上的节点规模,满足E级计算的扩展性。

  除了扩展性,“6D-Torus”硅元结构最大的优点在于局部通信性能特别高。“为了实现6D-Torus,我们设计了一个硅元路由器,在这个路由器可以达到500端口以上、每端口100G的吞吐能力。我们会使用这种硅元路由器完成整个路由的算法,来优化路由算法,保证这个系统的扩展性和稳定性”,沙超群表示。

  在能耗和散热方面,曙光E级系统将采用一种非常“科幻”的散热方法。在去年的ICDC大会上,曙光展示了地球模拟装置,该系统采用了冷板式的冷却模式,把水通过散热片连接到服务器的处理器上进行冷却,实测PUE 达到了1.17,而下一步,曙光的E级超算系统里面会采用进一步的浸没式液冷服务器。

  “我们将采用相变(蒸发)冷却的模式对E级系统进行制冷”,沙超群表示,曙光E级超算整个系统都会浸泡在液体中,通过相变带走热量,然后这些气体会移到一个气体准直当中,通过常温水的冷却变成液体,重新回到服务器里面。“蒸发的潜热是比热的效率的100倍,也就是说这是一种最高效的冷却模式,可以让系统零风扇、零噪音,可以实现整机的PUE小于1.1。”

  另一方面,曙光E级超算采用了弹性的、可定义的计算部件,性能功耗比能够达到每瓦10GFlops以上——在超算Green500榜单中,全球最绿色的超级计算机性能功耗比是6.6GFlops/瓦,也就是说曙光E级系统性能功耗比将会提高两倍。

  同时,得益于自适应超融合的软件系统,曙光E级超算可以重定义计算节点,从而大大拓展了应用领域。“比如说今天有的应用需要更多的加速器,有的应用只需要处理器,有的应用需要均衡的加速器和处理器,我可以通过软件配置把它进行变化”,沙超群表示,这样就可以让超算系统不光能够服务于科学计算,同时可以承担大数据、人工智能、深度学习以及云计算等方面的应用。

  应用先行

  对于中国超算来说,“应用”是一个老生常谈的话题。曾有专家指出,中国现在是一个超算大国,但还称不上是超算强国,因为中国超算硬件水平已经领先世界,但应用水平相比欧美、日本等国家还有差距。

  所以,中国超算要向E级迈进,在突破技术障碍的同时,更要注重E级应用的创新。“如果我们手里没有应用,总有一天超级计算机做不下去”,曙光副总裁邵宗有指出,如果超级计算机技术不能在市场上获得应有的回报,总有一天超级计算机的市场会萎缩,厂商的研发投入就会萎缩,创新就会萎缩。

  邵宗有表示,近五年来曙光一直努力从HPC设备厂商向软件和服务转型,曙光相继提出城市云和数据中国战略,其目的都是在为超级计算机寻找“出路”:“我们不能把超算局限在生命科学、流体空气动力学、仿真、气象气候、环境等传统应用上。近五年来,曙光一直在探寻HPC和云计算、大数据、人工智能等新兴应用的结合点。”

  在中国,近年来HPC的应用领域正在发生变化,HPC正在走出实验室,延伸到更多的应用领域。例如在去年的中国超算TOP100榜单中,有超过一半的系统的应用领域都和云计算、大数据以及互联网服务有关;在全球TOP500榜单中,应用于互联网服务、数据服务的HPC套数也在逐渐增多。

  而对于诞生于中科院的曙光来说,依托科学院的先进计算产业联盟,与众多研究所的应用相结合,将成果产业化,让曙光在E级应用上已经先行一步。

  今年,曙光与中科院电子所联合投资成立“中科星图”,布局空天大数据和卫星遥感大数据;与中科院大气物理所联合投资成立中科三清环保科技(北京)有限公司,布局环保大数据业务;这两家合资公司所从事的“航天星图”和“三清(天蓝、地绿、水清)工程”就是两个典型的E级应用。

  “航天星图”专门处理卫星数据,其数据量非常大,高分卫星一年的数据量就在EB级,所以整个数据量是无法估量的,没有EB超级计算机,根本无法从中发现情报、发现信息、发现决策。“卫星就像人的两只眼睛,超级算计算计就像人的大脑”,邵宗有解释说,E级超级计算机和天上上百颗卫星无缝融合,形成了一只能够看得见、看得懂的“光天巨眼”。

  而“三清工程”是希望通过曙光超级计算机跟环境数据的结合,打造一个天蓝、地绿、水清的世界,治理雾霾是其中一个重要方向。邵宗有表示,霾是大气物理与大气化学结合的产物,成因复杂,所以它的计算更加复杂,如果计算机规模不够、数据存储规模不够,形成霾的各种数据就无从处理,这时候E级计算就派上了用场。

  邵宗有表示,曙光计划未来每年争取找到两个应用,积累十年就可以为E级计算机找到20个重大应用,未来人脑模拟、癌症的精准治疗以及预测犯罪等重大领域都是E级计算能够大展拳脚的方向。

  云为载体

  超级计算机和应用的紧密结合将产生应用成果,而如何将成果服务于消费者则需要一个载体,曙光总裁历军认为,这个载体就是云服务网络。

  历军强调,未来的E级超级计算机的应用不仅来自于传统的科学计算,更来自于云计算、云服务以及大规模数据处理;故而向大数据、云计算的延伸是未来E级计算机的一个最重要的应用环节。

  2015年,曙光提出了“数据中国”战略。曙光高级副总裁聂华表示,“数据中国”的愿景是要构建一个覆盖中国的云数据网络,利用曙光城市云节点、结合行业云的应用,构建城联网,共享中国云计算,共享智慧城市发展机遇,实现曙光云服务向用户更紧密的贴近、实现曙光云服务服务亿万用户的目标。

  如今,曙光已经在全国建立了超过20个城市云中心,并提出了创新的城市云“加盟”模式,以加速城市云的落地和扩大生态圈。此外,曙光还发布了其新一代智慧城市云平台——“云魔方”,助力百万级人口规模的城市快速部署云计算中心,共享智慧城市应用生态。

  “‘云魔方’可一站式构建,曙光提供从技术设施到应有的全套产品、解决方案和服务,随建随用。” 聂华介绍说,“云魔方”集成了曙光液冷服务器技术、3D-Torus网络、云计算管理软件Cloudview等优势技术集群,可模块化快速部署、轻松应对10年扩展,具有总拥有成本低、扩展灵活性能优等特点,是真正的面向未来的创新。

  小结:E级计算的“曙光”

  “E级计算”并不是HPC领域的一个新目标。2010年左右,在HPC计算峰值刚刚突破千万亿次浮点运算的时候,一些超算专家,以及英特尔等上游厂商就提出了“百亿亿次”的愿景。当时,“摩尔定律”依旧在发挥着作用,异构计算大热,“众核”技术刚刚起步。

  六年过去,HPC计算峰值已经跨越了“亿亿次、十亿亿次”两个台阶,不得不说,HPC的发展速度甚至超越了摩尔定律,这不免让人觉得超算的下一个台阶——“百亿亿次”距离我们很近,好像一下就能触摸的到。

  然而,计算峰值的发展并不能永远维持一条平滑的曲线,就如攀登高峰,越往高处,每一步都变得更加困难。如今,硅晶体管时代的摩尔定律即将失效,处理器的工艺、核心数量终究会走到极限,“堆砌”的方式已经不是HPC发展的理想途径,E级计算的实现需要英特尔等上游厂商、曙光等系统提供商、以及应用厂商的共同努力,另辟蹊径,突破重重障碍。

  从另一方面看,困难未必不是一件好事。有困难才有创新,如今,我们已经看到了一些“曙光”,如新型的架构技术、新型的水冷技术以及新的E级应用等等,E级计算的目标已经推动了HPC各项技术的创新和发展。

  如同一个旅途,结果固然重要,沿途的风景则要更加美丽。十亿亿次之后 E级计算现“曙光”_服务器_比特网
http://server.chinabyte.com/290/13831790.shtml

十亿亿次之后 E级计算现“曙光”
发布时间:2016-07-11 13:56:00 来源:比特网 作者:zhanggl
关键字:E级计算 HPC hpc 超算 曙光

  2016年的夏天,最热的不仅有天气,还有超级计算机。

  6月20日,在第47届全球超算TOP500榜单中,中国超算“太湖之光”一骑绝尘,斩获冠军宝座;同时,中国军团以167套超算的成绩首次超过了美国(165套),拿下超级计算机份额冠军。

  在这届榜单中,无论是“点”还是“面”,中国超算都取得了冠军,这是值得中国超算界骄傲的成绩。更为深远的意义是,“太湖之光”的计算峰值已经达到十亿亿次,为下一个计算高度——“E级计算”揭开了序幕。

  “E级计算”将达到每秒钟百亿亿次的浮点运算,是“太湖之光”的十倍。从目前来看,实现这个目标并不容易,还需跨越能耗、可靠性等多个壁垒。

  但“E级计算”并不遥远,在近日召开的曙光2016技术创新大会(IDIC2016)上,李国杰院士指出,中国希望能在2020年实现E级系统,比美国的预期要早四年,而中科曙光则是实现这一目标的排头兵。

  对于这一目标,曙光公司总裁历军表示,曙光目前在E级计算方面的研究开发已经取得了阶段性的成果,在E级技术、E级应用和E级服务方面都已经做好了准备。

  技术破壁

  历军指出,实现E级计算,还要翻过几道墙,如访存墙、可靠性墙、能耗墙、扩展性墙和E级应用创新。例如,E级计算系统可能会包含六万个处理器,其稳定性以及高速互联的可靠性将带来巨大挑战;按照当前超算系统来推测,E级系统功耗可能将达到40~50兆瓦,对于任何一个客户来说都难以承担。

  所以,要实现E级计算,技术上就要有新的创新突破。

  在IDIC2016上,曙光副总裁沙超群展示了曙光E级系统原型机:采用层次化设计,处理器、加速部件到节点,多个节点形成一个超节点,多个超节点组成一个硅元,由多个硅元形成超级计算机系统,曙光将其称之为“6D-Torus”结构,可以扩展到10万个以上的节点规模,满足E级计算的扩展性。

  除了扩展性,“6D-Torus”硅元结构最大的优点在于局部通信性能特别高。“为了实现6D-Torus,我们设计了一个硅元路由器,在这个路由器可以达到500端口以上、每端口100G的吞吐能力。我们会使用这种硅元路由器完成整个路由的算法,来优化路由算法,保证这个系统的扩展性和稳定性”,沙超群表示。

  在能耗和散热方面,曙光E级系统将采用一种非常“科幻”的散热方法。在去年的ICDC大会上,曙光展示了地球模拟装置,该系统采用了冷板式的冷却模式,把水通过散热片连接到服务器的处理器上进行冷却,实测PUE 达到了1.17,而下一步,曙光的E级超算系统里面会采用进一步的浸没式液冷服务器。

  “我们将采用相变(蒸发)冷却的模式对E级系统进行制冷”,沙超群表示,曙光E级超算整个系统都会浸泡在液体中,通过相变带走热量,然后这些气体会移到一个气体准直当中,通过常温水的冷却变成液体,重新回到服务器里面。“蒸发的潜热是比热的效率的100倍,也就是说这是一种最高效的冷却模式,可以让系统零风扇、零噪音,可以实现整机的PUE小于1.1。”

  另一方面,曙光E级超算采用了弹性的、可定义的计算部件,性能功耗比能够达到每瓦10GFlops以上——在超算Green500榜单中,全球最绿色的超级计算机性能功耗比是6.6GFlops/瓦,也就是说曙光E级系统性能功耗比将会提高两倍。

  同时,得益于自适应超融合的软件系统,曙光E级超算可以重定义计算节点,从而大大拓展了应用领域。“比如说今天有的应用需要更多的加速器,有的应用只需要处理器,有的应用需要均衡的加速器和处理器,我可以通过软件配置把它进行变化”,沙超群表示,这样就可以让超算系统不光能够服务于科学计算,同时可以承担大数据、人工智能、深度学习以及云计算等方面的应用。

  应用先行

  对于中国超算来说,“应用”是一个老生常谈的话题。曾有专家指出,中国现在是一个超算大国,但还称不上是超算强国,因为中国超算硬件水平已经领先世界,但应用水平相比欧美、日本等国家还有差距。

  所以,中国超算要向E级迈进,在突破技术障碍的同时,更要注重E级应用的创新。“如果我们手里没有应用,总有一天超级计算机做不下去”,曙光副总裁邵宗有指出,如果超级计算机技术不能在市场上获得应有的回报,总有一天超级计算机的市场会萎缩,厂商的研发投入就会萎缩,创新就会萎缩。

  邵宗有表示,近五年来曙光一直努力从HPC设备厂商向软件和服务转型,曙光相继提出城市云和数据中国战略,其目的都是在为超级计算机寻找“出路”:“我们不能把超算局限在生命科学、流体空气动力学、仿真、气象气候、环境等传统应用上。近五年来,曙光一直在探寻HPC和云计算、大数据、人工智能等新兴应用的结合点。”

  在中国,近年来HPC的应用领域正在发生变化,HPC正在走出实验室,延伸到更多的应用领域。例如在去年的中国超算TOP100榜单中,有超过一半的系统的应用领域都和云计算、大数据以及互联网服务有关;在全球TOP500榜单中,应用于互联网服务、数据服务的HPC套数也在逐渐增多。

  而对于诞生于中科院的曙光来说,依托科学院的先进计算产业联盟,与众多研究所的应用相结合,将成果产业化,让曙光在E级应用上已经先行一步。

  今年,曙光与中科院电子所联合投资成立“中科星图”,布局空天大数据和卫星遥感大数据;与中科院大气物理所联合投资成立中科三清环保科技(北京)有限公司,布局环保大数据业务;这两家合资公司所从事的“航天星图”和“三清(天蓝、地绿、水清)工程”就是两个典型的E级应用。

  “航天星图”专门处理卫星数据,其数据量非常大,高分卫星一年的数据量就在EB级,所以整个数据量是无法估量的,没有EB超级计算机,根本无法从中发现情报、发现信息、发现决策。“卫星就像人的两只眼睛,超级算计算计就像人的大脑”,邵宗有解释说,E级超级计算机和天上上百颗卫星无缝融合,形成了一只能够看得见、看得懂的“光天巨眼”。

  而“三清工程”是希望通过曙光超级计算机跟环境数据的结合,打造一个天蓝、地绿、水清的世界,治理雾霾是其中一个重要方向。邵宗有表示,霾是大气物理与大气化学结合的产物,成因复杂,所以它的计算更加复杂,如果计算机规模不够、数据存储规模不够,形成霾的各种数据就无从处理,这时候E级计算就派上了用场。

  邵宗有表示,曙光计划未来每年争取找到两个应用,积累十年就可以为E级计算机找到20个重大应用,未来人脑模拟、癌症的精准治疗以及预测犯罪等重大领域都是E级计算能够大展拳脚的方向。

  云为载体

  超级计算机和应用的紧密结合将产生应用成果,而如何将成果服务于消费者则需要一个载体,曙光总裁历军认为,这个载体就是云服务网络。

  历军强调,未来的E级超级计算机的应用不仅来自于传统的科学计算,更来自于云计算、云服务以及大规模数据处理;故而向大数据、云计算的延伸是未来E级计算机的一个最重要的应用环节。

  2015年,曙光提出了“数据中国”战略。曙光高级副总裁聂华表示,“数据中国”的愿景是要构建一个覆盖中国的云数据网络,利用曙光城市云节点、结合行业云的应用,构建城联网,共享中国云计算,共享智慧城市发展机遇,实现曙光云服务向用户更紧密的贴近、实现曙光云服务服务亿万用户的目标。

  如今,曙光已经在全国建立了超过20个城市云中心,并提出了创新的城市云“加盟”模式,以加速城市云的落地和扩大生态圈。此外,曙光还发布了其新一代智慧城市云平台——“云魔方”,助力百万级人口规模的城市快速部署云计算中心,共享智慧城市应用生态。

  “‘云魔方’可一站式构建,曙光提供从技术设施到应有的全套产品、解决方案和服务,随建随用。” 聂华介绍说,“云魔方”集成了曙光液冷服务器技术、3D-Torus网络、云计算管理软件Cloudview等优势技术集群,可模块化快速部署、轻松应对10年扩展,具有总拥有成本低、扩展灵活性能优等特点,是真正的面向未来的创新。

  小结:E级计算的“曙光”

  “E级计算”并不是HPC领域的一个新目标。2010年左右,在HPC计算峰值刚刚突破千万亿次浮点运算的时候,一些超算专家,以及英特尔等上游厂商就提出了“百亿亿次”的愿景。当时,“摩尔定律”依旧在发挥着作用,异构计算大热,“众核”技术刚刚起步。

  六年过去,HPC计算峰值已经跨越了“亿亿次、十亿亿次”两个台阶,不得不说,HPC的发展速度甚至超越了摩尔定律,这不免让人觉得超算的下一个台阶——“百亿亿次”距离我们很近,好像一下就能触摸的到。

  然而,计算峰值的发展并不能永远维持一条平滑的曲线,就如攀登高峰,越往高处,每一步都变得更加困难。如今,硅晶体管时代的摩尔定律即将失效,处理器的工艺、核心数量终究会走到极限,“堆砌”的方式已经不是HPC发展的理想途径,E级计算的实现需要英特尔等上游厂商、曙光等系统提供商、以及应用厂商的共同努力,另辟蹊径,突破重重障碍。

  从另一方面看,困难未必不是一件好事。有困难才有创新,如今,我们已经看到了一些“曙光”,如新型的架构技术、新型的水冷技术以及新的E级应用等等,E级计算的目标已经推动了HPC各项技术的创新和发展。

  如同一个旅途,结果固然重要,沿途的风景则要更加美丽。
先把曙光7000发布了再说