天河2A的一些消息(Matrix2000协处理器）

来源：百度文库编辑：超级军网时间：2024/04/30 03:34:24

Matrix2k替换xeon phi是最大亮点，国防科大出品

在ISC 2015大会上发布的第45期全球超级计算机TOP500排名中，由中国国防科学技术大学（简称国防科大）研制，部署于中国广州超算中心的天河二号再次荣登榜首，连续第5次成为TOP500冠军。但我相信，任何一个关心中国超算事业的人，都在高兴之余有着隐隐的一丝不安，那就是始于今年4月的“中美超算风波”，总让感觉天河的未来布满阴云。

第45期 TOP500榜单，前10名中只有一台新系统（第7名），其余都是老面孔，天河二号第5次占据冠军位置

在4月底时，我曾写过一篇专文《走出中国超算的“凌波微步”》，详细介绍了这场风波的来龙去脉，以及它所产生的影响，并分析了中国应有的宏观对策。简单来说，由于美国点名对天河二号的限售，阻碍了天河二号今年既定的100PFLOPS（1P=千万亿次浮点运算，本文所指的浮点性能均指双精度）的升级计划，并可能长期影响中国超大规模超算系统的建设，这其中的关键就是英特尔公司的Xeon Phi加速器（或与之类同的产品），它对于天河二号的连续5次登顶有着决定性的意义。

我们先看天河二号的配置：16000个计算节点，32000颗英特尔至强（Xeon） E5-2692V2 2.2GHz/12核心CPU，48000颗Xeon Phi 31S1P加速器，其运算峰值速度约为55PFLOPS。这其中天河二号所采用的Xeon Phi 31S1P拥有57个核心，TDP功耗300W，单个Xeon Phi 31S1P的浮点运算性能约1TFLOPS（1T=万亿次）。48000颗Xeon Phi 31S1P就贡献出了48PFLOPS的浮点性能，对于天河二号55P的峰值性能来说，重要性不言而喻。

美国银售的重点对象——英特尔Xeon Phi计算加速器，今年将推出第二代Knights Landing

在今年，英特尔将推出代号为Knight Landing的第二代Xeon Phi，浮点性能达到3TFLOPS。假如全部替换掉天河二号现有的Xeon Phi，那么天河二号的性能就将超过150PFLOPS（加上32000颗E5的性能），绝对仍然是2015年，甚至是2016年的TOP500冠军。所以说，针对天河二号的Xeon Phi限售，的确影响到了天河后续的升级计划。

在那段风波期间，除了更多的中国超算专家表示要进一步自力更生，不惧封锁外，具体的产品与技术措施其实并不清晰。在2015年4月19日，在由中国计算机学会青年计算机科技论坛(CCF YOCSEF)在京举行 “芯片限售对我国超算的影响”特别论坛上，天河二号系统主任设计师、国防科大教授卢宇彤女士曾非常自信的强调，“按照原定计划，天河二号拟在今年将计算能力从55PFLOPS升级到100PFLOPS。尽管此次美方对天河二号升级所需Intel Xeon处理器的限售，对原定升级计划有一定影响，但我们早有准备，绝不会影响天河二号从55PFLOPS升级到100PFLOPS的既定目标。”

然而，很多人并不知道，国防科大到底会采用什么方法来实100P的目标，心里多少没底，甚至有人怀疑国防科大也只是在给大家打气，并没有实际的解决方案。但是，在ISC 2015的第二天——中美超算风波3个多月后，卢宇彤亲自给出了答案——这就是天河二号A，并明确表示将在2016年正式上线。

天河二号系统主任设计师、国防科大教授卢宇彤在ISC 2015大会上以英文做主题讲演，详细介绍了中国主要的超算应用在天河二号上的实践，并第一次在国外会议上详细介绍了天河二号A的概况

在讲演的开头部分，卢宇彤介绍了天河系统的发展历史与未来的规划，也表明了100P系统的计划，但没有透露具体的系统名称

卢宇彤的主题讲演是在ISC 2015第二天的下午5点15分开始，其讲演的主题是《Applications Leveraging Supercomputing Systems》，我起初以为就是以天河二号的应用视角来看超算系统的应用与价值，并没有想到会介绍到天河二号A，给了我一个大大的惊喜。

天河二号A 100P性能达成！天河二号A的主要技术指标，与历代天河系统的对比，其运算峰值将达到100P，能实现的关键就在于“中国加速器”，请注意功耗与天河二号几乎相同

天河二号A的计算节点数量将从天河二号的16000个，增加到约18000个，处理器仍然没变，还是至强E5-2692 V2，而最引人关注的则是用“China Accelerator”（中国加速器）替代了Xeon Phi。

从上文可知，通用处理器在未来的HPC系统里的权重会越来越低，主要工作将逐渐向控制层面转移，计算任务则主要由加速器完成。也因此，要想实现100P的目标，没有类似于Xeon Phi这类产品是不可能实现的，所以关键点就在于China Accelerator是用什么方法来实现类似于Xeon Phi与NVIDIA GPGPU（同样在美国限售范围内）的加速效果。国防科大给出的方案并不算有多“高大上”，但对于中国自主研发来说足够亮眼，那就是通用计算数字信号处理器（GPDSP），并且有了明确的型号——Matrix2000。

Matrix2000的主要设计规格，预计为16核设计，可达到2.4T的浮点性能，虽然还比不上Knight Landing的3T，但对于白手起家的中国来说，已经相当不易，而且功耗比现有的Xeon Phi少了100W

从Matrix2000的设计规格上看，至少在理论上还是相当不错的，对于中国自主研发的加速器已经非常不容易了。如果还是按照天河二号计算节点的配置（2CPU+3加速器），我们就按18000个节点来计算，将有54000颗Matrix2000加速器，理论运算峰值可达130P（54000x2.4T），加上36000颗E5-2692 V2，总峰值可达137.6P，所以100P的目标也许还有些保守，100P是最大浮点性能（天河二号是33.86P）也说不准。

Matrix2000的内部设计，采用了标量与向量单元+超长指令字（VLIW）的架构

针对全新的Matrix2000所准备的软件堆栈，这也是Matrix2000能否被有效利用进而被应用开发者所接纳的关键，包括GPDPS驱动程序、操作系统、编译器、数学库等，这的确是项工程量巨大的工作

据国防科大的相关研发人员介绍，有关DSP的浮点计算应用，一直也是国防科大的研发重点，它与超算研究可谓是并行发展。也正是因为有了这样的积累，国防科大才能比较从容的面对美国的限售。但该研发人员也表示，美国的限售来得这么快还是有点出乎预料，而GPDSP的一个推广难点也就在于，在HPC应用领域几乎是从零起步，就像当初NVIDIA刚推出GPGPU时一样，直到CUDA的发布才迅速改善了GPGPU的应用生态环境。国防科大的GPDSP显然也要经历类似的过程，但国防科大在业界的知名度以及DSP在HPC里的应用平滑过渡性，较当初NVIDIA在图像处理领域以及GPU在浮点运算能力方面的名声，还有很大差距，因此其中的困难可想而知。

卢宇彤表示，目前Matrix2000正在进行验证。这意味着至少在国防科大的层面，已经为正式投入使用做着最后的准备，但具体时间还不能确定，所以只给出了2016年这一较为笼统的时间点。相关研发人员也透露，除了应用平台进一步配套完善之外，GPDSP芯片本身的生产与物理设备的调优还有很多工作要做。而且受限于当前中国半导体生产工艺水平，现在还是采用40nm工艺的GPDSP，也在很大程度上制约了Matrix2000的能力，“否则可以做到更多的核心，获得更多的性能”，相关研发人员感慨到。

当然，天河二号A在技术上的突破不仅仅是Matrix2000，卢宇彤也没有把这次天河二号A的亮相等同于Matrix2000的亮相，接下来她又介绍了天河二号A在互联与I/O方面的设计。

除了最关键的Matrix2000之外，天河二号A在其他方面也有着明显的升级，在互联层，采用了自主研发的TH-Express 2+架构（天河二号是TH-Express 2），从联网芯片至网络路由芯片均有较大提升，并进一步实现了自适应（Adaptive）互联架构

所谓的自适应互联架构，就从多个层面入手，通过自应用平台层至底层形成的智能互动，保证网络效率持续而稳定，比如自动规避质量不佳或拥挤的链路，进一步杜绝重复的通信，并在节点与网络故障时对路由重新配置等等

在存储层面，天河二号A仍然是以自主研发的H2FS文件系统(Hybrid Hierarchy File System)为核心，并采用大量闪存作为I/O突发缓冲，夹在节点本地存储与大容量的全局存储之间，实现了1TB/s的突发传输，100GB/s的持续传输，每秒100万次的元数据操作

最后，卢宇彤给出了天河系统未来的应用方向与愿景，其实天河二号就已经不是单纯的HPC系统，在云、Hadoop、Spark等方面均有尝试或实际的应用，而未来则更是如此，国防科大也将按这样的思路来构建未来的天河二号A，让它从出生之日就是一个强大的多面手

卢宇彤对天河二号A的介绍，引发了会场的热烈反响，在提问环节，大多数的问题都集中在了“中国加速器”身上，显然这对于国外的HPC人士来说，也是非常的“意外”。但是，除了Matrix2000外，对于互联与I/O的完整阐述，也让人感觉天河二号A的确有备而来，明年的正式发布也是相当的靠谱（毕竟是军人出身嘛），剩下的就看它是出现在第47期还是第48期的TOP500榜单上了。

当然，中国研制超大规模HPC系统的目的肯定不仅仅是为了跑个LINPACK争个名次，否则也不会引起美国的重视并引发限售。天河二号A的设计在某种角度上说，真正打开了中国自主HPC发展的向上之路，因为加速器很重要，也因为加速器被国外限售，所以天河二号A在这种环境下还能很快达到100P的性能，也许连美国相关人士也没有想到，但这绝对是件好事！

虽然我们都知道Matrix2000在未来很一长段时间里，将会面临严峻的应用生态的挑战，但是我们也非常清楚，当初的两弹一星的诞生历程又是何等艰苦，可换来的国家意义与战略价值则无法估量。中国HPC领域的很多专家其实都对美国限售保持乐观态度，因为中国的机会来了——只要是西方发达国家限制的产业，中国自主研发的实力与产品也就越强，也就越来越不需要外国的东西，反而确保了自身生态链的完整与环境安全，可能自主之路短期很痛苦，但长远来看肯定利远大于弊。

对于这些专家们的观点，我深表赞同，以HPC对于国家的国防与经济战略意义来说，在很大程度上，计算加速器在当今的作用已经不亚于当初的两弹一星。而天河二号A就是一个很好的开始，也许GPDSP的路很难走，也许它在实际应用中还有很多问题，但毕竟我们走出了第一步，没有这一步，后面的所有可能也就无从谈起，如果走得好走得稳，你敢说就不会出现一个与GPGPU和Xeon Phi平起平坐的GPDSP生态吗？

最后，我衷心祝愿天河二号A的研发最终获得圆满成

功，早日上线，让美国的限售彻底见鬼去吧！

图片自己去看
http://server.zdnet.com.cn/server/2015/0715/3057141.shtml

Matrix2k替换xeon phi是最大亮点，国防科大出品

在ISC 2015大会上发布的第45期全球超级计算机TOP500排名中，由中国国防科学技术大学（简称国防科大）研制，部署于中国广州超算中心的天河二号再次荣登榜首，连续第5次成为TOP500冠军。但我相信，任何一个关心中国超算事业的人，都在高兴之余有着隐隐的一丝不安，那就是始于今年4月的“中美超算风波”，总让感觉天河的未来布满阴云。

第45期 TOP500榜单，前10名中只有一台新系统（第7名），其余都是老面孔，天河二号第5次占据冠军位置

在4月底时，我曾写过一篇专文《走出中国超算的“凌波微步”》，详细介绍了这场风波的来龙去脉，以及它所产生的影响，并分析了中国应有的宏观对策。简单来说，由于美国点名对天河二号的限售，阻碍了天河二号今年既定的100PFLOPS（1P=千万亿次浮点运算，本文所指的浮点性能均指双精度）的升级计划，并可能长期影响中国超大规模超算系统的建设，这其中的关键就是英特尔公司的Xeon Phi加速器（或与之类同的产品），它对于天河二号的连续5次登顶有着决定性的意义。

我们先看天河二号的配置：16000个计算节点，32000颗英特尔至强（Xeon） E5-2692V2 2.2GHz/12核心CPU，48000颗Xeon Phi 31S1P加速器，其运算峰值速度约为55PFLOPS。这其中天河二号所采用的Xeon Phi 31S1P拥有57个核心，TDP功耗300W，单个Xeon Phi 31S1P的浮点运算性能约1TFLOPS（1T=万亿次）。48000颗Xeon Phi 31S1P就贡献出了48PFLOPS的浮点性能，对于天河二号55P的峰值性能来说，重要性不言而喻。

美国银售的重点对象——英特尔Xeon Phi计算加速器，今年将推出第二代Knights Landing

在今年，英特尔将推出代号为Knight Landing的第二代Xeon Phi，浮点性能达到3TFLOPS。假如全部替换掉天河二号现有的Xeon Phi，那么天河二号的性能就将超过150PFLOPS（加上32000颗E5的性能），绝对仍然是2015年，甚至是2016年的TOP500冠军。所以说，针对天河二号的Xeon Phi限售，的确影响到了天河后续的升级计划。

在那段风波期间，除了更多的中国超算专家表示要进一步自力更生，不惧封锁外，具体的产品与技术措施其实并不清晰。在2015年4月19日，在由中国计算机学会青年计算机科技论坛(CCF YOCSEF)在京举行 “芯片限售对我国超算的影响”特别论坛上，天河二号系统主任设计师、国防科大教授卢宇彤女士曾非常自信的强调，“按照原定计划，天河二号拟在今年将计算能力从55PFLOPS升级到100PFLOPS。尽管此次美方对天河二号升级所需Intel Xeon处理器的限售，对原定升级计划有一定影响，但我们早有准备，绝不会影响天河二号从55PFLOPS升级到100PFLOPS的既定目标。”

然而，很多人并不知道，国防科大到底会采用什么方法来实100P的目标，心里多少没底，甚至有人怀疑国防科大也只是在给大家打气，并没有实际的解决方案。但是，在ISC 2015的第二天——中美超算风波3个多月后，卢宇彤亲自给出了答案——这就是天河二号A，并明确表示将在2016年正式上线。

天河二号系统主任设计师、国防科大教授卢宇彤在ISC 2015大会上以英文做主题讲演，详细介绍了中国主要的超算应用在天河二号上的实践，并第一次在国外会议上详细介绍了天河二号A的概况

在讲演的开头部分，卢宇彤介绍了天河系统的发展历史与未来的规划，也表明了100P系统的计划，但没有透露具体的系统名称

卢宇彤的主题讲演是在ISC 2015第二天的下午5点15分开始，其讲演的主题是《Applications Leveraging Supercomputing Systems》，我起初以为就是以天河二号的应用视角来看超算系统的应用与价值，并没有想到会介绍到天河二号A，给了我一个大大的惊喜。

天河二号A 100P性能达成！天河二号A的主要技术指标，与历代天河系统的对比，其运算峰值将达到100P，能实现的关键就在于“中国加速器”，请注意功耗与天河二号几乎相同

天河二号A的计算节点数量将从天河二号的16000个，增加到约18000个，处理器仍然没变，还是至强E5-2692 V2，而最引人关注的则是用“China Accelerator”（中国加速器）替代了Xeon Phi。

从上文可知，通用处理器在未来的HPC系统里的权重会越来越低，主要工作将逐渐向控制层面转移，计算任务则主要由加速器完成。也因此，要想实现100P的目标，没有类似于Xeon Phi这类产品是不可能实现的，所以关键点就在于China Accelerator是用什么方法来实现类似于Xeon Phi与NVIDIA GPGPU（同样在美国限售范围内）的加速效果。国防科大给出的方案并不算有多“高大上”，但对于中国自主研发来说足够亮眼，那就是通用计算数字信号处理器（GPDSP），并且有了明确的型号——Matrix2000。

Matrix2000的主要设计规格，预计为16核设计，可达到2.4T的浮点性能，虽然还比不上Knight Landing的3T，但对于白手起家的中国来说，已经相当不易，而且功耗比现有的Xeon Phi少了100W

从Matrix2000的设计规格上看，至少在理论上还是相当不错的，对于中国自主研发的加速器已经非常不容易了。如果还是按照天河二号计算节点的配置（2CPU+3加速器），我们就按18000个节点来计算，将有54000颗Matrix2000加速器，理论运算峰值可达130P（54000x2.4T），加上36000颗E5-2692 V2，总峰值可达137.6P，所以100P的目标也许还有些保守，100P是最大浮点性能（天河二号是33.86P）也说不准。

Matrix2000的内部设计，采用了标量与向量单元+超长指令字（VLIW）的架构

针对全新的Matrix2000所准备的软件堆栈，这也是Matrix2000能否被有效利用进而被应用开发者所接纳的关键，包括GPDPS驱动程序、操作系统、编译器、数学库等，这的确是项工程量巨大的工作

据国防科大的相关研发人员介绍，有关DSP的浮点计算应用，一直也是国防科大的研发重点，它与超算研究可谓是并行发展。也正是因为有了这样的积累，国防科大才能比较从容的面对美国的限售。但该研发人员也表示，美国的限售来得这么快还是有点出乎预料，而GPDSP的一个推广难点也就在于，在HPC应用领域几乎是从零起步，就像当初NVIDIA刚推出GPGPU时一样，直到CUDA的发布才迅速改善了GPGPU的应用生态环境。国防科大的GPDSP显然也要经历类似的过程，但国防科大在业界的知名度以及DSP在HPC里的应用平滑过渡性，较当初NVIDIA在图像处理领域以及GPU在浮点运算能力方面的名声，还有很大差距，因此其中的困难可想而知。

卢宇彤表示，目前Matrix2000正在进行验证。这意味着至少在国防科大的层面，已经为正式投入使用做着最后的准备，但具体时间还不能确定，所以只给出了2016年这一较为笼统的时间点。相关研发人员也透露，除了应用平台进一步配套完善之外，GPDSP芯片本身的生产与物理设备的调优还有很多工作要做。而且受限于当前中国半导体生产工艺水平，现在还是采用40nm工艺的GPDSP，也在很大程度上制约了Matrix2000的能力，“否则可以做到更多的核心，获得更多的性能”，相关研发人员感慨到。

当然，天河二号A在技术上的突破不仅仅是Matrix2000，卢宇彤也没有把这次天河二号A的亮相等同于Matrix2000的亮相，接下来她又介绍了天河二号A在互联与I/O方面的设计。

除了最关键的Matrix2000之外，天河二号A在其他方面也有着明显的升级，在互联层，采用了自主研发的TH-Express 2+架构（天河二号是TH-Express 2），从联网芯片至网络路由芯片均有较大提升，并进一步实现了自适应（Adaptive）互联架构

所谓的自适应互联架构，就从多个层面入手，通过自应用平台层至底层形成的智能互动，保证网络效率持续而稳定，比如自动规避质量不佳或拥挤的链路，进一步杜绝重复的通信，并在节点与网络故障时对路由重新配置等等

在存储层面，天河二号A仍然是以自主研发的H2FS文件系统(Hybrid Hierarchy File System)为核心，并采用大量闪存作为I/O突发缓冲，夹在节点本地存储与大容量的全局存储之间，实现了1TB/s的突发传输，100GB/s的持续传输，每秒100万次的元数据操作

最后，卢宇彤给出了天河系统未来的应用方向与愿景，其实天河二号就已经不是单纯的HPC系统，在云、Hadoop、Spark等方面均有尝试或实际的应用，而未来则更是如此，国防科大也将按这样的思路来构建未来的天河二号A，让它从出生之日就是一个强大的多面手

卢宇彤对天河二号A的介绍，引发了会场的热烈反响，在提问环节，大多数的问题都集中在了“中国加速器”身上，显然这对于国外的HPC人士来说，也是非常的“意外”。但是，除了Matrix2000外，对于互联与I/O的完整阐述，也让人感觉天河二号A的确有备而来，明年的正式发布也是相当的靠谱（毕竟是军人出身嘛），剩下的就看它是出现在第47期还是第48期的TOP500榜单上了。

当然，中国研制超大规模HPC系统的目的肯定不仅仅是为了跑个LINPACK争个名次，否则也不会引起美国的重视并引发限售。天河二号A的设计在某种角度上说，真正打开了中国自主HPC发展的向上之路，因为加速器很重要，也因为加速器被国外限售，所以天河二号A在这种环境下还能很快达到100P的性能，也许连美国相关人士也没有想到，但这绝对是件好事！

虽然我们都知道Matrix2000在未来很一长段时间里，将会面临严峻的应用生态的挑战，但是我们也非常清楚，当初的两弹一星的诞生历程又是何等艰苦，可换来的国家意义与战略价值则无法估量。中国HPC领域的很多专家其实都对美国限售保持乐观态度，因为中国的机会来了——只要是西方发达国家限制的产业，中国自主研发的实力与产品也就越强，也就越来越不需要外国的东西，反而确保了自身生态链的完整与环境安全，可能自主之路短期很痛苦，但长远来看肯定利远大于弊。

对于这些专家们的观点，我深表赞同，以HPC对于国家的国防与经济战略意义来说，在很大程度上，计算加速器在当今的作用已经不亚于当初的两弹一星。而天河二号A就是一个很好的开始，也许GPDSP的路很难走，也许它在实际应用中还有很多问题，但毕竟我们走出了第一步，没有这一步，后面的所有可能也就无从谈起，如果走得好走得稳，你敢说就不会出现一个与GPGPU和Xeon Phi平起平坐的GPDSP生态吗？

最后，我衷心祝愿天河二号A的研发最终获得圆满成

功，早日上线，让美国的限售彻底见鬼去吧！

图片自己去看
http://server.zdnet.com.cn/server/2015/0715/3057141.shtml

NRC 24port 5.3TB

NIC 14GB/8lan
端口略少，不过吞吐高到有点吓人了

禁售后，预计从今年年底起到至少2019年，中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidia的方案毕竟还是差距较大。

榜单倒是次要了

重点还是接下来技能树怎么攀

国防科大都在搞众核？碉堡了。
干脆把调度CPU换龙芯得了，彻底干掉鹰酱。

国防科大都在搞众核？碉堡了。
干脆把调度CPU换龙芯得了，彻底干掉鹰酱。
想想也不可能，Xeon E5在这里的角色是提供大量PCIe通道和够高的内存带宽，龙芯起码还得发展两年才有这水平。

deam 发表于 2015-7-15 14:59
想想也不可能，Xeon E5在这里的角色是提供大量PCIe通道和够高的内存带宽，龙芯起码还得发展两年才有这水 ...
两年已经是非常乐观的预期了啊，天河2A粗略估计明年出来，2017年也很正常。

Top 500就是个浮云，既然老美不让我们拿第一，那我们也没必要硬争这个虚名，扎扎实实提高自身的能力最重要。
这就是限售的意义所在。

希望能挺过难关来自: iPhone客户端

壮东风发表于 2015-7-15 14:50
国防科大都在搞众核？碉堡了。
干脆把调度CPU换龙芯得了，彻底干掉鹰酱。

一共有192个CPU+DSP核心

壮东风发表于 2015-7-15 14:50
国防科大都在搞众核？碉堡了。
干脆把调度CPU换龙芯得了，彻底干掉鹰酱。

一共有192个CPU+DSP核心

EKW 发表于 2015-7-15 15:57
一共有192个CPU+DSP核心
能否解释一下，不是说Matrix 2000为16核心么？

意思是，硬件问题不大；
软件生态环境就恶劣太多。

自建生态系统，工作量太大，不乐观。

还是应该开发某种兼容系统。

壮东风发表于 2015-7-15 16:12
能否解释一下，不是说Matrix 2000为16核心么？
这张图片里有

deam 发表于 2015-7-15 14:34
禁售后，预计从今年年底起到至少2019年，中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidi ...
不是第一也是前3；中国有3台100P超算
天2；曙光7000；江南所100P

SW-5众核不错，与NVIDIA K20相当；

GPDSP，这个和GPGPU那个更通用？

壮东风发表于 2015-7-15 14:50
国防科大都在搞众核？碉堡了。
干脆把调度CPU换龙芯得了，彻底干掉鹰酱。
GPDSP？这个是不是太不通用了？和GPGPU相比如何呢？

EKW 发表于 2015-7-15 15:57
一共有192个CPU+DSP核心
你是不是说反了，16*2*6的应该是DSP核心吧，因为旁边的两个上边有IO字样，可能应该是CPU核心，再说192个cpu核心那还需要什么DPS

国防科大都在搞众核？碉堡了。
干脆把调度CPU换龙芯得了，彻底干掉鹰酱。
你以为人家当兵的是那么好骗的吗？

mips64el 发表于 2015-7-15 17:13
GPDSP？这个是不是太不通用了？和GPGPU相比如何呢？
我觉得GPU事实上就是DSP。

空气蛋糕发表于 2015-7-15 17:43
你以为人家当兵的是那么好骗的吗？
你什么意思，飞腾已经转向ARM了，申威也变成众核了，剩下自主的通用CPU只有龙芯，拿过来作为调度CPU，理论上没什么不妥吧？
当然这只是我的一个愿景，天河2A是升级版，不可能对系统架构做根本性改变。

你什么意思，飞腾已经转向ARM了，申威也变成众核了，剩下自主的通用CPU只有龙芯，拿过来作为调度CPU，理 ...
Sparc还在做吧!arm还是比不了sparc的

mips64el 发表于 2015-7-15 21:36
Sparc还在做吧!arm还是比不了sparc的
前段时间的FT-1500A不就是ARM芯片么？

前段时间的FT-1500A不就是ARM芯片么？
是的! 但是这能说明国防科大转arm了么？FT1500A用的明显是arm公版，不是自主微架构。至于sparc系列是否还在继续还没有消息。我觉得sparc还在继续，就看2016年的天河2A用什么调度CPU了!

Sparc还在做吧!arm还是比不了sparc的
ARM早超过sparc了吧？

用奔四烧水发表于 2015-7-15 22:12
ARM早超过sparc了吧？

指标？

嵌入平台就别和mainframe比了

完全不是一个概念的东西

只看理论运算能力，或者跑mapreduce之流，大概同功耗ARM秒SPARC

然则真跑起DB，AS之类mainframe当家应用
ARM攒满一个机架也是被SPARC完灭

ARM早超过sparc了吧？
差远了，富士通/甲骨文还在不断发展sparc，而arm64才刚刚开始；arm32注定只能嵌入式

是的! 但是这能说明国防科大转arm了么？FT1500A用的明显是arm公版，不是自主微架构。至于sparc系列是否还 ...
你没看主楼新闻吗？天河2A的CPU部分完全没变。

我还是比较担心互联这块

互联芯片的spec看着不放心

这块上不去的话性能水分太大了

你没看主楼新闻吗？天河2A的CPU部分完全没变。
intel的cpu没变，但是sparc的（FT1500）每提到

现在是团队已经有了，初级产品也有了，需要的是持续的高投入

国防科大挺牛嘛。。。。“Matrix2000的主要设计规格，预计为16核设计，可达到2.4T的浮点性能，虽然还比不上Knight Landing的3T，但对于白手起家的中国来说，已经相当不易，而且功耗比现有的Xeon Phi少了100W”
2.4T浮点。。。。秒杀江南所的SW5。。。。SW5众核才1T浮点。。。。。
妥妥的国内第一啊。。。。江南要努力了。。。

国防科大挺牛嘛。。。。“Matrix2000的主要设计规格，预计为16核设计，可达到2.4T的浮点性能，虽然还比不上 ...
但是，江南所的SW-5可是CPU啊，类似于intel-phi，因为这两个众核都可以独立运行（phi从第二代开始）；这个gpdsp和gpgpu可仅仅是加速器，无法脱离cpu独立运行

oldwatch 发表于 2015-7-15 14:31
NRC 24port 5.3TB

NIC 14GB/8lan
大B 小b 傻傻分不清？
ppt上可是：
NRC 5.376Tb/s
NIC 14Gb/8lan

Hold住！加油！！！

你们国防科大的实力真是逆天了，居然藏了自研异构加速器 + 自研软件栈这么一个杀招！还在ISC上当着美国人面亮出来！[good] 标量+VLIW是完全不同于市面上其他设计的新路线，这回不会再有剽窃抄袭之类的口水了，真心祝愿一战功成！

http://weibo.com/1686203097/Crco ... t#_rnd1437085101031
软件编程问题解决了？

壮东风发表于 2015-7-15 21:42
前段时间的FT-1500A不就是ARM芯片么？
没有啊，没说变arm。我记得有帖子详细说这个事。

deam 发表于 2015-7-15 14:59
想想也不可能，Xeon E5在这里的角色是提供大量PCIe通道和够高的内存带宽，龙芯起码还得发展两年才有这水 ...
你什么时候对龙芯这么乐观了，已经只有两年的差距了么

马利奥发表于 2015-7-17 12:28
你什么时候对龙芯这么乐观了，已经只有两年的差距了么
差不多吧。

deam 发表于 2015-7-15 14:34
禁售后，预计从今年年底起到至少2019年，中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidi ...

16年要推出 “Summit”、“Sierra”了吗。够快的，以为Power9、Volta、NVlink要2年左右才能出现。基于Volta的Tesla基本被禁运了，那NVLink呢？

deam 发表于 2015-7-15 14:34
禁售后，预计从今年年底起到至少2019年，中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidi ...

16年要推出 “Summit”、“Sierra”了吗。够快的，以为Power9、Volta、NVlink要2年左右才能出现。基于Volta的Tesla基本被禁运了，那NVLink呢？

oldwatch 发表于 2015-7-16 08:03
我还是比较担心互联这块

互联芯片的spec看着不放心
Intel说Omni-Path Fabric比InfiniBand性能可提升最多23-73％，你有研究吗？

天河2A的一些消息(Matrix2000协处理器）天河2A的GPDSP 听到点天河2号的消息天河系统的一些简介一些过时了的消息关于PL12的一些消息９５改的一些消息关于瓦格良的一些消息新浪的一些消息，仅供参考 6A的一些评论一些消息听到的关于城管的一些消息