天河2A的一些消息(Matrix2000协处理器)

来源:百度文库 编辑:超级军网 时间:2024/04/30 03:34:24


Matrix2k替换xeon phi是最大亮点,国防科大出品


在ISC 2015大会上发布的第45期全球超级计算机TOP500排名中,由中国国防科学技术大学(简称国防科大)研制,部署于中国广州超算中心的天河二号再次荣登榜首,连续第5次成为TOP500冠军。但我相信,任何一个关心中国超算事业的人,都在高兴之余有着隐隐的一丝不安,那就是始于今年4月的“中美超算风波”,总让感觉天河的未来布满阴云。

第45期 TOP500榜单,前10名中只有一台新系统(第7名),其余都是老面孔,天河二号第5次占据冠军位置

在4月底时,我曾写过一篇专文《走出中国超算的“凌波微步”》,详细介绍了这场风波的来龙去脉,以及它所产生的影响,并分析了中国应有的宏观对策。简单来说,由于美国点名对天河二号的限售,阻碍了天河二号今年既定的100PFLOPS(1P=千万亿次浮点运算,本文所指的浮点性能均指双精度)的升级计划,并可能长期影响中国超大规模超算系统的建设,这其中的关键就是英特尔公司的Xeon Phi加速器(或与之类同的产品),它对于天河二号的连续5次登顶有着决定性的意义。

我们先看天河二号的配置:16000个计算节点,32000颗英特尔至强(Xeon) E5-2692V2 2.2GHz/12核心CPU,48000颗Xeon Phi 31S1P加速器,其运算峰值速度约为55PFLOPS。这其中天河二号所采用的Xeon Phi 31S1P拥有57个核心,TDP功耗300W,单个Xeon Phi 31S1P的浮点运算性能约1TFLOPS(1T=万亿次)。48000颗Xeon Phi 31S1P就贡献出了48PFLOPS的浮点性能,对于天河二号55P的峰值性能来说,重要性不言而喻。

美国银售的重点对象——英特尔Xeon Phi计算加速器,今年将推出第二代Knights Landing

在今年,英特尔将推出代号为Knight Landing的第二代Xeon Phi,浮点性能达到3TFLOPS。假如全部替换掉天河二号现有的Xeon Phi,那么天河二号的性能就将超过150PFLOPS(加上32000颗E5的性能),绝对仍然是2015年,甚至是2016年的TOP500冠军。所以说,针对天河二号的Xeon Phi限售,的确影响到了天河后续的升级计划。

在那段风波期间,除了更多的中国超算专家表示要进一步自力更生,不惧封锁外,具体的产品与技术措施其实并不清晰。在2015年4月19日,在由中国计算机学会青年计算机科技论坛(CCF YOCSEF)在京举行 “芯片限售对我国超算的影响”特别论坛上,天河二号系统主任设计师、国防科大教授卢宇彤女士曾非常自信的强调,“按照原定计划,天河二号拟在今年将计算能力从55PFLOPS升级到100PFLOPS。尽管此次美方对天河二号升级所需Intel Xeon处理器的限售,对原定升级计划有一定影响,但我们早有准备,绝不会影响天河二号从55PFLOPS升级到100PFLOPS的既定目标 。”

然而,很多人并不知道,国防科大到底会采用什么方法来实100P的目标,心里多少没底,甚至有人怀疑国防科大也只是在给大家打气,并没有实际的解决方案。但是,在ISC 2015的第二天——中美超算风波3个多月后,卢宇彤亲自给出了答案——这就是天河二号A,并明确表示将在2016年正式上线。

天河二号系统主任设计师、国防科大教授卢宇彤在ISC 2015大会上以英文做主题讲演,详细介绍了中国主要的超算应用在天河二号上的实践,并第一次在国外会议上详细介绍了天河二号A的概况

在讲演的开头部分,卢宇彤介绍了天河系统的发展历史与未来的规划,也表明了100P系统的计划,但没有透露具体的系统名称

卢宇彤的主题讲演是在ISC 2015第二天的下午5点15分开始,其讲演的主题是《Applications Leveraging Supercomputing Systems》,我起初以为就是以天河二号的应用视角来看超算系统的应用与价值,并没有想到会介绍到天河二号A,给了我一个大大的惊喜。

天河二号A 100P性能达成!天河二号A的主要技术指标,与历代天河系统的对比,其运算峰值将达到100P,能实现的关键就在于“中国加速器”,请注意功耗与天河二号几乎相同

天河二号A的计算节点数量将从天河二号的16000个,增加到约18000个,处理器仍然没变,还是至强E5-2692 V2,而最引人关注的则是用“China Accelerator”(中国加速器)替代了Xeon Phi。

从上文可知,通用处理器在未来的HPC系统里的权重会越来越低,主要工作将逐渐向控制层面转移,计算任务则主要由加速器完成。也因此,要想实现100P的目标,没有类似于Xeon Phi这类产品是不可能实现的,所以关键点就在于China Accelerator是用什么方法来实现类似于Xeon Phi与NVIDIA GPGPU(同样在美国限售范围内)的加速效果。国防科大给出的方案并不算有多“高大上”,但对于中国自主研发来说足够亮眼,那就是通用计算数字信号处理器(GPDSP),并且有了明确的型号——Matrix2000。

Matrix2000的主要设计规格,预计为16核设计,可达到2.4T的浮点性能,虽然还比不上Knight Landing的3T,但对于白手起家的中国来说,已经相当不易,而且功耗比现有的Xeon Phi少了100W

从Matrix2000的设计规格上看,至少在理论上还是相当不错的,对于中国自主研发的加速器已经非常不容易了。如果还是按照天河二号计算节点的配置(2CPU+3加速器),我们就按18000个节点来计算,将有54000颗Matrix2000加速器,理论运算峰值可达130P(54000x2.4T),加上36000颗E5-2692 V2,总峰值可达137.6P,所以100P的目标也许还有些保守,100P是最大浮点性能(天河二号是33.86P)也说不准。

Matrix2000的内部设计,采用了标量与向量单元+超长指令字(VLIW)的架构

针对全新的Matrix2000所准备的软件堆栈,这也是Matrix2000能否被有效利用进而被应用开发者所接纳的关键,包括GPDPS驱动程序、操作系统、编译器、数学库等,这的确是项工程量巨大的工作

据国防科大的相关研发人员介绍,有关DSP的浮点计算应用,一直也是国防科大的研发重点,它与超算研究可谓是并行发展。也正是因为有了这样的积累,国防科大才能比较从容的面对美国的限售。但该研发人员也表示,美国的限售来得这么快还是有点出乎预料,而GPDSP的一个推广难点也就在于,在HPC应用领域几乎是从零起步,就像当初NVIDIA刚推出GPGPU时一样,直到CUDA的发布才迅速改善了GPGPU的应用生态环境。国防科大的GPDSP显然也要经历类似的过程,但国防科大在业界的知名度以及DSP在HPC里的应用平滑过渡性,较当初NVIDIA在图像处理领域以及GPU在浮点运算能力方面的名声,还有很大差距,因此其中的困难可想而知。

卢宇彤表示,目前Matrix2000正在进行验证。这意味着至少在国防科大的层面,已经为正式投入使用做着最后的准备,但具体时间还不能确定,所以只给出了2016年这一较为笼统的时间点。相关研发人员也透露,除了应用平台进一步配套完善之外,GPDSP芯片本身的生产与物理设备的调优还有很多工作要做。而且受限于当前中国半导体生产工艺水平,现在还是采用40nm工艺的GPDSP,也在很大程度上制约了Matrix2000的能力,“否则可以做到更多的核心,获得更多的性能”,相关研发人员感慨到。

当然,天河二号A在技术上的突破不仅仅是Matrix2000,卢宇彤也没有把这次天河二号A的亮相等同于Matrix2000的亮相,接下来她又介绍了天河二号A在互联与I/O方面的设计。

除了最关键的Matrix2000之外,天河二号A在其他方面也有着明显的升级,在互联层,采用了自主研发的TH-Express 2+架构(天河二号是TH-Express 2),从联网芯片至网络路由芯片均有较大提升,并进一步实现了自适应(Adaptive)互联架构

所谓的自适应互联架构,就从多个层面入手,通过自应用平台层至底层形成的智能互动,保证网络效率持续而稳定,比如自动规避质量不佳或拥挤的链路,进一步杜绝重复的通信,并在节点与网络故障时对路由重新配置等等

在存储层面,天河二号A仍然是以自主研发的H2FS文件系统(Hybrid Hierarchy File System)为核心,并采用大量闪存作为I/O突发缓冲,夹在节点本地存储与大容量的全局存储之间,实现了1TB/s的突发传输,100GB/s的持续传输,每秒100万次的元数据操作

最后,卢宇彤给出了天河系统未来的应用方向与愿景,其实天河二号就已经不是单纯的HPC系统,在云、Hadoop、Spark等方面均有尝试或实际的应用,而未来则更是如此,国防科大也将按这样的思路来构建未来的天河二号A,让它从出生之日就是一个强大的多面手

卢宇彤对天河二号A的介绍,引发了会场的热烈反响,在提问环节,大多数的问题都集中在了“中国加速器”身上,显然这对于国外的HPC人士来说,也是非常的“意外”。但是,除了Matrix2000外,对于互联与I/O的完整阐述,也让人感觉天河二号A的确有备而来,明年的正式发布也是相当的靠谱(毕竟是军人出身嘛),剩下的就看它是出现在第47期还是第48期的TOP500榜单上了。

当然,中国研制超大规模HPC系统的目的肯定不仅仅是为了跑个LINPACK争个名次,否则也不会引起美国的重视并引发限售。天河二号A的设计在某种角度上说,真正打开了中国自主HPC发展的向上之路,因为加速器很重要,也因为加速器被国外限售,所以天河二号A在这种环境下还能很快达到100P的性能,也许连美国相关人士也没有想到,但这绝对是件好事!

虽然我们都知道Matrix2000在未来很一长段时间里,将会面临严峻的应用生态的挑战,但是我们也非常清楚,当初的两弹一星的诞生历程又是何等艰苦,可换来的国家意义与战略价值则无法估量。中国HPC领域的很多专家其实都对美国限售保持乐观态度,因为中国的机会来了——只要是西方发达国家限制的产业,中国自主研发的实力与产品也就越强,也就越来越不需要外国的东西,反而确保了自身生态链的完整与环境安全,可能自主之路短期很痛苦,但长远来看肯定利远大于弊。

对于这些专家们的观点,我深表赞同,以HPC对于国家的国防与经济战略意义来说,在很大程度上,计算加速器在当今的作用已经不亚于当初的两弹一星。而天河二号A就是一个很好的开始,也许GPDSP的路很难走,也许它在实际应用中还有很多问题,但毕竟我们走出了第一步,没有这一步,后面的所有可能也就无从谈起,如果走得好走得稳,你敢说就不会出现一个与GPGPU和Xeon Phi平起平坐的GPDSP生态吗?

最后,我衷心祝愿天河二号A的研发最终获得圆满成

功,早日上线,让美国的限售彻底见鬼去吧!



图片自己去看
http://server.zdnet.com.cn/server/2015/0715/3057141.shtml


Matrix2k替换xeon phi是最大亮点,国防科大出品


在ISC 2015大会上发布的第45期全球超级计算机TOP500排名中,由中国国防科学技术大学(简称国防科大)研制,部署于中国广州超算中心的天河二号再次荣登榜首,连续第5次成为TOP500冠军。但我相信,任何一个关心中国超算事业的人,都在高兴之余有着隐隐的一丝不安,那就是始于今年4月的“中美超算风波”,总让感觉天河的未来布满阴云。

第45期 TOP500榜单,前10名中只有一台新系统(第7名),其余都是老面孔,天河二号第5次占据冠军位置

在4月底时,我曾写过一篇专文《走出中国超算的“凌波微步”》,详细介绍了这场风波的来龙去脉,以及它所产生的影响,并分析了中国应有的宏观对策。简单来说,由于美国点名对天河二号的限售,阻碍了天河二号今年既定的100PFLOPS(1P=千万亿次浮点运算,本文所指的浮点性能均指双精度)的升级计划,并可能长期影响中国超大规模超算系统的建设,这其中的关键就是英特尔公司的Xeon Phi加速器(或与之类同的产品),它对于天河二号的连续5次登顶有着决定性的意义。

我们先看天河二号的配置:16000个计算节点,32000颗英特尔至强(Xeon) E5-2692V2 2.2GHz/12核心CPU,48000颗Xeon Phi 31S1P加速器,其运算峰值速度约为55PFLOPS。这其中天河二号所采用的Xeon Phi 31S1P拥有57个核心,TDP功耗300W,单个Xeon Phi 31S1P的浮点运算性能约1TFLOPS(1T=万亿次)。48000颗Xeon Phi 31S1P就贡献出了48PFLOPS的浮点性能,对于天河二号55P的峰值性能来说,重要性不言而喻。

美国银售的重点对象——英特尔Xeon Phi计算加速器,今年将推出第二代Knights Landing

在今年,英特尔将推出代号为Knight Landing的第二代Xeon Phi,浮点性能达到3TFLOPS。假如全部替换掉天河二号现有的Xeon Phi,那么天河二号的性能就将超过150PFLOPS(加上32000颗E5的性能),绝对仍然是2015年,甚至是2016年的TOP500冠军。所以说,针对天河二号的Xeon Phi限售,的确影响到了天河后续的升级计划。

在那段风波期间,除了更多的中国超算专家表示要进一步自力更生,不惧封锁外,具体的产品与技术措施其实并不清晰。在2015年4月19日,在由中国计算机学会青年计算机科技论坛(CCF YOCSEF)在京举行 “芯片限售对我国超算的影响”特别论坛上,天河二号系统主任设计师、国防科大教授卢宇彤女士曾非常自信的强调,“按照原定计划,天河二号拟在今年将计算能力从55PFLOPS升级到100PFLOPS。尽管此次美方对天河二号升级所需Intel Xeon处理器的限售,对原定升级计划有一定影响,但我们早有准备,绝不会影响天河二号从55PFLOPS升级到100PFLOPS的既定目标 。”

然而,很多人并不知道,国防科大到底会采用什么方法来实100P的目标,心里多少没底,甚至有人怀疑国防科大也只是在给大家打气,并没有实际的解决方案。但是,在ISC 2015的第二天——中美超算风波3个多月后,卢宇彤亲自给出了答案——这就是天河二号A,并明确表示将在2016年正式上线。

天河二号系统主任设计师、国防科大教授卢宇彤在ISC 2015大会上以英文做主题讲演,详细介绍了中国主要的超算应用在天河二号上的实践,并第一次在国外会议上详细介绍了天河二号A的概况

在讲演的开头部分,卢宇彤介绍了天河系统的发展历史与未来的规划,也表明了100P系统的计划,但没有透露具体的系统名称

卢宇彤的主题讲演是在ISC 2015第二天的下午5点15分开始,其讲演的主题是《Applications Leveraging Supercomputing Systems》,我起初以为就是以天河二号的应用视角来看超算系统的应用与价值,并没有想到会介绍到天河二号A,给了我一个大大的惊喜。

天河二号A 100P性能达成!天河二号A的主要技术指标,与历代天河系统的对比,其运算峰值将达到100P,能实现的关键就在于“中国加速器”,请注意功耗与天河二号几乎相同

天河二号A的计算节点数量将从天河二号的16000个,增加到约18000个,处理器仍然没变,还是至强E5-2692 V2,而最引人关注的则是用“China Accelerator”(中国加速器)替代了Xeon Phi。

从上文可知,通用处理器在未来的HPC系统里的权重会越来越低,主要工作将逐渐向控制层面转移,计算任务则主要由加速器完成。也因此,要想实现100P的目标,没有类似于Xeon Phi这类产品是不可能实现的,所以关键点就在于China Accelerator是用什么方法来实现类似于Xeon Phi与NVIDIA GPGPU(同样在美国限售范围内)的加速效果。国防科大给出的方案并不算有多“高大上”,但对于中国自主研发来说足够亮眼,那就是通用计算数字信号处理器(GPDSP),并且有了明确的型号——Matrix2000。

Matrix2000的主要设计规格,预计为16核设计,可达到2.4T的浮点性能,虽然还比不上Knight Landing的3T,但对于白手起家的中国来说,已经相当不易,而且功耗比现有的Xeon Phi少了100W

从Matrix2000的设计规格上看,至少在理论上还是相当不错的,对于中国自主研发的加速器已经非常不容易了。如果还是按照天河二号计算节点的配置(2CPU+3加速器),我们就按18000个节点来计算,将有54000颗Matrix2000加速器,理论运算峰值可达130P(54000x2.4T),加上36000颗E5-2692 V2,总峰值可达137.6P,所以100P的目标也许还有些保守,100P是最大浮点性能(天河二号是33.86P)也说不准。

Matrix2000的内部设计,采用了标量与向量单元+超长指令字(VLIW)的架构

针对全新的Matrix2000所准备的软件堆栈,这也是Matrix2000能否被有效利用进而被应用开发者所接纳的关键,包括GPDPS驱动程序、操作系统、编译器、数学库等,这的确是项工程量巨大的工作

据国防科大的相关研发人员介绍,有关DSP的浮点计算应用,一直也是国防科大的研发重点,它与超算研究可谓是并行发展。也正是因为有了这样的积累,国防科大才能比较从容的面对美国的限售。但该研发人员也表示,美国的限售来得这么快还是有点出乎预料,而GPDSP的一个推广难点也就在于,在HPC应用领域几乎是从零起步,就像当初NVIDIA刚推出GPGPU时一样,直到CUDA的发布才迅速改善了GPGPU的应用生态环境。国防科大的GPDSP显然也要经历类似的过程,但国防科大在业界的知名度以及DSP在HPC里的应用平滑过渡性,较当初NVIDIA在图像处理领域以及GPU在浮点运算能力方面的名声,还有很大差距,因此其中的困难可想而知。

卢宇彤表示,目前Matrix2000正在进行验证。这意味着至少在国防科大的层面,已经为正式投入使用做着最后的准备,但具体时间还不能确定,所以只给出了2016年这一较为笼统的时间点。相关研发人员也透露,除了应用平台进一步配套完善之外,GPDSP芯片本身的生产与物理设备的调优还有很多工作要做。而且受限于当前中国半导体生产工艺水平,现在还是采用40nm工艺的GPDSP,也在很大程度上制约了Matrix2000的能力,“否则可以做到更多的核心,获得更多的性能”,相关研发人员感慨到。

当然,天河二号A在技术上的突破不仅仅是Matrix2000,卢宇彤也没有把这次天河二号A的亮相等同于Matrix2000的亮相,接下来她又介绍了天河二号A在互联与I/O方面的设计。

除了最关键的Matrix2000之外,天河二号A在其他方面也有着明显的升级,在互联层,采用了自主研发的TH-Express 2+架构(天河二号是TH-Express 2),从联网芯片至网络路由芯片均有较大提升,并进一步实现了自适应(Adaptive)互联架构

所谓的自适应互联架构,就从多个层面入手,通过自应用平台层至底层形成的智能互动,保证网络效率持续而稳定,比如自动规避质量不佳或拥挤的链路,进一步杜绝重复的通信,并在节点与网络故障时对路由重新配置等等

在存储层面,天河二号A仍然是以自主研发的H2FS文件系统(Hybrid Hierarchy File System)为核心,并采用大量闪存作为I/O突发缓冲,夹在节点本地存储与大容量的全局存储之间,实现了1TB/s的突发传输,100GB/s的持续传输,每秒100万次的元数据操作

最后,卢宇彤给出了天河系统未来的应用方向与愿景,其实天河二号就已经不是单纯的HPC系统,在云、Hadoop、Spark等方面均有尝试或实际的应用,而未来则更是如此,国防科大也将按这样的思路来构建未来的天河二号A,让它从出生之日就是一个强大的多面手

卢宇彤对天河二号A的介绍,引发了会场的热烈反响,在提问环节,大多数的问题都集中在了“中国加速器”身上,显然这对于国外的HPC人士来说,也是非常的“意外”。但是,除了Matrix2000外,对于互联与I/O的完整阐述,也让人感觉天河二号A的确有备而来,明年的正式发布也是相当的靠谱(毕竟是军人出身嘛),剩下的就看它是出现在第47期还是第48期的TOP500榜单上了。

当然,中国研制超大规模HPC系统的目的肯定不仅仅是为了跑个LINPACK争个名次,否则也不会引起美国的重视并引发限售。天河二号A的设计在某种角度上说,真正打开了中国自主HPC发展的向上之路,因为加速器很重要,也因为加速器被国外限售,所以天河二号A在这种环境下还能很快达到100P的性能,也许连美国相关人士也没有想到,但这绝对是件好事!

虽然我们都知道Matrix2000在未来很一长段时间里,将会面临严峻的应用生态的挑战,但是我们也非常清楚,当初的两弹一星的诞生历程又是何等艰苦,可换来的国家意义与战略价值则无法估量。中国HPC领域的很多专家其实都对美国限售保持乐观态度,因为中国的机会来了——只要是西方发达国家限制的产业,中国自主研发的实力与产品也就越强,也就越来越不需要外国的东西,反而确保了自身生态链的完整与环境安全,可能自主之路短期很痛苦,但长远来看肯定利远大于弊。

对于这些专家们的观点,我深表赞同,以HPC对于国家的国防与经济战略意义来说,在很大程度上,计算加速器在当今的作用已经不亚于当初的两弹一星。而天河二号A就是一个很好的开始,也许GPDSP的路很难走,也许它在实际应用中还有很多问题,但毕竟我们走出了第一步,没有这一步,后面的所有可能也就无从谈起,如果走得好走得稳,你敢说就不会出现一个与GPGPU和Xeon Phi平起平坐的GPDSP生态吗?

最后,我衷心祝愿天河二号A的研发最终获得圆满成

功,早日上线,让美国的限售彻底见鬼去吧!



图片自己去看
http://server.zdnet.com.cn/server/2015/0715/3057141.shtml
NRC  24port  5.3TB

NIC 14GB/8lan
端口略少,不过吞吐高到有点吓人了

禁售后,预计从今年年底起到至少2019年,中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidia的方案毕竟还是差距较大。
榜单倒是次要了

重点还是接下来技能树怎么攀
国防科大都在搞众核?碉堡了。
干脆把调度CPU换龙芯得了,彻底干掉鹰酱。
国防科大都在搞众核?碉堡了。
干脆把调度CPU换龙芯得了,彻底干掉鹰酱。
想想也不可能,Xeon E5在这里的角色是提供大量PCIe通道和够高的内存带宽,龙芯起码还得发展两年才有这水平。
deam 发表于 2015-7-15 14:59
想想也不可能,Xeon E5在这里的角色是提供大量PCIe通道和够高的内存带宽,龙芯起码还得发展两年才有这水 ...
两年已经是非常乐观的预期了啊,天河2A粗略估计明年出来,2017年也很正常。
Top 500就是个浮云,既然老美不让我们拿第一,那我们也没必要硬争这个虚名,扎扎实实提高自身的能力最重要。
这就是限售的意义所在。
希望能挺过难关来自: iPhone客户端

壮东风 发表于 2015-7-15 14:50
国防科大都在搞众核?碉堡了。
干脆把调度CPU换龙芯得了,彻底干掉鹰酱。


一共有192个CPU+DSP核心
壮东风 发表于 2015-7-15 14:50
国防科大都在搞众核?碉堡了。
干脆把调度CPU换龙芯得了,彻底干掉鹰酱。


一共有192个CPU+DSP核心
EKW 发表于 2015-7-15 15:57
一共有192个CPU+DSP核心
能否解释一下,不是说Matrix 2000为16核心么?
意思是,硬件问题不大;
软件生态环境就恶劣太多。

自建生态系统,工作量太大,不乐观。

还是应该开发某种兼容系统。
壮东风 发表于 2015-7-15 16:12
能否解释一下,不是说Matrix 2000为16核心么?
这张图片里有
deam 发表于 2015-7-15 14:34
禁售后,预计从今年年底起到至少2019年,中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidi ...
不是第一也是前3;中国有3台100P超算
天2;曙光7000;江南所100P

SW-5众核不错,与NVIDIA K20相当;
GPDSP,这个和GPGPU那个更通用?
壮东风 发表于 2015-7-15 14:50
国防科大都在搞众核?碉堡了。
干脆把调度CPU换龙芯得了,彻底干掉鹰酱。
GPDSP?这个是不是太不通用了?和GPGPU相比如何呢?
EKW 发表于 2015-7-15 15:57
一共有192个CPU+DSP核心
你是不是说反了,16*2*6的应该是DSP核心吧,因为旁边的两个上边有IO字样,可能应该是CPU核心,再说192个cpu核心那还需要什么DPS
国防科大都在搞众核?碉堡了。
干脆把调度CPU换龙芯得了,彻底干掉鹰酱。
你以为人家当兵的是那么好骗的吗?
mips64el 发表于 2015-7-15 17:13
GPDSP?这个是不是太不通用了?和GPGPU相比如何呢?
我觉得GPU事实上就是DSP。
空气蛋糕 发表于 2015-7-15 17:43
你以为人家当兵的是那么好骗的吗?
你什么意思,飞腾已经转向ARM了,申威也变成众核了,剩下自主的通用CPU只有龙芯,拿过来作为调度CPU,理论上没什么不妥吧?
当然这只是我的一个愿景,天河2A是升级版,不可能对系统架构做根本性改变。
你什么意思,飞腾已经转向ARM了,申威也变成众核了,剩下自主的通用CPU只有龙芯,拿过来作为调度CPU,理 ...
Sparc还在做吧!arm还是比不了sparc的
mips64el 发表于 2015-7-15 21:36
Sparc还在做吧!arm还是比不了sparc的
前段时间的FT-1500A不就是ARM芯片么?
前段时间的FT-1500A不就是ARM芯片么?
是的! 但是这能说明国防科大转arm了么?FT1500A用的明显是arm公版,不是自主微架构。至于sparc系列是否还在继续还没有消息。我觉得sparc还在继续,就看2016年的天河2A用什么调度CPU了!
Sparc还在做吧!arm还是比不了sparc的
ARM早超过sparc了吧?
用奔四烧水 发表于 2015-7-15 22:12
ARM早超过sparc了吧?

指标?

嵌入平台就别和mainframe比了

完全不是一个概念的东西

只看理论运算能力,或者跑mapreduce之流,大概同功耗ARM秒SPARC

然则真跑起DB,AS之类mainframe当家应用
ARM攒满一个机架也是被SPARC完灭

ARM早超过sparc了吧?
差远了,富士通/甲骨文还在不断发展sparc,而arm64才刚刚开始;arm32注定只能嵌入式
是的! 但是这能说明国防科大转arm了么?FT1500A用的明显是arm公版,不是自主微架构。至于sparc系列是否还 ...
你没看主楼新闻吗?天河2A的CPU部分完全没变。
我还是比较担心互联这块

互联芯片的spec看着不放心

这块上不去的话性能水分太大了
你没看主楼新闻吗?天河2A的CPU部分完全没变。
intel的cpu没变,但是sparc的(FT1500)每提到
现在是团队已经有了,初级产品也有了,需要的是持续的高投入
国防科大挺牛嘛。。。。“Matrix2000的主要设计规格,预计为16核设计,可达到2.4T的浮点性能,虽然还比不上Knight Landing的3T,但对于白手起家的中国来说,已经相当不易,而且功耗比现有的Xeon Phi少了100W”
2.4T浮点。。。。秒杀江南所的SW5。。。。SW5众核才1T浮点。。。。。
妥妥的国内第一啊。。。。江南要努力了。。。
国防科大挺牛嘛。。。。“Matrix2000的主要设计规格,预计为16核设计,可达到2.4T的浮点性能,虽然还比不上 ...
但是,江南所的SW-5可是CPU啊,类似于intel-phi,因为这两个众核都可以独立运行(phi从第二代开始);这个gpdsp和gpgpu可仅仅是加速器,无法脱离cpu独立运行
oldwatch 发表于 2015-7-15 14:31
NRC  24port  5.3TB

NIC 14GB/8lan
大B 小b 傻傻分不清?
ppt上可是:
NRC 5.376Tb/s
NIC 14Gb/8lan
Hold住!加油 !!!
你们国防科大的实力真是逆天了,居然藏了自研异构加速器 + 自研软件栈这么一个杀招!还在ISC上当着美国人面亮出来![good] 标量+VLIW是完全不同于市面上其他设计的新路线,这回不会再有剽窃抄袭之类的口水了,真心祝愿一战功成!

http://weibo.com/1686203097/Crco ... t#_rnd1437085101031
软件编程问题解决了?
壮东风 发表于 2015-7-15 21:42
前段时间的FT-1500A不就是ARM芯片么?
没有啊,没说变arm。我记得有帖子详细说这个事。
deam 发表于 2015-7-15 14:59
想想也不可能,Xeon E5在这里的角色是提供大量PCIe通道和够高的内存带宽,龙芯起码还得发展两年才有这水 ...
你什么时候对龙芯这么乐观了,已经只有两年的差距了么
马利奥 发表于 2015-7-17 12:28
你什么时候对龙芯这么乐观了,已经只有两年的差距了么
差不多吧                 。

deam 发表于 2015-7-15 14:34
禁售后,预计从今年年底起到至少2019年,中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidi ...


16年要推出 “Summit”、“Sierra”了吗。够快的,以为Power9、Volta、NVlink要2年左右才能出现。基于Volta的Tesla基本被禁运了,那NVLink呢?  
deam 发表于 2015-7-15 14:34
禁售后,预计从今年年底起到至少2019年,中国都不会再拿第一了。国防科大和江南所的浮点芯片与Intel、Nvidi ...


16年要推出 “Summit”、“Sierra”了吗。够快的,以为Power9、Volta、NVlink要2年左右才能出现。基于Volta的Tesla基本被禁运了,那NVLink呢?  
oldwatch 发表于 2015-7-16 08:03
我还是比较担心互联这块

互联芯片的spec看着不放心
Intel说Omni-Path Fabric比InfiniBand性能可提升最多23-73%,你有研究吗?