江南所那个众核很值得关注

来源:百度文库 编辑:超级军网 时间:2024/04/27 17:36:49


最近去参加个HPC会议,与会有教授介绍中国的100P那个超算的,其中提到了江南所的那个众核。

比龙芯什么的强多了,比英特尔的MIC我觉得也更有优势也很有独到之处:

江南所的众核,是把异构直接集成到了一个芯片里,4个串行优化核带256个并行优化核,而且计算能力非常强:

28nm工艺下DGEMM可以都达到3TFLOPS,效率接近95%,正组装的低阶版本在超算上测试LINPACK效率70%

这是什么概念呢?

INTEL的XEON PHI,22纳米工艺下,DGEMM 1.3TFLOPS,效率90%,天河2上测试LINPACK记得应该是60%多效率。
INTEL下一代XEON PHI, 14纳米工艺下, DGEMM 估计3TFLOPS,也就是才跟江南所这个相当,但问题是14NM打28NM。

NVIDIA的GPU:

28NM工艺,TESLA K40,DGEMM 1.6TFLOPS, 计算速度差了近一半。
16NM工艺,NVIDIA刚刚公开的TESLA P100,DGEMM没公布测试成绩,但是DFLOPS是5.3TFLOPS, DGEMM应该在5TFLOPS左右。


在28NM工艺下做出DGEMM 3TFLOPS的双精度的单芯片,江南所应该是首家,大幅领先同行(记得AMD有个浮点理论值2.6TFLOPS的GPU,但是那个构架奇葩,DGEMM最高应该也就是不到2TFLOPS而已)。


有这个计算性能,难怪把龙芯众核给PK下去了,可以说江南所这个构架非常有前途,构架上应该是世界领先水平,28NM工艺就够正面刚INTEL的下一代14NM工艺的众核了,如果将来能用台积电的16NM工艺,潜力不可限量。

最近去参加个HPC会议,与会有教授介绍中国的100P那个超算的,其中提到了江南所的那个众核。

比龙芯什么的强多了,比英特尔的MIC我觉得也更有优势也很有独到之处:

江南所的众核,是把异构直接集成到了一个芯片里,4个串行优化核带256个并行优化核,而且计算能力非常强:

28nm工艺下DGEMM可以都达到3TFLOPS,效率接近95%,正组装的低阶版本在超算上测试LINPACK效率70%

这是什么概念呢?

INTEL的XEON PHI,22纳米工艺下,DGEMM 1.3TFLOPS,效率90%,天河2上测试LINPACK记得应该是60%多效率。
INTEL下一代XEON PHI, 14纳米工艺下, DGEMM 估计3TFLOPS,也就是才跟江南所这个相当,但问题是14NM打28NM。

NVIDIA的GPU:

28NM工艺,TESLA K40,DGEMM 1.6TFLOPS, 计算速度差了近一半。
16NM工艺,NVIDIA刚刚公开的TESLA P100,DGEMM没公布测试成绩,但是DFLOPS是5.3TFLOPS, DGEMM应该在5TFLOPS左右。


在28NM工艺下做出DGEMM 3TFLOPS的双精度的单芯片,江南所应该是首家,大幅领先同行(记得AMD有个浮点理论值2.6TFLOPS的GPU,但是那个构架奇葩,DGEMM最高应该也就是不到2TFLOPS而已)。


有这个计算性能,难怪把龙芯众核给PK下去了,可以说江南所这个构架非常有前途,构架上应该是世界领先水平,28NM工艺就够正面刚INTEL的下一代14NM工艺的众核了,如果将来能用台积电的16NM工艺,潜力不可限量。
就是不知道这个江南所会不会拿出来市场化,而不是仅仅供应超算, 如果拿出来,我觉得还是会有市场的,起码我有兴趣试试。
这种优化略逆天啊
jianbing3hao 发表于 2016-4-15 07:15
这种优化略逆天啊
单纯看DGEMM效率,跟INTEL的CPU差不多了,比INTEL的众核好一些。
不同发展阶段的东西不好比,不知道江南这个东西离商用还多远
不要作假,这一块等出成绩了再庆祝,爱国人士也有怕的时候,不怕你不红,就怕你涂脂抹粉
56????????????
就是不知道这个江南所会不会拿出来市场化,而不是仅仅供应超算, 如果拿出来,我觉得还是会有市场的,起码 ...
除了超算还有哪些地方用?
楼主问个事啊,28和22差距大么?
6nm在这么低的纳米级上是很大的数值啊。
中国很多东西都能做,但是技术跟不上产品不能产业化,导致东西做出来成本高价格没有竞争力,这就是经常看见新闻上有技术突破但是市场上买不到相关产品,实验室里小批量生产和工业化大生产是两个概念了。
可以向民用推广啊

汉唐大梦 发表于 2016-4-15 07:53
除了超算还有哪些地方用?


就是搞高性能计算用的,浮点运算能力非常强。

当时一般家用玩游戏之类这个用不上。

而且这种东西一般也不适合家用,这种专业计算芯片/卡,一块售价在3万-10万不等。
汉唐大梦 发表于 2016-4-15 07:53
除了超算还有哪些地方用?


就是搞高性能计算用的,浮点运算能力非常强。

当时一般家用玩游戏之类这个用不上。

而且这种东西一般也不适合家用,这种专业计算芯片/卡,一块售价在3万-10万不等。
硝烟已尽 发表于 2016-4-15 08:09
中国很多东西都能做,但是技术跟不上产品不能产业化,导致东西做出来成本高价格没有竞争力,这就是经常看见 ...
这个都在超算上测LINPACK了,根本不是实验品。
就是搞高性能计算用的,浮点运算能力非常强。

当时一般家用玩游戏之类这个用不上。

专业的工作站、服务器、小型机、大型机能用吗?应用软件怎么解决?
这个构架我是很有期待的,异构集成到一个芯片上了,而且计算能力跟INTEL马上要出的众核相当,用到100P那个超算,肯定是做出来了,江南所实力果然不是中科院那个组能比的。

虽然我现在离开HPC这行业了,但是还是有这方面爱好的,如果淘宝上能有的话,我会入一块的。
待到荼蘼花事了 发表于 2016-4-15 07:55
楼主问个事啊,28和22差距大么?
6nm在这么低的纳米级上是很大的数值啊。
22纳米当然比28纳米好很多了,假定其他设计保持一致,能集成的晶体管密度大概提高就是平方关系,能集成更多的晶体管,自然能集成更多的计算单元,计算能力也有类似于平方级别的增长,当然这都是理想状况的粗略估计。
22纳米当然比28纳米好很多了,假定其他设计保持一致,能集成的晶体管密度大概提高就是平方关系,能集成更 ...
现在的显卡都可以分担CPU 的运算了,有哪位大神可以解释下这方面的知识
F22缺氧禽 发表于 2016-4-15 09:08
这个都在超算上测LINPACK了,根本不是实验品。
不是指的试验品,实验室条件下的生产规模和工业化生产规模应用,实验室条件下生产的产品不是指的只能是试验品,只是生产规模不能扩大。
那个100P啥时候出???
56????????????
不是56还能是谁 ??66?86?586??!
架构,中国自己的架构?不是MIPS,也不是X86、ARM?
指令集是哪个啊?LZ科谱下。。。
技术我完全不懂 但是我看观察者网的铁流说  那个众核确实相当逆天  不过我还是觉得 应该不是全面领先 可能是某一方面有独特优势吧
不明觉厉
市场化是大门槛,不过政府有决心支持的话还是能打开一番天地的。
硝烟已尽 发表于 2016-4-15 09:34
不是指的试验品,实验室条件下的生产规模和工业化生产规模应用,实验室条件下生产的产品不是指的只能是试 ...
江南所又不负责生产,你说的哪儿跟哪儿啊。
会讲故事不代表会做事。慢慢看
会讲故事不代表会做事。慢慢看
zjdyxd1 发表于 2016-4-15 10:55
江南所又不负责生产,你说的哪儿跟哪儿啊。
我说的和江南所扯不上关系,你说的哪儿跟哪儿啊。
不明觉厉,但是话又说回来了,就算徕卡和施华洛世奇的军用产品有多好,日本的单反还是会被认为是无双


小白看不懂

@花落庭院
@deam

小白看不懂

@花落庭院
@deam
待到荼蘼花事了 发表于 2016-4-15 07:55
楼主问个事啊,28和22差距大么?
6nm在这么低的纳米级上是很大的数值啊。
差一代的水平,不过说实话 28nm和22nm技术上差距不太大,从22nm到14nm差距比较大,因为换了新的晶体管架构了
硝烟已尽 发表于 2016-4-15 08:09
中国很多东西都能做,但是技术跟不上产品不能产业化,导致东西做出来成本高价格没有竞争力,这就是经常看见 ...
这一下说到点子上了。
F22缺氧禽 发表于 2016-4-15 09:12
这个构架我是很有期待的,异构集成到一个芯片上了,而且计算能力跟INTEL马上要出的众核相当,用到100P ...
淘宝上有???
关于这个众核
1)TDP多少?
2)大小核心的频率?
3)晶体管总数?
4)内存带宽呢?

关于这个100P
1)啥时候公布?
2)除了这个众核,前端处理器采用的是申威的那款U?



@花落庭院

@hswz

@ayanamei

@wpf000


@花落庭院

@hswz

@ayanamei

@wpf000
不介绍内存带宽就是关键了,内存带宽和容量上不去,属于上一代众核加速架构。

为了解决内存问题,Intel的做法是HMC+6通道DDR4;Nvidia和IBM则合作,用Nvlink连接GPU和Power CPU,利用前者的HBM提供带宽,后者的多通道DDR提供容量。

而国内的这个众核、国防科大的Matrix加速器就像上代GPU、Xeon Phi,主要的瓶颈在内存上。
问题是: 可能交给台湾去代工吗?  虽然我们没有16纳米工艺。
如果深度学习是正确的方向,那异构cpu和神经网络算法就会成为未来主流,
就怕厂家没有接盘,把研究东西转为商品
56所现在待遇很差,唉。这就是现在体制内科研人员的处境