中国的64核ARM架构芯片

来源:百度文库 编辑:超级军网 时间:2024/04/28 17:35:03
在Hot Chips 27大会上中国Startup企业Phytium的Charles Zhang介绍了他们名叫Mars的64核ARMv8架构芯片。

- Phytium成立于2012年
- Mars的名叫“小米”的核心:32KB L1 Cache,32MB L2 Cache,128MB L3 Cache
- 16个DDR3-1600通道共204 GByte/s
- 2×PCIe3.0各16Lanes,I/O带宽:32 GByte/s
- 2.0GHz@28nm, 120W
- 双精度性能:512GFLOPS
- SPECint_2006_base:19,2,SPECfp_2006_base:17,8
- SPECint_2006_rate:672,SPECfp_2006_rate:585
  对比:Xeon E5-2695 v3 (Haswell-EP) 14核:557(整数),410(浮点)

链接:

http://www.theplatform.net/2015/ ... -arm-big-iron-chip/

http://www.golem.de/news/phytium ... en-1508-115917.html

http://www.heise.de/newsticker/m ... puting-2788775.html

http://www.computerbase.de/2015- ... f-640-mm-aus-china/在Hot Chips 27大会上中国Startup企业Phytium的Charles Zhang介绍了他们名叫Mars的64核ARMv8架构芯片。

- Phytium成立于2012年
- Mars的名叫“小米”的核心:32KB L1 Cache,32MB L2 Cache,128MB L3 Cache
- 16个DDR3-1600通道共204 GByte/s
- 2×PCIe3.0各16Lanes,I/O带宽:32 GByte/s
- 2.0GHz@28nm, 120W
- 双精度性能:512GFLOPS
- SPECint_2006_base:19,2,SPECfp_2006_base:17,8
- SPECint_2006_rate:672,SPECfp_2006_rate:585
  对比:Xeon E5-2695 v3 (Haswell-EP) 14核:557(整数),410(浮点)

链接:

http://www.theplatform.net/2015/ ... -arm-big-iron-chip/

http://www.golem.de/news/phytium ... en-1508-115917.html

http://www.heise.de/newsticker/m ... puting-2788775.html

http://www.computerbase.de/2015- ... f-640-mm-aus-china/


国防科大这个CPU设计的不错:4发射乱序执行,分支预测:2K项 BTB,512项indpre   48项SRS,192项物理寄存器(没有具体说明定点浮点),ROB 160项,定点乱序发射队列,16项,浮点发射队列16项,访存发射队列24项,32项ITLB,2个整数运算单元?,2个浮点运算单元,L1缓存64KB,多线程吞吐量有点恐怖

国防科大这个CPU设计的不错:4发射乱序执行,分支预测:2K项 BTB,512项indpre   48项SRS,192项物理寄存器(没有具体说明定点浮点),ROB 160项,定点乱序发射队列,16项,浮点发射队列16项,访存发射队列24项,32项ITLB,2个整数运算单元?,2个浮点运算单元,L1缓存64KB,多线程吞吐量有点恐怖
国防科大这个CPU设计的不错:4发射乱序执行,分支预测:2K项 BTB,512项indpre   48项SRS,192项物理寄存器 ...
感觉用火星+矩阵2000

替代  E5+phi  好了
scxtx 发表于 2015-8-26 06:26
感觉用火星+矩阵2000

替代  E5+phi  好了
这个CPU是做高端服务器用的?多线程吞吐量很好
这个CPU是做高端服务器用的?多线程吞吐量很好
单核心  spec2000分数大约多少?

能上pc么?
scxtx 发表于 2015-8-26 06:35
单核心  spec2000分数大约多少?

能上pc么?
应该到了A57级别以上,非常不错了,看核心硬件资源就知道了。。。。。SPEC 2006估计开了par测试的,否则就追上INTEL了,多线程也不止这个分数,当然用也做不了64核心,制造面积也不止640mm2
国防科大的多核结构非常牛逼


不错,期待跟海思一样换16nm

不错,期待跟海思一样换16nm
应该到了A57级别以上,非常不错了,看核心硬件资源就知道了。。。。。SPEC 2006估计开了par测试的,否则 ...
没开par。   
核心叫小米,什么意思。。。
花落庭院 发表于 2015-8-26 06:24
国防科大这个CPU设计的不错:4发射乱序执行,分支预测:2K项 BTB,512项indpre   48项SRS,192项物理寄存器 ...
这个跟国防科大什么关系???,哪儿看出是有国防科大了?
deam 发表于 2015-8-26 08:26
没开par。
这个跟国防科大什么关系???
现在都有多少个飞腾了? 天津飞腾FT1500A,又来个广东飞腾?(见phytium官网),这两个飞腾与国防科大到底有没有关系?

mips64el 发表于 2015-8-26 09:34
这个跟国防科大什么关系???,哪儿看出是有国防科大了?


Phytium  这个忽悠歪果仁的名字,中国人一读不就是 飞腾 么?

再看 Phytium Technology的网站: http://www.phytium.com.cn/index.html

为数不多的几张图片就有:天河一号的机柜,有银河飞腾Logo的芯片。(现在被删了,不知快照里还有没有)


mips64el 发表于 2015-8-26 09:34
这个跟国防科大什么关系???,哪儿看出是有国防科大了?


Phytium  这个忽悠歪果仁的名字,中国人一读不就是 飞腾 么?

再看 Phytium Technology的网站: http://www.phytium.com.cn/index.html

为数不多的几张图片就有:天河一号的机柜,有银河飞腾Logo的芯片。(现在被删了,不知快照里还有没有)

匿名用户 发表于 2015-8-26 09:59
Phytium  这个忽悠歪果仁的名字,中国人一读不就是 飞腾 么?

再看 Phytium Technology的网站: htt ...
国防科大有没有通用GPGPU的项目呢
跟小米有啥关系??
mips64el 发表于 2015-8-26 09:36
这个跟国防科大什么关系???
Phytium Technology在hot chips大会作报告的 Charles Zhang 被美国政府拒绝入境,然后准备做在线视频报告也被墙了,最后不得不通过越洋电话做的报告。

如果只是没有特殊背景的一般人士,美国没必要拒绝其入境参加学术会议吧。
EKW 发表于 2015-8-26 10:02
国防科大有没有通用GPGPU的项目呢
有高级流处理器项目,但真还算不上是GPGPU。
匿名用户 发表于 2015-8-26 10:19
有高级流处理器项目,但真还算不上是GPGPU。

是众核的流处理器吗
EKW 发表于 2015-8-26 10:33
是众核的流处理器吗
GPDSP                                
deam 发表于 2015-8-26 08:26
没开par。
那里有没开的说明?
那里有没开的说明?
如果开了才19分,没开就只会有10分,那64核撑死跑到600分了。
deam 发表于 2015-8-26 11:37
如果开了才19分,没开就只会有10分,那64核撑死跑到600分了。
你算过2G频率haswell的没开par SPEC 2006多少分?
你算过2G频率haswell的没开par SPEC 2006多少分?
28         
deam 发表于 2015-8-26 11:43
28
哈哈,SPEC=rate/N
哈哈,SPEC=rate/N
应该是rate/n再稍多一点,这里就不算多的那点了。
deam 发表于 2015-8-26 11:48
应该是rate/n再稍多一点,这里就不算多的那点了。
我见过GCC5.1用ofast选项3.3G的haswell跑32分。。。。。。
我见过GCC5.1用ofast选项3.3G的haswell跑32分。。。。。。
gcc嘛,正常。
deam 发表于 2015-8-26 11:50
gcc嘛,正常。
haswell  用GCC5.1用ofast跑SPEC 2000是1190/GHZ。。。。。然后ICC跑1300/GHZ左右。。。。

花落庭院 发表于 2015-8-26 11:53
haswell  用GCC5.1用ofast跑SPEC 2000是1190/GHZ。。。。。然后ICC跑1300/GHZ左右。。。。


2006的负载高,所以差异大些。另外用rate/n算出来的是单核双线程跑俩copies的分数。
花落庭院 发表于 2015-8-26 11:53
haswell  用GCC5.1用ofast跑SPEC 2000是1190/GHZ。。。。。然后ICC跑1300/GHZ左右。。。。


2006的负载高,所以差异大些。另外用rate/n算出来的是单核双线程跑俩copies的分数。
那里有没开的说明?
不过如果没开,就意味着这芯片多核互联效率比较差。想了想还是存疑吧。
deam 发表于 2015-8-26 12:02
2006的负载高,所以差异大些。另外用rate/n算出来的是单核双线程跑俩copies的分数。


64核,性能应该超过E52699V3了吧
小白不懂,没超过就没啥惊喜的,超过了就小小的惊喜一把
大大的超过了就打鸡血了{:soso_e113:}

64核,性能应该超过E52699V3了吧
小白不懂,没超过就没啥惊喜的,超过了就小小的惊喜一把
大大的超过了就打鸡血了{:soso_e113:}
应该到了A57级别以上,非常不错了,看核心硬件资源就知道了。。。。。SPEC 2006估计开了par测试的,否则 ...
单核和苹果比怎么样?
smartfortwo 发表于 2015-8-26 13:06
单核和苹果比怎么样?
火星单核不是非常清楚,乐观估计跟A57差不多。苹果的A7是可以用haswell来计算的,曾经有第三方测试spec int 2006,苹果A7的IPC是1,haswell是1.39,spec int 2000苹果A7是946/GHZ,haswell是1300/GHZ左右,因为大概是同类型测试,效率比差不多。。。。
火星单核不是非常清楚,乐观估计跟A57差不多。苹果的A7是可以用haswell来计算的,曾经有第三方测试spec i ...
火星单核不是有分数吗?19.2
smartfortwo 发表于 2015-8-26 13:24
火星单核不是有分数吗?19.2
spec 2006是可以打开par测试的,这个成绩就没办法比较纯粹的单线程性能,所以19.2的情况不清不楚,从64核spec rate才674的情况看,开par的可能性更大,假如没开,火星的单线程就登天了,再做到INTEL的单线程效率,28nm功耗才120W,还能做到64核,有点不可能 ,还有乱序硬件资源和分支预测也明显不可能,除非是真正的火星技术
spec 2006是可以打开par测试的,这个成绩就没办法比较纯粹的单线程性能,所以19.2的情况不清不楚,从64核 ...
intel是单核双线程的分数吧。
smartfortwo 发表于 2015-8-26 13:33
intel是单核双线程的分数吧。
是spec speed测试,不是SPEC rate测试,两个测试不同
在别的地方看到说是兼容arm,以前也有这种说法,不知道这个兼容是什么意思