飞腾发布代号为“火星”的64核心ARM处理器

来源:百度文库 编辑:超级军网 时间:2024/04/29 14:16:18
原地址:http://www.leiphone.com/news/201508/YaqI7U46ihkgHVGC.html

在刚刚结束的Hotchips 2015会议上,一家成立不久的中国企业公布了一颗代号”火星”的ARM指令集64核心处理器。令人震惊的是,这颗由中国团队开发的CPU拥有媲美Intel公司最顶级服务器芯片的性能,毫无疑问是目前ARM阵营最强大的处理器。

Phytium,中文名飞腾,是一家成立于2012年的年轻CPU研发企业。然而光是从公司名称和所在地——广州,我们就可以知道这家企业的真实身份。飞腾公司是中国国防科技大学高性能处理器研究团队建立的企业,而国防科大在IT界最为人熟知的作品就是天河2A超级计算机——连续五届夺得世界超算排行榜性能冠军。天河2A的部分芯片采用了国防科大自主开发的Sparc指令集CPU,飞腾1500。显然,飞腾公司的名称就是取自这款产品。公司选址在广州也是为了靠近广州超级计算中心,也就是天河2A的所在地。

与中科院计算所知名的龙芯处理器团队不同,国防科大的CPU研发机构在公众眼中没什么名气。事实上,早在十年前业内就有传闻指国防科大正在逆向山寨Intel的IA64体系处理器安腾。后来安腾CPU在市场上举步维艰,NUDT(国防科大英文缩写)也停止了对其模仿的工作,转而开发采用Sparc指令集的高性能芯片。经过数年的努力,NUDT先后研制出飞腾1000、飞腾1500两款服务器处理器,开始逐渐为业界所知。

天河系列超算开始在全球超算领域崭露头角后,国防科大将眼光放到了更远的未来。天河2A和之前的一系列国产超级计算机均采用Intel、Nvidia、AMD等美国企业生产的处理器,其计算能力、软件编写严重依赖这些外国公司。若想自己掌控超级计算机的研发节奏,研制自主知识产权的高性能处理器是必经之路。此时,学校的CPU团队经过几代产品的研发已经颇具实力,他们便担负起了设计有着世界一流水平的CPU的重任。

在标准测试集Spec 2006中,”火星”的多核整数分数高达672,浮点分数585。相比之下,Intel目前最强的处理器Xeon E7-8890v3和Xeon E5-2699v3的整数、浮点成绩分别是680和460,"火星”的性能足以与它们媲美。


火星”的核心代号为”小米”,这个名字足够令许多人浮想联翩了。不过取这个名字很可能只是巧合,因为飞腾公司与制造智能设备的小米公司并没有任何关联。”小米”核心是典型的现代高性能处理器微架构设计,四发射、两个浮点单元,不长的流水线和三级缓存方案。它显然并不是为密集浮点运算设计的产物,单周期双精度浮点输出只有4Flop。但是"小米"核心的访存结构设计很激进,192个寄存器、单核心512K L2、2M L3的设计非常像Intel的Haswell微架构。

”火星”采用二维mesh多核互联结构,每8颗”小米”核心组成一个阵列,每个阵列有一个双通道DDR3-1600内存控制器;8个阵列组成”火星”芯片,总共64个核心、32M二级缓存、128M三级缓存和16通道内存,205G/s理论内存带宽。芯片上还有32个PCIe 3.0通道。


“火星”的理论浮点计算能力是512G DP Flops,采用28nm制造工艺,主频2GHZ,核心运行电压不足1v。虽然整个芯片面积达到了吓人的640平方毫米,但是满载功耗只有120w,甚至比使用22nm先进工艺,性能相当的Xeon E5-2699v3、E7-8890v3都低一截。ARM阵营性能功耗比较强的优势过去仅仅体现在移动设备使用的低功耗芯片上,而飞腾公司证明了即使在高性能服务器处理器领域,兼容ARM指令集的处理器也能取得对同时代Intel顶级产品的功耗优势。


火星”的量产版本预计会在2016年推出,预计会首先用在国防科大下一代超级计算机(可能命名为天河3)上。不久前,国防科大展示了一款用来取代Intel Xeon Phi浮点运算芯片的计算卡Matrix 2000,预计下一代天河会使用”火星”和Matrix 2000的组合来搭建。

除了”火星”,飞腾公司还展望了他们针对主流市场开发的”地球”处理器。”地球”显然是”火星”的简化版,核心数量可能减至4-16个,面向桌面PC、低功耗服务器等市场。从”火星”单核心Spec测试集成绩来看,8核心的”地球”就可以提供与Intel Core i7 四核处理器接近的多线程性能,而功耗可能还有优势。

而兼容ARMv8指令集意味着无论是”火星”还是”地球”都可以轻易运行安卓、Linux系统和市面上无数的应用,甚至可能兼容微软的Windows 10。性能差距不复存在后,ARM阵营进军桌面PC和服务器市场挑战x86的地位也就有了足够的底气。飞腾公司不仅仅做到了世界一流水平,更为重要的是他们为整个ARM阵营建立了信心

而值得国人骄傲的是,这一历史性时刻是一家之前默默无闻的中国企业创造的。自从2006年Intel发布酷睿2处理器以来,十年时间里除了老牌巨头IBM,未曾有任何企业挑战Intel性能冠军的宝座。

如今,第一个向老大哥扔出巨斧的不是AMD,不是Nvidia,也不是一众欧美企业,而是几年前还背着”山寨”恶名的中国团队。即使是业界最老资格的前辈,此刻也应向年轻的飞腾致以敬意。

毫无疑问,”火星”的发布会大大刺激ARM阵营的发展,直接影响未来数年的CPU产业格局。照此趋势发展下去,我们很快就会在桌面、高性能服务器领域看到ARM与x86的直接对抗。当Intel的神话不再闪耀,IT产业又会迎来一个高度竞争的全新时代。

原地址:http://www.leiphone.com/news/201508/YaqI7U46ihkgHVGC.html

在刚刚结束的Hotchips 2015会议上,一家成立不久的中国企业公布了一颗代号”火星”的ARM指令集64核心处理器。令人震惊的是,这颗由中国团队开发的CPU拥有媲美Intel公司最顶级服务器芯片的性能,毫无疑问是目前ARM阵营最强大的处理器。

Phytium,中文名飞腾,是一家成立于2012年的年轻CPU研发企业。然而光是从公司名称和所在地——广州,我们就可以知道这家企业的真实身份。飞腾公司是中国国防科技大学高性能处理器研究团队建立的企业,而国防科大在IT界最为人熟知的作品就是天河2A超级计算机——连续五届夺得世界超算排行榜性能冠军。天河2A的部分芯片采用了国防科大自主开发的Sparc指令集CPU,飞腾1500。显然,飞腾公司的名称就是取自这款产品。公司选址在广州也是为了靠近广州超级计算中心,也就是天河2A的所在地。

与中科院计算所知名的龙芯处理器团队不同,国防科大的CPU研发机构在公众眼中没什么名气。事实上,早在十年前业内就有传闻指国防科大正在逆向山寨Intel的IA64体系处理器安腾。后来安腾CPU在市场上举步维艰,NUDT(国防科大英文缩写)也停止了对其模仿的工作,转而开发采用Sparc指令集的高性能芯片。经过数年的努力,NUDT先后研制出飞腾1000、飞腾1500两款服务器处理器,开始逐渐为业界所知。

天河系列超算开始在全球超算领域崭露头角后,国防科大将眼光放到了更远的未来。天河2A和之前的一系列国产超级计算机均采用Intel、Nvidia、AMD等美国企业生产的处理器,其计算能力、软件编写严重依赖这些外国公司。若想自己掌控超级计算机的研发节奏,研制自主知识产权的高性能处理器是必经之路。此时,学校的CPU团队经过几代产品的研发已经颇具实力,他们便担负起了设计有着世界一流水平的CPU的重任。

在标准测试集Spec 2006中,”火星”的多核整数分数高达672,浮点分数585。相比之下,Intel目前最强的处理器Xeon E7-8890v3和Xeon E5-2699v3的整数、浮点成绩分别是680和460,"火星”的性能足以与它们媲美。

55dd041b67d11.jpg (153.35 KB, 下载次数: 7)

下载附件 保存到相册

2015-8-26 23:06 上传



火星”的核心代号为”小米”,这个名字足够令许多人浮想联翩了。不过取这个名字很可能只是巧合,因为飞腾公司与制造智能设备的小米公司并没有任何关联。”小米”核心是典型的现代高性能处理器微架构设计,四发射、两个浮点单元,不长的流水线和三级缓存方案。它显然并不是为密集浮点运算设计的产物,单周期双精度浮点输出只有4Flop。但是"小米"核心的访存结构设计很激进,192个寄存器、单核心512K L2、2M L3的设计非常像Intel的Haswell微架构。

”火星”采用二维mesh多核互联结构,每8颗”小米”核心组成一个阵列,每个阵列有一个双通道DDR3-1600内存控制器;8个阵列组成”火星”芯片,总共64个核心、32M二级缓存、128M三级缓存和16通道内存,205G/s理论内存带宽。芯片上还有32个PCIe 3.0通道。

55dd043a24ed3.jpg (198.95 KB, 下载次数: 7)

下载附件 保存到相册

2015-8-26 23:06 上传



“火星”的理论浮点计算能力是512G DP Flops,采用28nm制造工艺,主频2GHZ,核心运行电压不足1v。虽然整个芯片面积达到了吓人的640平方毫米,但是满载功耗只有120w,甚至比使用22nm先进工艺,性能相当的Xeon E5-2699v3、E7-8890v3都低一截。ARM阵营性能功耗比较强的优势过去仅仅体现在移动设备使用的低功耗芯片上,而飞腾公司证明了即使在高性能服务器处理器领域,兼容ARM指令集的处理器也能取得对同时代Intel顶级产品的功耗优势。

55dd0462500cd.jpg (173.42 KB, 下载次数: 7)

下载附件 保存到相册

2015-8-26 23:06 上传



火星”的量产版本预计会在2016年推出,预计会首先用在国防科大下一代超级计算机(可能命名为天河3)上。不久前,国防科大展示了一款用来取代Intel Xeon Phi浮点运算芯片的计算卡Matrix 2000,预计下一代天河会使用”火星”和Matrix 2000的组合来搭建。

除了”火星”,飞腾公司还展望了他们针对主流市场开发的”地球”处理器。”地球”显然是”火星”的简化版,核心数量可能减至4-16个,面向桌面PC、低功耗服务器等市场。从”火星”单核心Spec测试集成绩来看,8核心的”地球”就可以提供与Intel Core i7 四核处理器接近的多线程性能,而功耗可能还有优势。

而兼容ARMv8指令集意味着无论是”火星”还是”地球”都可以轻易运行安卓、Linux系统和市面上无数的应用,甚至可能兼容微软的Windows 10。性能差距不复存在后,ARM阵营进军桌面PC和服务器市场挑战x86的地位也就有了足够的底气。飞腾公司不仅仅做到了世界一流水平,更为重要的是他们为整个ARM阵营建立了信心

而值得国人骄傲的是,这一历史性时刻是一家之前默默无闻的中国企业创造的。自从2006年Intel发布酷睿2处理器以来,十年时间里除了老牌巨头IBM,未曾有任何企业挑战Intel性能冠军的宝座。

如今,第一个向老大哥扔出巨斧的不是AMD,不是Nvidia,也不是一众欧美企业,而是几年前还背着”山寨”恶名的中国团队。即使是业界最老资格的前辈,此刻也应向年轻的飞腾致以敬意。

毫无疑问,”火星”的发布会大大刺激ARM阵营的发展,直接影响未来数年的CPU产业格局。照此趋势发展下去,我们很快就会在桌面、高性能服务器领域看到ARM与x86的直接对抗。当Intel的神话不再闪耀,IT产业又会迎来一个高度竞争的全新时代。

这东西如果作为显卡核心,能运行妹纸卷轴最高画质上60帧么?
怎么有一步迈进共产主义的感觉
这东西如果作为显卡核心,能运行妹纸卷轴最高画质上60帧么?
跟GPU构架和任务不一样吧
ARM构架,每年还要付费向英国人要构架授权,做手机处理器还行,是个出路。服务是还是就算了,人要得是的成熟稳定可靠
推广使用linux任重而道远.
国产处理器?想起了那个,不看好。


大规模商用离开x86或者ARM指令集就是找死,

军用或者某些特别用途你可以用别的,

兼容x86或者ARM,你想一下成千上万的应用软件,你都醉了,

我就想知道火星,地球啥的如何解决指令授权?

希望他们可以获得ARM的合法授权,这样才可以走得比非法使用远得多…

否则无法形成良性循环,造成浪费。

大规模商用离开x86或者ARM指令集就是找死,

军用或者某些特别用途你可以用别的,

兼容x86或者ARM,你想一下成千上万的应用软件,你都醉了,

我就想知道火星,地球啥的如何解决指令授权?

希望他们可以获得ARM的合法授权,这样才可以走得比非法使用远得多…

否则无法形成良性循环,造成浪费。
cjdby_fans266 发表于 2015-8-26 23:35
大规模商用离开x86或者ARM指令集就是找死,

军用或者某些特别用途你可以用别的,
好像是花大价钱买了ARM授权
吓尿了!是不是俺看走眼了!
好像是花大价钱买了ARM授权
多大价钱啊?

没注册 发表于 2015-8-26 23:44
好像是花大价钱买了ARM授权


这个是对的,一来可以合法商用,二来也是可以获得正常的各种支持,少过不必要的弯路

另外,指令集是设计CPU的精髓,大师级的,您付钱是对他们的尊重

而我们实现当然也是不低的技术水平,但指令集才是核心中的核心,指令集定了,你CPU的架构基本七七八八
没注册 发表于 2015-8-26 23:44
好像是花大价钱买了ARM授权


这个是对的,一来可以合法商用,二来也是可以获得正常的各种支持,少过不必要的弯路

另外,指令集是设计CPU的精髓,大师级的,您付钱是对他们的尊重

而我们实现当然也是不低的技术水平,但指令集才是核心中的核心,指令集定了,你CPU的架构基本七七八八
这个火星地球处理器是ARM阵营的,和intel的X86处理器不一样吧,主要还是用安卓unix之类系统的程序,即使能用windows系统也是仿真方式用,和intel没可比性,就像问北斗和GPS哪种好一样,关键是应用,iphone6的处理器落后最新的安卓机处理器几代,苹果的程序编的好,速度一样比安卓机快
没注册 发表于 2015-8-26 23:44
好像是花大价钱买了ARM授权
有人说了价格很公道。
ARM官方的人也希望借飞腾能让ARM真正进入服务器市场
慢慢来,慌什么,继续努力
cjdby_fans266 发表于 2015-8-26 23:49
这个是对的,一来可以合法商用,二来也是可以获得正常的各种支持,少过不必要的弯路

另外,指令集是 ...
瞎说...指令集的规划很重要
但和微指令的核心架构两回事...
飞腾的团队研究高端CPU架构20多年。
用落后美国同级CPU2代的工艺,做出指标类似的CPU(安腾2)
后来还分出一支专门研究高性能通用DSP。
这样的资历,积累起自己微处理器的核心架构很容易。
ARMv8指令集只是对外的接口。
这个火星地球处理器是ARM阵营的,和intel的X86处理器不一样吧,主要还是用安卓unix之类系统的程序,即使能 ...
苹果那程序有和独到之处?为何安卓手机的程序搞不来?
这个火星地球处理器是ARM阵营的,和intel的X86处理器不一样吧,主要还是用安卓unix之类系统的程序,即使能 ...
这个cpu是面向服务器的  大部分x86处理器的服务器也是linux是主流  winserver分额很小

服务器领域没有Windows-x86壁垒

这个处理器作为服务器用非常优秀  服务器需要处理大量的连接线程和i/o请求  64个risc 小核心在这种领域显然非常合适

放到家用arm core小核心的单线程性能是拼不过x86这种大核心的
fengkoufei 发表于 2015-8-27 00:05
苹果那程序有和独到之处?为何安卓手机的程序搞不来?
苹果是为用户服务的

安卓是为运营商服务的, 运营商的要求刁钻许多, 所以安卓的结构实际上复杂许多

用户需要好用, 而运营商需要的是盈利, 好用不好运营商不是太在乎, 这也导致了安卓好用不起来
找钱 发表于 2015-8-26 10:54
这个火星地球处理器是ARM阵营的,和intel的X86处理器不一样吧,主要还是用安卓unix之类系统的程序,即使能 ...
那是老黄历了,Win10明确说要出ARM版。
对国企搞这玩意,不太看好
这个火星地球处理器是ARM阵营的,和intel的X86处理器不一样吧,主要还是用安卓unix之类系统的程序,即使能 ...
iphone6处理器落后?还几代,你也真敢说
台湾水师提督 发表于 2015-8-27 00:15
对国企搞这玩意,不太看好
这家企业是私企, 现在有信心了吧
fengkoufei 发表于 2015-8-26 23:46
多大价钱啊?
处理器授权:

ARM设计好一颗CPU或者GPU,然后授权卖给伙伴。买下它们后,你只能照着图纸实现,能发挥的地方不多,但是如何实现你就随便了,比如配置哪些模块、几个核心、多少缓存、多高频率、什么工艺、谁来代工等等。

ARM也会给你提供指导辅助,但如何将方案变成芯片、设定在什么规格,就看你的了。

处理器优化包/物理IP包授权(POP):

如果你想做ARM处理器,但无奈实力有限,那怎么办呢?ARM很贴心地准备了一系列的优化处理器设计方案,你可以根据自己的需要,挑选合适的直接拿过去用。

这样你可以快速搞出产品,代价也很低,当然能自由发挥的空间就小了,处理器类型、代工厂、工艺都是规定好的,比如Cortex-A12处理器,就要求你在台积电使用28nm HPM工艺生产,或者在GlobalFoundries使用28-SLP工艺。

ARM世界之旅(一):特殊的生存之道

架构/指令集授权:

如果你实力雄厚,可以仅购买ARM的架构/指令集(ARMv7、ARMv8),然后自己研究设计芯片,高通Krait、苹果Swift就是典型代表。

这些自行设计的处理器和ARM的是指令集兼容的,但并没有直接可比性,比如你不能说Krait 400、Cortex-A15谁更好更坏,它们是同一级别的不同实现方案而已。

ARM目前在全球拥有大约1000个授权合作、320家伙伴,但是敢于购买架构授权的,不过区区15家。
我研究生阶段做的就是众核互连架构,毕设是2维mesh结构16核互连架构,众核设计的核心是芯片内部核与核之间的路由器,这个我非常熟悉,亲自设计过一个支持实时性传输功能的路由器,并发表一篇一作国际会议论文
现在我在海思半导体,Balong芯片开发部,即给麒麟系列的SoC芯片搞基带处理内核,国内IC产业设计能力并不差,IC最有难度的还是制造,尤其先进的工艺几乎是空白,中芯国际也是用荷兰的设备,IBM的工艺指导


一直搞不懂,搞那么多核,都能用来算啥? 做一件事情,一个核不就够了嚒。

一直搞不懂,搞那么多核,都能用来算啥? 做一件事情,一个核不就够了嚒。
渔家公子 发表于 2015-8-27 00:47
一直搞不懂,搞那么多核,都能用来算啥?
你这么想, 每一秒钟腾讯有多少个QQ用户上线, 每个用户上线又要通知他的多少个QQ好友点亮头像, 这些活就需要茫茫多的核心来干

roadrunner 发表于 2015-8-27 00:52
你这么想, 每一秒钟腾讯有多少个QQ用户上线, 每个用户上线又要通知他的多少个QQ好友点亮头像, 这些活就需 ...


那不是服务器嚒,特殊的用途,和绝大多数应用没有关系。
roadrunner 发表于 2015-8-27 00:52
你这么想, 每一秒钟腾讯有多少个QQ用户上线, 每个用户上线又要通知他的多少个QQ好友点亮头像, 这些活就需 ...


那不是服务器嚒,特殊的用途,和绝大多数应用没有关系。
渔家公子 发表于 2015-8-27 00:53
那不是服务器嚒,和家用的没关系。
对, 这个CPU和家用没关系

和家用有很大关系的就是楼上那位搞的麒麟CPU
roadrunner 发表于 2015-8-27 00:56
对, 这个CPU和家用没关系

和家用有很大关系的就是楼上那位搞的麒麟CPU

麒麟不是以前从美帝那里弄来的操作系统嚒,肿么变硬件了?能否科普一下?
找钱 发表于 2015-8-26 23:54
这个火星地球处理器是ARM阵营的,和intel的X86处理器不一样吧,主要还是用安卓unix之类系统的程序,即使能 ...
别开玩笑。。苹果优化做的好那就是个幌子,苹果堆硬件比安卓狠多了,封闭系统支持下的架构授权,单核最强王者,而在移动端上,单核强劲的优势在于实际使用中能保持高性能还省电,比IP CORE厂商的X核科学的多,也好用的多
bitboy22 发表于 2015-8-27 00:24
处理器授权:

ARM设计好一颗CPU或者GPU,然后授权卖给伙伴。买下它们后,你只能照着图纸实现,能发挥 ...
如果做移动就三家,苹果,迈威和高通
高通暂时放弃架构设计了,现在用cortex了
迈威长年没有新品,貌似最近搞了个,好不好等应用再说
剩下的就是ARM背后股东之一的苹果
渔家公子 发表于 2015-8-27 00:59
麒麟不是以前从美帝那里弄来的操作系统嚒,肿么变硬件了?能否科普一下?
麒麟这名字人人可以用

CPU的麒麟是海思半导体研制的, 是华为的御用CPU, 大量使用在华为手机上

这种CPU如果用在平板电脑或者笔记本上, 承担office类上网邮件qq这类应用不成问题, 游戏娱乐也不成问题。就是干不了设计师或工程师的活而已

如果一定要在日常应用消灭外国CPU, 麒麟CPU是最靠谱的选择
现在我在海思半导体,Balong芯片开发部,即给麒麟系列的SoC芯片搞基带处理内核,国内IC产业设计能力并不差 ...
有时间请科普一下咱们的光刻机水平吧
大规模商用离开x86或者ARM指令集就是找死,

军用或者某些特别用途你可以用别的,

文中开口闭口ARM阵营,估计应该是得到授权的。
苹果那程序有和独到之处?为何安卓手机的程序搞不来?
不用考虑杂七杂八的兼容性支持
这个火星地球处理器是ARM阵营的,和intel的X86处理器不一样吧,主要还是用安卓unix之类系统的程序,即使能 ...
苹果A8落后安卓阵营的处理器好几代?你确定不是在逗我?论图形性能(GPU),苹果至少领先同期安卓阵营20%;CPU方面,苹果比安卓提早了一年多上64位,别看苹果才双核,安卓都八核了,苹果单线程比安卓阵营强一大截,八核有什么用?实际使用一般只有两三个核心工作,其它都在休眠,安卓的大小核只是为了省电,低负载调用小核,游戏之类的高负载才用大核(A57、A15之类的大核很费电,A53 A7这样的小核省电)
arm 芯片面积居然能做到这么大………
苹果A8落后安卓阵营的处理器好几代?你确定不是在逗我?论图形性能(GPU),苹果至少领先同期安卓阵营20% ...
也不是,苹果的soc,自从告别了三星,A5 6 7 8一路走来,一直都性能强大是没错,安卓阵营以前的性能是不太好,但是现在的新处理器,无论是14nm的黑科技还是A57的公版核心都已经足够强大甚至在某些方面超越了苹果的A8,距离A8x的差距也在缩小,当然这只是单纯的说性能,发热那就不说了…