国产龙芯究竟水平如何?

来源:百度文库 编辑:超级军网 时间:2024/05/04 17:38:38
     谈到“中国芯”,很多人第一个反应就会是龙芯。
自2000年开始研发到现在,龙芯已经有十五年的历史。虽然媒体不时会报道一些关于龙芯的消息,但由于市面上难以见到实物,外界对它的了解实在少得可怜。从立项开始,龙芯的研发单位中科院计算所就立志要做到世界一流水平的CPU;那么在2015年的今天,他们的产品究竟达到了什么水平呢?
我们先了解一些背景知识:龙芯是中科院计算所龙芯项目组研发,兼容MIPS指令集,具备完全自主知识产权的CPU系列。龙芯分1号、2号、3号三大产品线,分别对应超低功耗嵌入式芯片、低功耗SoC与主流PC、服务器CPU几大目标市场。目前代表龙芯最强水平的型号是龙芯3B-1500 CPU,有8个核心,32nm制造工艺,主频1.2GHZ;其次是四核心的龙芯3A 1.2GHZ。
因为使用的MIPS指令集与主流的x86、ARM不同,龙芯平台无法直接运行大多数常见的性能测试集;加上产品没有大量上市、用户稀少等原因,媒体、评测机构不太容易了解它的实际性能表现。所幸计算所公开了一些内部性能测试数据,我们得以从中分析龙芯的实力。
计算所使用的测试软件是专业领域常用的跨平台测试集SPEC CPU 2000。很多主流CPU都有SPEC跑分成绩可查,为我们的对比带来了便利。
首先我们来看看SPEC_int测试。这项测试考察CPU的单线程整数运算能力,关系到一般用户常用应用的性能表现。参与对比的是龙芯3B-1500 1.2GHZ、Apple A8 1.4GHZ、ARM Cortex A57 1.7GHZ和Intel Core i7 4770 4GHZ。
龙芯的表现相当凄惨,成绩只有A57的一半多点。换句话说在常见的单线程整数应用中,主流旗舰手机都可以轻松秒杀龙芯3B。
接着是多线程测试SPEC_int rate。计算所只提供了四核心版本的龙芯3A的多核测试分数,我们找到了一款老版四核i7 965 3.2G的成绩来做比较。
Core i7 965的主频不到龙芯3A的3倍,但是多线程整数性能是后者7倍多。现在主流的新一代Core系列CPU的性能更强,可见龙芯的差距多大。就算8核心的龙芯3B的性能达到3A的两倍,也远远不及主流的PC CPU。
SPEC测试离我们普通用户还是比较远,而且这种测试中CPU厂商可以手动调节测试代码来优化性能,类似的优化手段却不一定能对主流应用生效。在计算所的一篇论文中我们找到了龙芯3A运行常见的JS测试Sunspider的成绩,来看看它和主流设备差距多大:
结果十分惊人:龙芯的性能只有iPhone 6使用的A8芯片的十分之一不到。
光谈性能是不够的,芯片的功耗也是一项重要指标。计算所给出了一项数据:8核心、32nm工艺的龙芯3B典型功耗约30w。相比其孱弱的性能,30w的功率实在显得太高了。
现在的龙芯是什么能耐,想必诸位已经心里有数了。面向服务器开发的龙芯3B实际表现还不如主流手机,这就是计算所面对的残酷现实。目前的龙芯产品在主流市场可以说毫无竞争力,所谓取代进口芯片更是痴心妄想。
所幸龙芯的研发单位已经意识到了自家产品与对手的巨大差距,并在努力追赶。根据计算所的公开信息,性能提升数倍的下一代龙芯最快将于年底面世,预计至少达到AMD的技术水平。如果计划能按时完成,基于龙芯核心的PC就可以满足党政机关的基本办公需求,开始在政府单位大面积推广。这对龙芯来说是非常诱人的前景。
当然,未来龙芯能做出什么成绩完全取决于他们有多强的实力。过去龙芯项目组总是喜欢吹牛、好高骛远,结果实际产品表现极差,惹人笑话。如果计算所扔掉不切实际的幻想,踏实做事,龙芯还是可以在市场上分一杯羹的;否则它只会像过去那些失败的国产品牌一样走入历史被人遗忘,后人提起来也不过是茶余饭后的谈资罢了。http://www.leiphone.com/news/201504/aCIGktK8BJgon9BV.html
     谈到“中国芯”,很多人第一个反应就会是龙芯。
自2000年开始研发到现在,龙芯已经有十五年的历史。虽然媒体不时会报道一些关于龙芯的消息,但由于市面上难以见到实物,外界对它的了解实在少得可怜。从立项开始,龙芯的研发单位中科院计算所就立志要做到世界一流水平的CPU;那么在2015年的今天,他们的产品究竟达到了什么水平呢?
我们先了解一些背景知识:龙芯是中科院计算所龙芯项目组研发,兼容MIPS指令集,具备完全自主知识产权的CPU系列。龙芯分1号、2号、3号三大产品线,分别对应超低功耗嵌入式芯片、低功耗SoC与主流PC、服务器CPU几大目标市场。目前代表龙芯最强水平的型号是龙芯3B-1500 CPU,有8个核心,32nm制造工艺,主频1.2GHZ;其次是四核心的龙芯3A 1.2GHZ。
因为使用的MIPS指令集与主流的x86、ARM不同,龙芯平台无法直接运行大多数常见的性能测试集;加上产品没有大量上市、用户稀少等原因,媒体、评测机构不太容易了解它的实际性能表现。所幸计算所公开了一些内部性能测试数据,我们得以从中分析龙芯的实力。
计算所使用的测试软件是专业领域常用的跨平台测试集SPEC CPU 2000。很多主流CPU都有SPEC跑分成绩可查,为我们的对比带来了便利。
首先我们来看看SPEC_int测试。这项测试考察CPU的单线程整数运算能力,关系到一般用户常用应用的性能表现。参与对比的是龙芯3B-1500 1.2GHZ、Apple A8 1.4GHZ、ARM Cortex A57 1.7GHZ和Intel Core i7 4770 4GHZ。
龙芯的表现相当凄惨,成绩只有A57的一半多点。换句话说在常见的单线程整数应用中,主流旗舰手机都可以轻松秒杀龙芯3B。
接着是多线程测试SPEC_int rate。计算所只提供了四核心版本的龙芯3A的多核测试分数,我们找到了一款老版四核i7 965 3.2G的成绩来做比较。
Core i7 965的主频不到龙芯3A的3倍,但是多线程整数性能是后者7倍多。现在主流的新一代Core系列CPU的性能更强,可见龙芯的差距多大。就算8核心的龙芯3B的性能达到3A的两倍,也远远不及主流的PC CPU。
SPEC测试离我们普通用户还是比较远,而且这种测试中CPU厂商可以手动调节测试代码来优化性能,类似的优化手段却不一定能对主流应用生效。在计算所的一篇论文中我们找到了龙芯3A运行常见的JS测试Sunspider的成绩,来看看它和主流设备差距多大:
结果十分惊人:龙芯的性能只有iPhone 6使用的A8芯片的十分之一不到。
光谈性能是不够的,芯片的功耗也是一项重要指标。计算所给出了一项数据:8核心、32nm工艺的龙芯3B典型功耗约30w。相比其孱弱的性能,30w的功率实在显得太高了。
现在的龙芯是什么能耐,想必诸位已经心里有数了。面向服务器开发的龙芯3B实际表现还不如主流手机,这就是计算所面对的残酷现实。目前的龙芯产品在主流市场可以说毫无竞争力,所谓取代进口芯片更是痴心妄想。
所幸龙芯的研发单位已经意识到了自家产品与对手的巨大差距,并在努力追赶。根据计算所的公开信息,性能提升数倍的下一代龙芯最快将于年底面世,预计至少达到AMD的技术水平。如果计划能按时完成,基于龙芯核心的PC就可以满足党政机关的基本办公需求,开始在政府单位大面积推广。这对龙芯来说是非常诱人的前景。
当然,未来龙芯能做出什么成绩完全取决于他们有多强的实力。过去龙芯项目组总是喜欢吹牛、好高骛远,结果实际产品表现极差,惹人笑话。如果计算所扔掉不切实际的幻想,踏实做事,龙芯还是可以在市场上分一杯羹的;否则它只会像过去那些失败的国产品牌一样走入历史被人遗忘,后人提起来也不过是茶余饭后的谈资罢了。http://www.leiphone.com/news/201504/aCIGktK8BJgon9BV.html
为啥不测龙芯擅长的浮点性能?这是有选择性地测试,抹黑龙芯。
为啥不测龙芯擅长的浮点性能?这是有选择性地测试,抹黑龙芯。
因为spec fp 2000测试中龙芯3b分数500,i7分数5500以上。
一口吃不成胖子,路要一步一步走。现在北斗军工等部门有了自己的龙芯,楼主你就算再转一万篇这样的帖子,也不能抹杀龙芯的功劳。
因为spec fp 2000测试中龙芯3b分数500,i7分数5500以上。
有本事拿龙芯跟赛扬比!
有本事拿龙芯跟赛扬比!
好啊,市面上最慢的移动版haswell核心1.4G赛扬跑spec fp也有2000分左右。
说说我个人的一些看法和所看到的:
1.龙芯还在低频低能的挣扎。加上剑走偏锋,生态链太弱了,看不到产业化的希望。
2.arm公司的授权IP和架构方式,收取的费用低,100-5000万美元之间,相对于intel垄断模式只卖CPU来说,天壤之别。
3.arm的生态链已经非常好了。
4.华为的arm授权的自主CPU已经可以和国外顶尖水平一较高地。
5.arm宣称cortex A15已经可以和X86一较高低。而arm最新的A72架构性能又比A15提升了3.5倍,而桌面应用领域是CPU性能最过剩的领域,所以高功耗高性能版本的arm CPU用在桌面领域性能完全不是问题。
如果国家能出政策支持走arm桌面化这条路,至少比龙芯更容易成功。而且手机平板笔记本融合已经是趋势,如果国内率先推动arm桌面化领域,将来能在这一领域占得先机。
因为spec fp 2000测试中龙芯3b分数500,i7分数5500以上。
虽然跑的是浮点,可没有用上3b的向量核心,别故意混淆。
虽然跑的是浮点,可没有用上3b的向量核心,别故意混淆。
能用上3b矢量核心的应用才几个?计算所自己都不把矢量浮点性能当回事了。下代龙芯3A的性能提升2-4倍,但新3A可没有那么宽的浮点单元。
说说我个人的一些看法和所看到的:
1.龙芯还在低频低能的挣扎。加上剑走偏锋,生态链太弱了,看不到产业化 ...
1,arm生态系虽好,可不适合龙芯,你没发现现在活下来的都有一堆通信专利?移动端arm龙芯根本挤不进去!
2,龙芯要搞自己的核心,arm的指令集授权价格不菲
3,华为的a53e勉强算自主吧,也不过中端罢了。
4,arm搞桌面,生态系比mips好不到哪里去,撑死用chrome拿安卓应用撑撑场面,可mips照样也可以。arm桌面完全看不出哪里比mips有优势了。。。
能用上3b矢量核心的应用才几个?计算所自己都不把矢量浮点性能当回事了。下代龙芯3A的性能提升2-4倍,但 ...
用途不同,i7和Xeon Phi的区别,你的意思是说Xeon Phi没用?
用途不同,i7和Xeon Phi的区别,你的意思是说Xeon Phi没用?
和Xeon Phi比是吧?嗯Xeon Phi浮点2T Flops,比不比了?
和Xeon Phi比是吧?嗯Xeon Phi浮点2T Flops,比不比了?
1,定位如此罢了,又不是要比性能。你故意混淆,还有理了?
2,请给Xeon Phi加上功耗,工艺。光光拿个浮点出来,怕是又要说不清楚。

wlm2012 发表于 2015-4-6 18:42
1,定位如此罢了,又不是要比性能。你故意混淆,还有理了?
2,请给Xeon Phi加上功耗,工艺。光光拿个浮 ...


龙芯3b出了办公电脑和服务器,你说它啥定位?既然计算所自己给它定位这样,别怪别人咯。
Xeon Phi是22nm,200w功耗带内存。问题是就算科学计算也不是只看理论性能的。龙芯那点内存带宽跑科学计算只会浪费浮点理论性能。
wlm2012 发表于 2015-4-6 18:42
1,定位如此罢了,又不是要比性能。你故意混淆,还有理了?
2,请给Xeon Phi加上功耗,工艺。光光拿个浮 ...


龙芯3b出了办公电脑和服务器,你说它啥定位?既然计算所自己给它定位这样,别怪别人咯。
Xeon Phi是22nm,200w功耗带内存。问题是就算科学计算也不是只看理论性能的。龙芯那点内存带宽跑科学计算只会浪费浮点理论性能。
听说arm架构没有mips好
听说arm架构没有mips好
不要听信莫名其妙的传言。
不要听信莫名其妙的传言。
好多大牛都这么说
龙芯3b出了办公电脑和服务器,你说它啥定位?既然计算所自己给它定位这样,别怪别人咯。
Xeon Phi是22 ...
出个办公电脑不过是计算所的无奈之举,服务器用上向量倒也可行,总不会有人买3b服务器回去跑通用的
另外,Xeon Phi的2t是单精度吧。
好多大牛都这么说
哪门子大牛,明摆着瞎扯。各个指令集如今已经没有性能的优劣之分,差别主要是生态。

wlm2012 发表于 2015-4-6 19:00
出个办公电脑不过是计算所的无奈之举,服务器用上向量倒也可行,总不会有人买3b服务器回去跑通用的
另外 ...


好像谁会买3b服务器回去跑科学计算似的。龙芯3b那些实际销售的产品都关了向量,开向量的基本就没实用化。那点内存带宽开向量有什么用?安慰剂么?

Xeon Phi是2T Flops单精度。不过比较理论值没意义。
wlm2012 发表于 2015-4-6 19:00
出个办公电脑不过是计算所的无奈之举,服务器用上向量倒也可行,总不会有人买3b服务器回去跑通用的
另外 ...


好像谁会买3b服务器回去跑科学计算似的。龙芯3b那些实际销售的产品都关了向量,开向量的基本就没实用化。那点内存带宽开向量有什么用?安慰剂么?

Xeon Phi是2T Flops单精度。不过比较理论值没意义。
好像谁会买3b服务器回去跑科学计算似的。龙芯3b那些实际销售的产品都关了向量,开向量的基本就没实用化 ...
我们现在看到评测的有服务器版的?家用版的关了向量是正常,服务器版的关了向量。。。我还不如插个手机上去。。。
我们现在看到评测的有服务器版的?家用版的关了向量是正常,服务器版的关了向量。。。我还不如插个手机上 ...

服务器要哪门子向量?SPEC fp测试受向量影响才多点?你怎么什么都不懂?

deam 发表于 2015-4-6 19:11
服服务器要哪门子向量?SPEC fp测试受向量影响才多点?你怎么什么都不懂?


服务器并行的不少,用不上向量?
难道你以为amd,nvida,intel产品个个都卖个科学院所了?
倒,那玩意要重新优化的,光拿gcc编译一下就能跑出好成绩,怕是nvida,amd,intel都要笑了。
deam 发表于 2015-4-6 19:11
服服务器要哪门子向量?SPEC fp测试受向量影响才多点?你怎么什么都不懂?


服务器并行的不少,用不上向量?
难道你以为amd,nvida,intel产品个个都卖个科学院所了?
倒,那玩意要重新优化的,光拿gcc编译一下就能跑出好成绩,怕是nvida,amd,intel都要笑了。
这东西只能一步一步来的,现在最起码可以自己造了。

中国首用“龙芯”发射北斗新星

http://news.xinhuanet.com/tech/2015-03/31/c_127642296.htm

其中,中央处理器首次使用中国造的 “龙芯”。

wlm2012 发表于 2015-4-6 19:15
倒,那玩意要重新优化的,光拿gcc编译一下就能跑出好成绩,怕是nvida,amd,intel都要笑了。


真不好意思,龙芯3b用自家LCC编译器开O3优化后是500分成绩,低频赛扬用gcc跑出来1500以上。

服务器的大部分应用和向量一点关系都没有,能用上向量的只有科学计算。所以虽然E7-8870的浮点性能只有同时代四核i7的一半多,但前者卖价是后者10倍以上。
wlm2012 发表于 2015-4-6 19:15
倒,那玩意要重新优化的,光拿gcc编译一下就能跑出好成绩,怕是nvida,amd,intel都要笑了。


真不好意思,龙芯3b用自家LCC编译器开O3优化后是500分成绩,低频赛扬用gcc跑出来1500以上。

服务器的大部分应用和向量一点关系都没有,能用上向量的只有科学计算。所以虽然E7-8870的浮点性能只有同时代四核i7的一半多,但前者卖价是后者10倍以上。

deam 发表于 2015-4-6 19:21
真不好意思,龙芯3b用自家LCC编译器开O3优化后是500分成绩,低频赛扬用gcc跑出来1500以上。


此优化非彼优化。。。。
你还是看看《Intel Xeon Phi协处理器高性能编程指南》,再来讨论。。。
你拿e7来和i7比价格,怎么不拿Xeon Phi和i7比价格?这能说明问题?
deam 发表于 2015-4-6 19:21
真不好意思,龙芯3b用自家LCC编译器开O3优化后是500分成绩,低频赛扬用gcc跑出来1500以上。


此优化非彼优化。。。。
你还是看看《Intel Xeon Phi协处理器高性能编程指南》,再来讨论。。。
你拿e7来和i7比价格,怎么不拿Xeon Phi和i7比价格?这能说明问题?

wlm2012 发表于 2015-4-6 19:25
此优化非彼优化。。。。
你还是看看《Intel Xeon Phi协处理器高性能编程指南》,再来讨论。。。


Xeon Phi?你要笑煞人么?请问全球这么多网站、数据库的服务器,哪台插了Xeon Phi了?阁下大能,给我在Phi上跑个S&P试试?
wlm2012 发表于 2015-4-6 19:25
此优化非彼优化。。。。
你还是看看《Intel Xeon Phi协处理器高性能编程指南》,再来讨论。。。


Xeon Phi?你要笑煞人么?请问全球这么多网站、数据库的服务器,哪台插了Xeon Phi了?阁下大能,给我在Phi上跑个S&P试试?
此优化非彼优化。。。。
你还是看看《Intel Xeon Phi协处理器高性能编程指南》,再来讨论。。。
你拿 ...
Xeon Phi标价倒是挺高,不过实际出货价每颗几百美元。xeon e7出货价6千美元,但浮点只有phi的几分之一。
至少北斗用了国产芯来自: iPhone客户端

shehuizhuyi80 发表于 2015-4-6 17:56
为啥不测龙芯擅长的浮点性能?这是有选择性地测试,抹黑龙芯。


龙芯3a   464架构是  2006年搞得

用  06  年的 65nm  龙芯比14-15年的
14-22  nm    的arm   x86?

何况3b访问问题    还有编译器  问题

明显是故意黑龙芯的

可能是因为  上北斗 出名了

买办  洋奴和他们的主子做不住了

这个帖子  微信  QQ  百度贴吧  各种论坛到处都是

要在舆论上扼杀龙芯
shehuizhuyi80 发表于 2015-4-6 17:56
为啥不测龙芯擅长的浮点性能?这是有选择性地测试,抹黑龙芯。


龙芯3a   464架构是  2006年搞得

用  06  年的 65nm  龙芯比14-15年的
14-22  nm    的arm   x86?

何况3b访问问题    还有编译器  问题

明显是故意黑龙芯的

可能是因为  上北斗 出名了

买办  洋奴和他们的主子做不住了

这个帖子  微信  QQ  百度贴吧  各种论坛到处都是

要在舆论上扼杀龙芯
Xeon Phi?你要笑煞人么?请问全球这么多网站、数据库的服务器,哪台插了Xeon Phi了?阁下大能,给我在 ...
HPC服务器,当然你要把这个一脚提出服务器,我也没办法。。。
HPC服务器,当然你要把这个一脚提出服务器,我也没办法。。。
你说的是服务器,HPC服务器只是服务器市场中极小一部分。而且即便是HPC也不是不看内存带宽的。Xeon Phi实际内存带宽200G/s,龙芯是1G/s,实际科学计算应用的差距差不多就是这个数量级。
Xeon Phi标价倒是挺高,不过实际出货价每颗几百美元。xeon e7出货价6千美元,但浮点只有phi的几分之一。
出货价低,有时候倒说明出货量高。。。。
龙芯3a   464架构是  2006年搞得

用  06  年的 65nm  龙芯比14-15年的

3b可是2012年的产品谢谢。
出货价低,有时候倒说明出货量高。。。。
您能别再自己臆想好不好?Xeon Phi大减价是为了清库存,因为实在没几个人买好不好?
你说的是服务器,HPC服务器只是服务器市场中极小一部分。而且即便是HPC也不是不看内存带宽的。Xeon Phi实 ...
3a内存带宽低,有测试有数据,老3b这数据我信,3b1500也是这个?
3a内存带宽低,有测试有数据,老3b这数据我信,3b1500也是这个?
是的就这么惨,你以为为啥3b测spec2000就那点分数?
您能别再自己臆想好不好?Xeon Phi大减价是为了清库存,因为实在没几个人买好不好?
intel每次大规模投入进行研发,每次都卖不出去,每次都大减价清仓,然后再投入大笔资金研发新系列?intel原来这么好人!?
阁下一席话,真让我如梦初醒。。。。
是的就这么惨,你以为为啥3b测spec2000就那点分数?
那是因为3b的通用核心就是gs464,要是能跑出高分,那才是见鬼了。
intel每次大规模投入进行研发,每次都卖不出去,每次都大减价清仓,然后再投入大笔资金研发新系列?intel ...
废话,Xeon Phi才做了两代,打开新市场本来就困难,亏本太正常了。人家又不在乎亏的这点小钱。