40纳米1G主频龙芯3A2000在CPU2000分值出笼:浮点1125, ...

来源:百度文库 编辑:超级军网 时间:2024/04/26 07:21:07


据悉,基于GS464E架构的龙芯3A2000/3B2000已经完成流片并于2015年4月回到龙芯公司,根据龙芯公司的说法,龙芯3A2000为单路4核的桌面版本,龙芯3B2000为支持双路8核以及四路16核的服务器版本。龙芯公司目前提供了对龙芯3A2000的部分实测数据:



龙芯3A2000/3B2000的设计版图



架构

SPEC CPU定点

SPEC CPU 浮点

龙芯3A1000(1.0G)

GS464

373

298

龙芯3A2000(1.0G)

GS464E

762

1125

性能提升



104%

278%

表3 龙芯3A2000与3A1000的SPEC CPU2000测试对比



Copy

Scale

Add

Triad

龙芯3A1000(DDR3-600)

709

694

890

875

龙芯3A2000(DDR3-1333)

12306

12234

12194

12140

性能提升

1636%

1663%

      1270%

1287%

表4 龙芯3A2000与3A1000的内存带宽测试对比

简单的科普一下,第一个表采用了SPEC CPU2000测试作为对比,SPEC CPU 2000是国际上通用的CPU性能测试程序,其数据对CPU计算性能有很大的参考性。可以看到无论是定点分值还是浮点分值,3A2000比3A1000都有了至少一倍甚至二倍以上的提高。第二个表以内存带宽测试作为对比,在实际程序运行中,光有CPU的计算能力是不够的,还要有足够的内存带宽作为支撑。从测试结果看,龙芯3A 2000的内存带宽实测性能在各方面普遍要比龙芯3A1000的内存带宽实测性能提升了十多倍。根据龙芯公司技术工程师的说法,上一代龙芯3A产品在设计上由于经验不足考虑不周全,导致内存带宽上表现太弱,是上一代3A产品的主要瓶颈。由此带来的不足使得用户体验表现较差。而现在LS2000解决了这个问题,在主频没有提升的情况下,用户体验有大跨步的提升,虽然和主流Intel产品还有差距,但是在微处理器结构这一方面,这个差距已经越来越小。



    为了与目前市面上主流CPU的架构设计进行一个归一化的比较,龙芯公司给出了按照SPEC/GHz分数作为参考分值对不同主流处理器架构的性能差异进行了比较,见上图所示。从图上很容易的可以看出,GS464E架构已经接近intel和AMD的现在市场上的主流架构性能了,SPEC CPU性能与Intel core i3-550和AMD fx-8320基本相当,与Intel core i5略有差距,已经明显强于Intel Atom架构、威盛Nano处理器架构和 ARM最新的64位A57架构。并且LS3A2000尚未得到编译器充分优化,已经可以跑出这样成绩的同频效率。

结论:正如龙芯公司自己所说的那样,龙芯产品在过去几年的市场检验中发现了自己的不足,并找到了瓶颈问题,这次GS464E的发布,从数据上看比上一代GS464核的确有了大幅度的提升。虽然龙芯的主频还要比intel/AMD的芯片差2倍以上,整体性能依旧落后不少,但同频性能接近I5-2300已经证明新架构的实力的确强悍。LS3A2000只是GS464E的第一版产品,制造工艺仍旧是40nm,主频仍然是1GHz左右,个人认为其有一定的验证性质,但是性能已经较上一代3A1000处理器有了成倍的提高。在不久的将来,随着采用更高的28nm工艺的处理器推出,龙芯就该有资格尝试和Intel的商用主流CPU一较高下了。

http://www.linuxidc.com/Linux/2015-05/118009.htm

据悉,基于GS464E架构的龙芯3A2000/3B2000已经完成流片并于2015年4月回到龙芯公司,根据龙芯公司的说法,龙芯3A2000为单路4核的桌面版本,龙芯3B2000为支持双路8核以及四路16核的服务器版本。龙芯公司目前提供了对龙芯3A2000的部分实测数据:



龙芯3A2000/3B2000的设计版图



架构

SPEC CPU定点

SPEC CPU 浮点

龙芯3A1000(1.0G)

GS464

373

298

龙芯3A2000(1.0G)

GS464E

762

1125

性能提升



104%

278%

表3 龙芯3A2000与3A1000的SPEC CPU2000测试对比



Copy

Scale

Add

Triad

龙芯3A1000(DDR3-600)

709

694

890

875

龙芯3A2000(DDR3-1333)

12306

12234

12194

12140

性能提升

1636%

1663%

      1270%

1287%

表4 龙芯3A2000与3A1000的内存带宽测试对比

简单的科普一下,第一个表采用了SPEC CPU2000测试作为对比,SPEC CPU 2000是国际上通用的CPU性能测试程序,其数据对CPU计算性能有很大的参考性。可以看到无论是定点分值还是浮点分值,3A2000比3A1000都有了至少一倍甚至二倍以上的提高。第二个表以内存带宽测试作为对比,在实际程序运行中,光有CPU的计算能力是不够的,还要有足够的内存带宽作为支撑。从测试结果看,龙芯3A 2000的内存带宽实测性能在各方面普遍要比龙芯3A1000的内存带宽实测性能提升了十多倍。根据龙芯公司技术工程师的说法,上一代龙芯3A产品在设计上由于经验不足考虑不周全,导致内存带宽上表现太弱,是上一代3A产品的主要瓶颈。由此带来的不足使得用户体验表现较差。而现在LS2000解决了这个问题,在主频没有提升的情况下,用户体验有大跨步的提升,虽然和主流Intel产品还有差距,但是在微处理器结构这一方面,这个差距已经越来越小。



    为了与目前市面上主流CPU的架构设计进行一个归一化的比较,龙芯公司给出了按照SPEC/GHz分数作为参考分值对不同主流处理器架构的性能差异进行了比较,见上图所示。从图上很容易的可以看出,GS464E架构已经接近intel和AMD的现在市场上的主流架构性能了,SPEC CPU性能与Intel core i3-550和AMD fx-8320基本相当,与Intel core i5略有差距,已经明显强于Intel Atom架构、威盛Nano处理器架构和 ARM最新的64位A57架构。并且LS3A2000尚未得到编译器充分优化,已经可以跑出这样成绩的同频效率。

结论:正如龙芯公司自己所说的那样,龙芯产品在过去几年的市场检验中发现了自己的不足,并找到了瓶颈问题,这次GS464E的发布,从数据上看比上一代GS464核的确有了大幅度的提升。虽然龙芯的主频还要比intel/AMD的芯片差2倍以上,整体性能依旧落后不少,但同频性能接近I5-2300已经证明新架构的实力的确强悍。LS3A2000只是GS464E的第一版产品,制造工艺仍旧是40nm,主频仍然是1GHz左右,个人认为其有一定的验证性质,但是性能已经较上一代3A1000处理器有了成倍的提高。在不久的将来,随着采用更高的28nm工艺的处理器推出,龙芯就该有资格尝试和Intel的商用主流CPU一较高下了。

http://www.linuxidc.com/Linux/2015-05/118009.htm
3a1500和3a2000
合体了?

再接再厉

感觉有点像intel当年搞出酷睿的感觉
喝彩  整数这个水平 桌面级真的就够用了
分支预测水平
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?

整点运算 和I3 550 差距都有50分左右 额

“性能与Intel core i3-550和AMD fx-8320基本相当,与Intel core i5略有差距”  下的不够严谨啊

scxtx 发表于 2015-5-26 17:08
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?

整点运算 和I3 550 差距都有50分左右 额


同频效率来说已经很屌了

至于频率 一个测试片而已

年底28nm 2ghz能上市的话 可以和带U结尾的笔记本i5比性能了

另一个方面 以龙芯以往的产品来做参照  上LCC编译器的话 有个10%~15%的提升是可能的
scxtx 发表于 2015-5-26 17:08
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?

整点运算 和I3 550 差距都有50分左右 额


同频效率来说已经很屌了

至于频率 一个测试片而已

年底28nm 2ghz能上市的话 可以和带U结尾的笔记本i5比性能了

另一个方面 以龙芯以往的产品来做参照  上LCC编译器的话 有个10%~15%的提升是可能的
scxtx 发表于 2015-5-26 17:08
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?

整点运算 和I3 550 差距都有50分左右 额
所有数据的编译环境没有说明。。。。。。所以数据有点乱
ayanamei 发表于 2015-5-26 17:13
同频效率来说已经很屌了

至于频率 一个测试片而已
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。老胡前天可是再说跟IVY相当又是吹牛逼?
花落庭院 发表于 2015-5-26 17:17
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...
文章称编译器没有充分优化
意思是GCC直接编译跑的
或者说龙芯还没有拿出对应般的LCC 都是可能的

不管怎么说 这个应该还有提升空间

ayanamei 发表于 2015-5-26 17:13
同频效率来说已经很屌了

至于频率 一个测试片而已


http://www.spec.org/cpu2000/resu ... 20060821-07081.html

1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。

按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
ayanamei 发表于 2015-5-26 17:13
同频效率来说已经很屌了

至于频率 一个测试片而已


http://www.spec.org/cpu2000/resu ... 20060821-07081.html

1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。

按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?


http://www.spec.org/cpu2000/resu ... 20060821-07081.html

1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。

按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?

http://www.spec.org/cpu2000/resu ... 20060821-07081.html

1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。

按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?

花落庭院 发表于 2015-5-26 17:17
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...


http://www.spec.org/cpu2000/resu ... 20060821-07081.html

1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。

按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
花落庭院 发表于 2015-5-26 17:17
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...


http://www.spec.org/cpu2000/resu ... 20060821-07081.html

1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。

按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?


http://www.spec.org/cpu2000/resu ... 20060705-06412.html

同样的,E6300的CFP 2000的成绩是1978,换算为1060/Ghz,按照文中给的数据,i3 550也就刚1000/Ghz,莫非i3对core 2一代没有任何改进?

http://www.spec.org/cpu2000/resu ... 20060705-06412.html

同样的,E6300的CFP 2000的成绩是1978,换算为1060/Ghz,按照文中给的数据,i3 550也就刚1000/Ghz,莫非i3对core 2一代没有任何改进?
必须指出的上述E6300是2006年6月测试的,因此应该是65nm版的老E6300,也就是第一代的core 2(conore)。
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...
应该是都在GCC下编译
===
架构SPEC CPU定点SPEC CPU 浮点龙芯3A1000(1.0G)GS464373298龙芯3A2000(1.0G)GS464E7621125性能提升104%278%

并且LS3A2000尚未得到编译器充分优化,已经可以跑出这样成绩的同频效率。
另外A57在gcc下的结果,按照报道,CINT 2000是1250/1.7Ghz,也就是735/Ghz,楼主的文章却给出600/Ghz的结果,不知道是画错了还是故意的。
同频效率来说已经很屌了

至于频率 一个测试片而已

3A的GCC和龙芯自己的编译器差距在50%-60%



Compiler:         Intel C++ Compiler 9.1 for IA32

这个应该是关键
spec2000本来就很吃编译器  

原文这个应该用的是GCC  具体版本也不清楚 当然这是猜测 还要等以后更多信息
konming 发表于 2015-5-26 17:40
http://www.spec.org/cpu2000/resu ... 20060821-07081.html

1.86Ghz的Core 2 E63 ...


Compiler:         Intel C++ Compiler 9.1 for IA32

这个应该是关键
spec2000本来就很吃编译器  

原文这个应该用的是GCC  具体版本也不清楚 当然这是猜测 还要等以后更多信息
http://www.spec.org/cpu2000/results/res2006q3/cpu2000-20060821-07081.html

1.86Ghz的Core 2 E63 ...
看我7楼说明
应该是都在GCC下编译
===
架构SPEC CPU定点SPEC CPU 浮点龙芯3A1000(1.0G)GS464373298龙芯3A2000(1. ...
有两种可能,1,老胡厚颜无耻,2是确实有编译器问题,排除编译器问题,跟IVY相当?????
一直有个疑问,为什么不测2006?
一直有个疑问,为什么不测2006?
2006只是加大访存压力。。。。。。
花落庭院 发表于 2015-5-26 18:05
有两种可能,1,老胡厚颜无耻,2是确实有编译器问题,排除编译器问题,跟IVY相当?????
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线上如何再去排除编译器的问题,莫非龙芯用自己特别优化的编译器而ivy不准用优化编译器相当?
公司里面各种数据都是2006,每次见到2000都是龙芯
华府小厮 发表于 2015-5-26 18:07
一直有个疑问,为什么不测2006?
2006有大量的当前数据,2000在spec上最多到一代core 2的数据。
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线 ...
GCC编译器对龙芯支持版本比较低吧,
花落庭院 发表于 2015-5-26 18:10
GCC编译器对龙芯支持版本比较低吧,
那么a57的结果是怎么回事呢?
konming 发表于 2015-5-26 18:09
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线 ...

几乎可以肯定 这个成绩不是LCC编译结果   不然不会专门说没有优化编译

如果其他成绩是GCC某个版本 就是意思是通用编译器一起测试
这个i3成绩和你看到core2成绩差距的来源 应该就是编译器造成的
core2那个是icc 9.1 for 32bit环境
konming 发表于 2015-5-26 18:11
那么a57的结果是怎么回事呢?
a57的结果你指什么问题?
2006只是加大访存压力。。。。。。
所以呢?不是应该测试2006更合理些么?
这样说来intel这十年,ipc进步也是惨不忍睹。。。Ivy。。。
a57的结果你指什么问题?
看新龙芯的分支预测的结果还是非常震撼
所以呢?不是应该测试2006更合理些么?
嗯,假如访存没有问题,结果应该类似
花落庭院 发表于 2015-5-26 18:16
看新龙芯的分支预测的结果还是非常震撼
这个tm碉堡了=。=
这个tm碉堡了=。=
分支预测正确率是流水线效率一个关键指标
ayanamei 发表于 2015-5-26 18:13
a57的结果你指什么问题?
看16楼,字数补丁。
至少比上一代还是有了非常明显的提升的,没有必要着急去和intel比,只要和自己比不断的符合摩尔定律的性能提升就足够了
另外A57在gcc下的结果,按照报道,CINT 2000是1250/1.7Ghz,也就是735/Ghz,楼主的文章却给出600/Ghz的结果 ...
笑看A8六发只比A57三发多50%性能
同样老黄的A15PPT也是分数暴表
比同频性能就是给自己脸上贴金,就是耍流氓!
比同频性能就是给自己脸上贴金,就是耍流氓!
胡伟武也只能在前端设计上赶超intel,后端由于是靠EDA工具设计的,准确的说,靠美国新思科技公司设计工具,半定制,主频上不去,一个机器优化,一个人工优化,是比不赢的,