40纳米1G主频龙芯3A2000在CPU2000分值出笼:浮点1125, ...
来源:百度文库 编辑:超级军网 时间:2024/04/26 07:21:07
据悉,基于GS464E架构的龙芯3A2000/3B2000已经完成流片并于2015年4月回到龙芯公司,根据龙芯公司的说法,龙芯3A2000为单路4核的桌面版本,龙芯3B2000为支持双路8核以及四路16核的服务器版本。龙芯公司目前提供了对龙芯3A2000的部分实测数据:
龙芯3A2000/3B2000的设计版图
架构
SPEC CPU定点
SPEC CPU 浮点
龙芯3A1000(1.0G)
GS464
373
298
龙芯3A2000(1.0G)
GS464E
762
1125
性能提升
104%
278%
表3 龙芯3A2000与3A1000的SPEC CPU2000测试对比
Copy
Scale
Add
Triad
龙芯3A1000(DDR3-600)
709
694
890
875
龙芯3A2000(DDR3-1333)
12306
12234
12194
12140
性能提升
1636%
1663%
1270%
1287%
表4 龙芯3A2000与3A1000的内存带宽测试对比
简单的科普一下,第一个表采用了SPEC CPU2000测试作为对比,SPEC CPU 2000是国际上通用的CPU性能测试程序,其数据对CPU计算性能有很大的参考性。可以看到无论是定点分值还是浮点分值,3A2000比3A1000都有了至少一倍甚至二倍以上的提高。第二个表以内存带宽测试作为对比,在实际程序运行中,光有CPU的计算能力是不够的,还要有足够的内存带宽作为支撑。从测试结果看,龙芯3A 2000的内存带宽实测性能在各方面普遍要比龙芯3A1000的内存带宽实测性能提升了十多倍。根据龙芯公司技术工程师的说法,上一代龙芯3A产品在设计上由于经验不足考虑不周全,导致内存带宽上表现太弱,是上一代3A产品的主要瓶颈。由此带来的不足使得用户体验表现较差。而现在LS2000解决了这个问题,在主频没有提升的情况下,用户体验有大跨步的提升,虽然和主流Intel产品还有差距,但是在微处理器结构这一方面,这个差距已经越来越小。
为了与目前市面上主流CPU的架构设计进行一个归一化的比较,龙芯公司给出了按照SPEC/GHz分数作为参考分值对不同主流处理器架构的性能差异进行了比较,见上图所示。从图上很容易的可以看出,GS464E架构已经接近intel和AMD的现在市场上的主流架构性能了,SPEC CPU性能与Intel core i3-550和AMD fx-8320基本相当,与Intel core i5略有差距,已经明显强于Intel Atom架构、威盛Nano处理器架构和 ARM最新的64位A57架构。并且LS3A2000尚未得到编译器充分优化,已经可以跑出这样成绩的同频效率。
结论:正如龙芯公司自己所说的那样,龙芯产品在过去几年的市场检验中发现了自己的不足,并找到了瓶颈问题,这次GS464E的发布,从数据上看比上一代GS464核的确有了大幅度的提升。虽然龙芯的主频还要比intel/AMD的芯片差2倍以上,整体性能依旧落后不少,但同频性能接近I5-2300已经证明新架构的实力的确强悍。LS3A2000只是GS464E的第一版产品,制造工艺仍旧是40nm,主频仍然是1GHz左右,个人认为其有一定的验证性质,但是性能已经较上一代3A1000处理器有了成倍的提高。在不久的将来,随着采用更高的28nm工艺的处理器推出,龙芯就该有资格尝试和Intel的商用主流CPU一较高下了。
http://www.linuxidc.com/Linux/2015-05/118009.htm
据悉,基于GS464E架构的龙芯3A2000/3B2000已经完成流片并于2015年4月回到龙芯公司,根据龙芯公司的说法,龙芯3A2000为单路4核的桌面版本,龙芯3B2000为支持双路8核以及四路16核的服务器版本。龙芯公司目前提供了对龙芯3A2000的部分实测数据:
龙芯3A2000/3B2000的设计版图
架构
SPEC CPU定点
SPEC CPU 浮点
龙芯3A1000(1.0G)
GS464
373
298
龙芯3A2000(1.0G)
GS464E
762
1125
性能提升
104%
278%
表3 龙芯3A2000与3A1000的SPEC CPU2000测试对比
Copy
Scale
Add
Triad
龙芯3A1000(DDR3-600)
709
694
890
875
龙芯3A2000(DDR3-1333)
12306
12234
12194
12140
性能提升
1636%
1663%
1270%
1287%
表4 龙芯3A2000与3A1000的内存带宽测试对比
简单的科普一下,第一个表采用了SPEC CPU2000测试作为对比,SPEC CPU 2000是国际上通用的CPU性能测试程序,其数据对CPU计算性能有很大的参考性。可以看到无论是定点分值还是浮点分值,3A2000比3A1000都有了至少一倍甚至二倍以上的提高。第二个表以内存带宽测试作为对比,在实际程序运行中,光有CPU的计算能力是不够的,还要有足够的内存带宽作为支撑。从测试结果看,龙芯3A 2000的内存带宽实测性能在各方面普遍要比龙芯3A1000的内存带宽实测性能提升了十多倍。根据龙芯公司技术工程师的说法,上一代龙芯3A产品在设计上由于经验不足考虑不周全,导致内存带宽上表现太弱,是上一代3A产品的主要瓶颈。由此带来的不足使得用户体验表现较差。而现在LS2000解决了这个问题,在主频没有提升的情况下,用户体验有大跨步的提升,虽然和主流Intel产品还有差距,但是在微处理器结构这一方面,这个差距已经越来越小。
为了与目前市面上主流CPU的架构设计进行一个归一化的比较,龙芯公司给出了按照SPEC/GHz分数作为参考分值对不同主流处理器架构的性能差异进行了比较,见上图所示。从图上很容易的可以看出,GS464E架构已经接近intel和AMD的现在市场上的主流架构性能了,SPEC CPU性能与Intel core i3-550和AMD fx-8320基本相当,与Intel core i5略有差距,已经明显强于Intel Atom架构、威盛Nano处理器架构和 ARM最新的64位A57架构。并且LS3A2000尚未得到编译器充分优化,已经可以跑出这样成绩的同频效率。
结论:正如龙芯公司自己所说的那样,龙芯产品在过去几年的市场检验中发现了自己的不足,并找到了瓶颈问题,这次GS464E的发布,从数据上看比上一代GS464核的确有了大幅度的提升。虽然龙芯的主频还要比intel/AMD的芯片差2倍以上,整体性能依旧落后不少,但同频性能接近I5-2300已经证明新架构的实力的确强悍。LS3A2000只是GS464E的第一版产品,制造工艺仍旧是40nm,主频仍然是1GHz左右,个人认为其有一定的验证性质,但是性能已经较上一代3A1000处理器有了成倍的提高。在不久的将来,随着采用更高的28nm工艺的处理器推出,龙芯就该有资格尝试和Intel的商用主流CPU一较高下了。
http://www.linuxidc.com/Linux/2015-05/118009.htm
3a1500和3a2000
合体了?
再接再厉
感觉有点像intel当年搞出酷睿的感觉
合体了?
再接再厉
感觉有点像intel当年搞出酷睿的感觉
喝彩 整数这个水平 桌面级真的就够用了
分支预测水平
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?
整点运算 和I3 550 差距都有50分左右 额
“性能与Intel core i3-550和AMD fx-8320基本相当,与Intel core i5略有差距” 下的不够严谨啊
整点运算 和I3 550 差距都有50分左右 额
“性能与Intel core i3-550和AMD fx-8320基本相当,与Intel core i5略有差距” 下的不够严谨啊
scxtx 发表于 2015-5-26 17:08
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?
整点运算 和I3 550 差距都有50分左右 额
同频效率来说已经很屌了
至于频率 一个测试片而已
年底28nm 2ghz能上市的话 可以和带U结尾的笔记本i5比性能了
另一个方面 以龙芯以往的产品来做参照 上LCC编译器的话 有个10%~15%的提升是可能的
scxtx 发表于 2015-5-26 17:08
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?
整点运算 和I3 550 差距都有50分左右 额
同频效率来说已经很屌了
至于频率 一个测试片而已
年底28nm 2ghz能上市的话 可以和带U结尾的笔记本i5比性能了
另一个方面 以龙芯以往的产品来做参照 上LCC编译器的话 有个10%~15%的提升是可能的
scxtx 发表于 2015-5-26 17:08
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?
整点运算 和I3 550 差距都有50分左右 额
所有数据的编译环境没有说明。。。。。。所以数据有点乱
问下 原帖 图片 整数和浮点数值 条形图 是同主频的结果吧?
整点运算 和I3 550 差距都有50分左右 额
所有数据的编译环境没有说明。。。。。。所以数据有点乱
ayanamei 发表于 2015-5-26 17:13
同频效率来说已经很屌了
至于频率 一个测试片而已
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。老胡前天可是再说跟IVY相当又是吹牛逼?
同频效率来说已经很屌了
至于频率 一个测试片而已
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。老胡前天可是再说跟IVY相当又是吹牛逼?
花落庭院 发表于 2015-5-26 17:17
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...
文章称编译器没有充分优化
意思是GCC直接编译跑的
或者说龙芯还没有拿出对应般的LCC 都是可能的
不管怎么说 这个应该还有提升空间
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...
文章称编译器没有充分优化
意思是GCC直接编译跑的
或者说龙芯还没有拿出对应般的LCC 都是可能的
不管怎么说 这个应该还有提升空间
ayanamei 发表于 2015-5-26 17:13
同频效率来说已经很屌了
至于频率 一个测试片而已
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。
按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
ayanamei 发表于 2015-5-26 17:13
同频效率来说已经很屌了
至于频率 一个测试片而已
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。
按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。
按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。
按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
花落庭院 发表于 2015-5-26 17:17
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。
按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
花落庭院 发表于 2015-5-26 17:17
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E6300跑出1928的CINT 2000成绩,换算到1Ghz是1033/Ghz。
按照主贴的文章,i3 550只有800多/Ghz,莫非i3还不如core 2?
http://www.spec.org/cpu2000/resu ... 20060705-06412.html
同样的,E6300的CFP 2000的成绩是1978,换算为1060/Ghz,按照文中给的数据,i3 550也就刚1000/Ghz,莫非i3对core 2一代没有任何改进?
http://www.spec.org/cpu2000/resu ... 20060705-06412.html
同样的,E6300的CFP 2000的成绩是1978,换算为1060/Ghz,按照文中给的数据,i3 550也就刚1000/Ghz,莫非i3对core 2一代没有任何改进?
必须指出的上述E6300是2006年6月测试的,因此应该是65nm版的老E6300,也就是第一代的core 2(conore)。
假如这个数据是GCC 4.3O2编译的,使用自己开发的编译器,数据确实会很牛逼。但是这里没有写明编译环境。 ...
应该是都在GCC下编译
===
架构SPEC CPU定点SPEC CPU 浮点龙芯3A1000(1.0G)GS464373298龙芯3A2000(1.0G)GS464E7621125性能提升104%278%
并且LS3A2000尚未得到编译器充分优化,已经可以跑出这样成绩的同频效率。
应该是都在GCC下编译
===
架构SPEC CPU定点SPEC CPU 浮点龙芯3A1000(1.0G)GS464373298龙芯3A2000(1.0G)GS464E7621125性能提升104%278%
并且LS3A2000尚未得到编译器充分优化,已经可以跑出这样成绩的同频效率。
另外A57在gcc下的结果,按照报道,CINT 2000是1250/1.7Ghz,也就是735/Ghz,楼主的文章却给出600/Ghz的结果,不知道是画错了还是故意的。
同频效率来说已经很屌了
至于频率 一个测试片而已
3A的GCC和龙芯自己的编译器差距在50%-60%
至于频率 一个测试片而已
3A的GCC和龙芯自己的编译器差距在50%-60%
konming 发表于 2015-5-26 17:40
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E63 ...
Compiler: Intel C++ Compiler 9.1 for IA32
这个应该是关键
spec2000本来就很吃编译器
原文这个应该用的是GCC 具体版本也不清楚 当然这是猜测 还要等以后更多信息
konming 发表于 2015-5-26 17:40
http://www.spec.org/cpu2000/resu ... 20060821-07081.html
1.86Ghz的Core 2 E63 ...
Compiler: Intel C++ Compiler 9.1 for IA32
这个应该是关键
spec2000本来就很吃编译器
原文这个应该用的是GCC 具体版本也不清楚 当然这是猜测 还要等以后更多信息
http://www.spec.org/cpu2000/results/res2006q3/cpu2000-20060821-07081.html
1.86Ghz的Core 2 E63 ...
看我7楼说明
1.86Ghz的Core 2 E63 ...
看我7楼说明
应该是都在GCC下编译
===
架构SPEC CPU定点SPEC CPU 浮点龙芯3A1000(1.0G)GS464373298龙芯3A2000(1. ...
有两种可能,1,老胡厚颜无耻,2是确实有编译器问题,排除编译器问题,跟IVY相当?????
===
架构SPEC CPU定点SPEC CPU 浮点龙芯3A1000(1.0G)GS464373298龙芯3A2000(1. ...
有两种可能,1,老胡厚颜无耻,2是确实有编译器问题,排除编译器问题,跟IVY相当?????
一直有个疑问,为什么不测2006?
一直有个疑问,为什么不测2006?
2006只是加大访存压力。。。。。。
2006只是加大访存压力。。。。。。
花落庭院 发表于 2015-5-26 18:05
有两种可能,1,老胡厚颜无耻,2是确实有编译器问题,排除编译器问题,跟IVY相当?????
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线上如何再去排除编译器的问题,莫非龙芯用自己特别优化的编译器而ivy不准用优化编译器相当?
有两种可能,1,老胡厚颜无耻,2是确实有编译器问题,排除编译器问题,跟IVY相当?????
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线上如何再去排除编译器的问题,莫非龙芯用自己特别优化的编译器而ivy不准用优化编译器相当?
公司里面各种数据都是2006,每次见到2000都是龙芯
华府小厮 发表于 2015-5-26 18:07
一直有个疑问,为什么不测2006?
2006有大量的当前数据,2000在spec上最多到一代core 2的数据。
一直有个疑问,为什么不测2006?
2006有大量的当前数据,2000在spec上最多到一代core 2的数据。
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线 ...
GCC编译器对龙芯支持版本比较低吧,
GCC编译器对龙芯支持版本比较低吧,
花落庭院 发表于 2015-5-26 18:10
GCC编译器对龙芯支持版本比较低吧,
那么a57的结果是怎么回事呢?
GCC编译器对龙芯支持版本比较低吧,
那么a57的结果是怎么回事呢?
konming 发表于 2015-5-26 18:09
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线 ...
几乎可以肯定 这个成绩不是LCC编译结果 不然不会专门说没有优化编译
如果其他成绩是GCC某个版本 就是意思是通用编译器一起测试
这个i3成绩和你看到core2成绩差距的来源 应该就是编译器造成的
core2那个是icc 9.1 for 32bit环境
按照上面的说法,intel也都是用的未优化的编译器(用intel的编译器肯定不是这个结果),那么大家在一条线 ...
几乎可以肯定 这个成绩不是LCC编译结果 不然不会专门说没有优化编译
如果其他成绩是GCC某个版本 就是意思是通用编译器一起测试
这个i3成绩和你看到core2成绩差距的来源 应该就是编译器造成的
core2那个是icc 9.1 for 32bit环境
konming 发表于 2015-5-26 18:11
那么a57的结果是怎么回事呢?
a57的结果你指什么问题?
那么a57的结果是怎么回事呢?
a57的结果你指什么问题?
2006只是加大访存压力。。。。。。
所以呢?不是应该测试2006更合理些么?
所以呢?不是应该测试2006更合理些么?
这样说来intel这十年,ipc进步也是惨不忍睹。。。Ivy。。。
a57的结果你指什么问题?
看新龙芯的分支预测的结果还是非常震撼
看新龙芯的分支预测的结果还是非常震撼
所以呢?不是应该测试2006更合理些么?
嗯,假如访存没有问题,结果应该类似
嗯,假如访存没有问题,结果应该类似
花落庭院 发表于 2015-5-26 18:16
看新龙芯的分支预测的结果还是非常震撼
这个tm碉堡了=。=
看新龙芯的分支预测的结果还是非常震撼
这个tm碉堡了=。=
这个tm碉堡了=。=
分支预测正确率是流水线效率一个关键指标
分支预测正确率是流水线效率一个关键指标
ayanamei 发表于 2015-5-26 18:13
a57的结果你指什么问题?
看16楼,字数补丁。
a57的结果你指什么问题?
看16楼,字数补丁。
至少比上一代还是有了非常明显的提升的,没有必要着急去和intel比,只要和自己比不断的符合摩尔定律的性能提升就足够了
另外A57在gcc下的结果,按照报道,CINT 2000是1250/1.7Ghz,也就是735/Ghz,楼主的文章却给出600/Ghz的结果 ...
笑看A8六发只比A57三发多50%性能
同样老黄的A15PPT也是分数暴表
笑看A8六发只比A57三发多50%性能
同样老黄的A15PPT也是分数暴表
比同频性能就是给自己脸上贴金,就是耍流氓!
比同频性能就是给自己脸上贴金,就是耍流氓!
胡伟武也只能在前端设计上赶超intel,后端由于是靠EDA工具设计的,准确的说,靠美国新思科技公司设计工具,半定制,主频上不去,一个机器优化,一个人工优化,是比不赢的,
胡伟武也只能在前端设计上赶超intel,后端由于是靠EDA工具设计的,准确的说,靠美国新思科技公司设计工具,半定制,主频上不去,一个机器优化,一个人工优化,是比不赢的,
40纳米1G主频龙芯3A2000在CPU2000分值出笼:浮点1125, ...
闲来无事算了下龙芯3A2000在1G主频下龙芯编译器的CPU200 ...
龙芯2号主频明年达1G 突破通用CPU设计核心技
难道到现在还没有龙芯3A2000/3B2000在LCC下的的SPEC2000 ...
龙芯3A2000 0.8G的GCC分值为整数610,浮点900,1G为763,11 ...
核高基最新成果简介:其中江南所28纳米众核主频超1.5G, ...
[转贴] 龙芯3B超强劲 1G主频性能远超Intel i7
龙芯3A2000 Spec2006成绩[对比FT1500A]
真牛的国产CPU商品开卖了,40纳米,16核1.6GHz
中科院本月底正式发布龙芯2号 主频500MHz
计算所:最迟到2015年,龙3主频达2.0GHz以上,单片浮点 ...
龙芯3A2000(1GHz)的整体性能与i3/i5的M版/U版本相比如何 ...