龙芯最新白皮书

来源:百度文库 编辑:超级军网 时间:2024/04/27 23:18:08
6.1 龙芯3A1500处理器
龙芯3A1500处理器是目前龙芯3A1000处理器(简称龙芯3A)
处理器的全新升级版本。龙芯 3A1500 处理器集成 4 个 64 位处理器
核,可满足服务器和高端桌面应用,具有高带宽,高性能,低功耗
的特征。龙芯 3A1500 处理器塑封版本与龙芯 3A1000 处理器引脚完
全兼容,内部集成的各个部分进行了全新的升级。
与龙芯3A1000处理器相比,该芯片的处理器核性能大幅度提升
,并重点优化了访存性能,加强了虚拟机支持及多种二进制翻译支持
;内存接口由DDR3-800升级至DDR3-1333;HT接口由HT1.0升级
至HT3.0;并增加了SPI启动功能。
总体来说,龙芯3A1500处理器内部集成的处理器核性能大幅提
升,预计全芯片性能在不同的应用环境下将比龙芯3A提升2-4倍。
特别是其访存性能,将达到龙芯3A的10-20倍。在实现引脚兼容的
基础上,降低功耗,并大幅度提升处理器性能。
龙芯3A1500处理器将会有全新的陶封版本,满足各种工业级应
用。
该芯片目前已经流片,预计 2015 年年初完成样片系统验证工作
,并于2015年末进行量产。 6.1 龙芯3A1500处理器
龙芯3A1500处理器是目前龙芯3A1000处理器(简称龙芯3A)
处理器的全新升级版本。龙芯 3A1500 处理器集成 4 个 64 位处理器
核,可满足服务器和高端桌面应用,具有高带宽,高性能,低功耗
的特征。龙芯 3A1500 处理器塑封版本与龙芯 3A1000 处理器引脚完
全兼容,内部集成的各个部分进行了全新的升级。
与龙芯3A1000处理器相比,该芯片的处理器核性能大幅度提升
,并重点优化了访存性能,加强了虚拟机支持及多种二进制翻译支持
;内存接口由DDR3-800升级至DDR3-1333;HT接口由HT1.0升级
至HT3.0;并增加了SPI启动功能。
总体来说,龙芯3A1500处理器内部集成的处理器核性能大幅提
升,预计全芯片性能在不同的应用环境下将比龙芯3A提升2-4倍。
特别是其访存性能,将达到龙芯3A的10-20倍。在实现引脚兼容的
基础上,降低功耗,并大幅度提升处理器性能。
龙芯3A1500处理器将会有全新的陶封版本,满足各种工业级应
用。
该芯片目前已经流片,预计 2015 年年初完成样片系统验证工作
,并于2015年末进行量产。
  龙芯3A1500芯片规格
800MHz – 1GHz
个数 4
器核 64位超标量处理器核GS464e;
支持MIPS64指令集;
支持LISA64指令集;
12级超标量流水线;
四发射乱序执行;
2个定点单元、2个浮点单元和2个访存单元
缓存 每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存;
每个处理器包含256KB私有二级缓存;
所有处理器核共享4MB三级缓存
控制器 2个64位DDR2/3-1333控制器;
支持ECC校验
I/O 2个HyperTransport 3.0控制器;
支持多处理器数据一致性互连(CC-NUMA)
I/O 1个PCI接口;
1个LPC、1个SPI、2个UART、16个GPIO接口
工艺 40nm CMOS工艺
40mm*40mm BGA封装,1121 个引脚
管理 支持主要模块(CPU、DDR、HT)时钟动态关闭;
支持处理器核动态降频
功耗 <12W@800MHz
6.2 龙芯2K1000处理器
龙芯2K1000处理器是面向网络安全领域及移动智能终端领域的
双核处理器芯片。龙芯2K1000处理器将集成两个GS264处理器核,
芯片外围接口包括两路x4 PCIE2.0、一路 SATA2.0、4路USB2.0、一
路DVO、64位DDR2/3,及其它各种小接口。
该芯片可以满足中低端网络安全领域应用需求,并为其扩展应用
提供相应的接口。
该芯片目前正在进行设计,预计 2015 年末完成样品系统验证,
2016年中进行产品化。芯片的主要规格如下:
  龙芯2K1000芯片规格
1GHz
个数 2
器核 64位超标量处理器核GS264;
支持MIPS64指令集;
支持LISA64指令集;
10级超标量流水线;
双发射乱序执行;
2个定点单元、1个浮点单元和1个访存单元
缓存 每个处理器核包含32KB私有一级指令缓存和32KB私有一
所有处理器核共享1MB二级缓存
控制器 1个64位DDR2/3-1333控制器;
I/O 2个PCIE x4控制器;
可分别配置为4路x1及2路x1控制器
I/O 4路USB
SATA
DVO
2路GMAC
NAND
最多12路UART
2路CAN
HDA/AC97/I2S
I2C
SPI/SDIO
GPIO
工艺 40nm CMOS工艺
-
管理 支持主要模块时钟动态控制;支持ACPI
功耗 <7W@1GHz
4.2 龙芯3号系列性能评测
下面分别列出各种基准性能测试程序SPEC CPU2000在龙芯3号
系列上的测试结果。
  龙芯3A  SPEC CPU2000(LCC编译)
  测试结果见下表:
系统配置 3A芯片 主频  1.0GHz
内存规格  2G×2 DDR3 500MHz
页大小  16KB
3A芯片 主频  1.2GHz
内存规格  2G×2 DDR3 500MHz
页大小  16KB   
编译器和选项 LCC –O3 LCC –O3
测试集 Rate(4线程) Ratio   Rate(4线程) Ratio
164.gzip 15.0 332 17.7 395
175.vpr 20.2 534 23.1 635
176.gcc 22.9 543 27.0 648
181.mcf 20.1 742 22.1 890
186.crafty 29.5 643 35.3 771
197.parser 17.6 450 20.2 532
252.eon 37.1 800 44.5 959
253.perlbmk 19.8 442 23.6 529
254.gap 14.6 341 16.5 392
255.vortex 28.3 661 33.3 786
256.bzip2 18.1 477 20.8 565
300.twolf 23.9 649 29.0 779
INT 21.4 532 25.0 632
168.wupwise 30.0 824 32.4 925
171.swim 17.1 1035 17.7 1121
172.mgrid 11.2 478 11.5 526
173.applu 343 824 38.7 965
177.mesa 23.7 534 27.8 630
178.galgel 49.1 1809 54.1 2145
179.art 161 5692 188 6827
183.equake 26.0 778 27.9 882
187.facerec 21.8 705 24.2 829
188.ammp 17.3 468 20.0 558
189.lucas 14.7 461 15.5 510
191.fma3d 14.8 389 16.1 441
200.sixtrack 16.0 356 19.1 427
301.apsi 17.8 405 20.5 471
FP 24.1 730 26.8 842
龙芯3A SPEC CPU2000(GCC编译)
  测试结果见下表:
系统配置 3A芯片 主频  900MHz
内存规格  2G×2 DDR3 330MHz
页大小  16KB
编译器和选项 GCC –O3
测试集 Rate(4线程) Ratio   
164.gzip 10.48 245
175.vpr 10.90 302
176.gcc 14.45 402
181.mcf 6.34 335
186.crafty 21.09 461
197.parser 8.53 235
252.eon 27.60 595
253.perlbmk 15.69 354
254.gap 7.40 236
255.vortex 12.65 286
256.bzip2 8.76 270
300.twolf 16.3 543
INT 12.2 338
168.wupwise 8.20 331
171.swim 3.03 195
172.mgrid 2.84 169
173.applu 2.96 172
177.mesa 17.4 417
178.galgel 9.24 511
179.art 11.3 1321
183.equake 3.97 244
187.facerec 6.01 194
188.ammp 11.0 357
189.lucas 4.13 222
191.fma3d 4.17 135
200.sixtrack 9.08 203
301.apsi 7.32 198
FP 6.16 270
UnixBench5.1.3
  测试结果见下表:
系统配置 3A芯片 主频  900MHz
内存规格  2G×2 DDR3 330MHz
页大小  16KB
3B1500芯片 主频  1GHz
内存规格  8G×2 DDR3 533MHz
页大小  16KB
测试内容 running 1
parallel copy
of tests
running 4
parallel
copies of
tests
running 1
parallel copy
of tests
running 8 parallel
copies of tests
Index Score 217.6 551.0 203 793
5-7楼是 老3A的数据

3A1500比老3A强2-4倍

主频还那样


以前的龙芯对内存频率支持太弱了,不知道什么原因。
即使3A 1500提升到DDR3 1333,也已经落后于主流很多了,至少要支持到1866吧,而且内存慢慢向DDR4转了。
可满足服务器和高端桌面应用? 真的假的?
可满足服务器和高端桌面应用? 真的假的?
看你怎么用了,平常情况下,一般人用不到cpu一半的性能,更何况mips的linux没有多少游戏
我只能说追得确实快,但差距依然很大,频率,工艺差距更大,
我只能说追得确实快,但差距依然很大,频率,工艺差距更大,
制成估计是 40nm对  会用龙芯的来说够用了

而且比28nm省钱

毕竟中芯已经掌握28了

主频据说将来会提升到1.5-2.0
只说一点,arm都DDR4了,龙芯太慢了
SATA,pcie,usb.....CPU不谈,只谈可以比的接口
scxtx 发表于 2015-4-2 11:29
制成估计是 40nm对  会用龙芯的来说够用了

而且比28nm省钱
年底量产应该用28nm制程,估计就在中芯。
年底量产应该用28nm制程,估计就在中芯。
40    功耗 12w

28    的话   估计8-9w?

真心上平板了
scxtx 发表于 2015-4-2 14:31
40    功耗 12w

28    的话   估计8-9w?
龙3A 1500不是移动设备CPU,8、9W还是太高了。
scxtx 发表于 2015-4-2 14:31
40    功耗 12w

28    的话   估计8-9w?
平板U集成多少东西,别的不说,光一个GPU,就要增加多少功耗?8-9W纯CPU功耗就不要想平板了。
scxtx 发表于 2015-4-2 14:31
40    功耗 12w

28    的话   估计8-9w?
何况800Mhz的性能会不会不够用很难说,毕竟苹果A7这种高度优化IPC的CPU都做到1.3-1.4Ghz了。
何况800Mhz的性能会不会不够用很难说,毕竟苹果A7这种高度优化IPC的CPU都做到1.3-1.4Ghz了。

如果3a1500实现目标的话两者单核性能相当吧,当然这玩意不会上平板的,上平板的是2k1000,性能与a9相当
wlm2012 发表于 2015-4-2 17:08
如果3a1500实现目标的话两者单核性能相当吧,当然这玩意不会上平板的,上平板的是2k1000,性能与a9相当
最多两者同频单核性能相当,可是频率还低了快一半。
最多两者同频单核性能相当,可是频率还低了快一半。
龙芯计划3a1500性能是3a的3倍,3a的spec 2000大概500多分,果子的是多少,我记不清了。
wlm2012 发表于 2015-4-2 17:15
龙芯计划3a1500性能是3a的3倍,3a的spec 2000大概500多分,果子的是多少,我记不清了。
3b1500在1.2Ghz下specint2000才531。你记错了。

konming 发表于 2015-4-2 17:22
3b1500在1.2Ghz下specint2000才531。你记错了。


没记错,刚看了龙芯的白皮书,3a的spec分数比3b略高,3b的没优化好
3a 1ghz下分数532
楼上不就有吗?lcc编译int532
konming 发表于 2015-4-2 17:22
3b1500在1.2Ghz下specint2000才531。你记错了。


没记错,刚看了龙芯的白皮书,3a的spec分数比3b略高,3b的没优化好
3a 1ghz下分数532
楼上不就有吗?lcc编译int532
wlm2012 发表于 2015-4-2 17:24
没记错,刚看了龙芯的白皮书,3a的spec分数比3b略高,3b的没优化好
3a 1ghz下分数532
就算3A在1Ghz下有532,提高三倍也不是说specint能提高三倍。
就算3A在1Ghz下有532,提高三倍也不是说specint能提高三倍。
你要这么说,那我也没办法,看成品吧。
wlm2012 发表于 2015-4-2 17:08
如果3a1500实现目标的话两者单核性能相当吧,当然这玩意不会上平板的,上平板的是2k1000,性能与a9相当
3A1500  IPC提升3倍应该指SPEC 2006,SPEC 2000是不到3倍的,龙芯认为IPC相当于INTEL的IVY,SPEC 2006是访存问题使得老龙芯测试分数偏低。2K1000的IPC龙芯认为相当于  ARM A12处理器。。。白皮书上有图的。。。。。
花落庭院 发表于 2015-4-2 17:59
3A1500  IPC提升3倍应该指SPEC 2006,SPEC 2000是不到3倍的,龙芯认为IPC相当于INTEL的IVY,SPEC 2006是 ...
那用16nm 制成 或者28

2k1000     性能上平板 和手机是没问题吧
scxtx 发表于 2015-4-2 18:05
那用16nm 制成 或者28

2k1000     性能上平板 和手机是没问题吧
用足够先进的工艺制造,应该能上!本来目标就是移动设备。。。。
花落庭院 发表于 2015-4-2 18:08
用足够先进的工艺制造,应该能上!本来目标就是移动设备。。。。
龙芯 能配 liunx

不知道能配安卓么?

真心想用龙芯 的平板 或者手机啊
scxtx 发表于 2015-4-2 18:10
龙芯 能配 liunx

不知道能配安卓么?
安卓就是Linux,所以龙芯上跑安卓没问题,但驱动上估计会遇到不小麻烦,硬件厂商未必会为MIPS平台专门编译驱动。
scxtx 发表于 2015-4-2 18:10
龙芯 能配 liunx

不知道能配安卓么?
有二进制兼容ARM指令集,但是能不能用,好不好用,只有以后才知道
wlm2012 发表于 2015-4-2 17:34
你要这么说,那我也没办法,看成品吧。
这是很简单的常识,你就算把i7降频到800Mhz,也跑不出1600的Specint 2000成绩来。
这是很简单的常识,你就算把i7降频到800Mhz,也跑不出1600的Specint 2000成绩来。
果子有1600?果子a7不是才1200?
真不容易,估计只能在工业控制和专用服务器领域使用了。
wlm2012 发表于 2015-4-2 20:13
果子有1600?果子a7不是才1200?
A8将近1550,A7将近1250,说1600是指的532*3≈1600。

就算不说1600,800Mhz做到1200那也是Intel恐怕现在都不敢吹嘘的。
工控和嵌入式有得用,专用服务器也可以。当我们用到奔腾双核的时候,有些工控还是386、486,够用了
关注龙芯都10年了,还没见它发布一个像样的U出来,如今更是连低功耗的手机CPU都比不过了