今年4月20日,国产处理器和数字信号处理器成果大检阅(内 ...

来源:百度文库 编辑:超级军网 时间:2024/04/28 22:46:14


国产自主微处理器(CPU)与数字信号处理器(DSP)专刊征稿通知
微处理器(CPU)和数字信号处理器(DSP)是信息产业的核心部件,是集成电路产品的制高点。近年来在国家“863”计划、“核高基”重大科技专项等项目的支持下,我国在超级计算机CPU、服务器及桌面计算机CPU、嵌入式CPU和专用DSP领域取得了一系列成果,提升了我国在CPU和DSP领域的研发能力和支撑电子信息产业发展的能力。
为了全面展示我国在CPU和DSP方面的研究成果,进一步推动CPU和DSP技术的学术交流,《中国科学:信息科学》将出版“国产自主CPU/DSP专刊”,所涉及的研究内容将包括:
1、自主设计CPU/DSP芯片介绍,要求芯片已经完成流片,且技术指标具有先进性;
2、CPU/DSP设计核心技术,包括但不限于:
● 高性能微体系结构设计技术;
● 低功耗设计技术;
● 可靠性设计技术;
● 高性能物理设计技术;
● 高速电路设计技术;
● 复杂芯片验证技术;
● 高性能编译技术;
● 二进制翻译技术。
来稿要求论点明确、数据可靠、条理清晰、文字精炼,论文格式体例参考近期出版的《中国科学:信息科学》。投稿时请使用在线投稿的方式,访问中国科学杂志社在线投审稿系统:
http://ees.chinasciencejournal.com/user/login.action?pageCode=Sci_Info,
免费注册一个“作者账户”,按照提示与引导将稿件上传到审稿系统。上传稿件时务必在“投稿说明”中注明:该文欲投“国产自主CPU/DSP专刊”。
重要日期:
截稿日期:2014年9月30日
退改通知:2014年12月30日
终稿提交:2015年1月30日
录用通知:2015年2月10日
出版时间:2015年4月20日
特约编辑:
胡伟武 中国科学院计算技术研究所

国产自主微处理器(CPU)与数字信号处理器(DSP)专刊征稿通知
微处理器(CPU)和数字信号处理器(DSP)是信息产业的核心部件,是集成电路产品的制高点。近年来在国家“863”计划、“核高基”重大科技专项等项目的支持下,我国在超级计算机CPU、服务器及桌面计算机CPU、嵌入式CPU和专用DSP领域取得了一系列成果,提升了我国在CPU和DSP领域的研发能力和支撑电子信息产业发展的能力。
为了全面展示我国在CPU和DSP方面的研究成果,进一步推动CPU和DSP技术的学术交流,《中国科学:信息科学》将出版“国产自主CPU/DSP专刊”,所涉及的研究内容将包括:
1、自主设计CPU/DSP芯片介绍,要求芯片已经完成流片,且技术指标具有先进性;
2、CPU/DSP设计核心技术,包括但不限于:
● 高性能微体系结构设计技术;
● 低功耗设计技术;
● 可靠性设计技术;
● 高性能物理设计技术;
● 高速电路设计技术;
● 复杂芯片验证技术;
● 高性能编译技术;
● 二进制翻译技术。
来稿要求论点明确、数据可靠、条理清晰、文字精炼,论文格式体例参考近期出版的《中国科学:信息科学》。投稿时请使用在线投稿的方式,访问中国科学杂志社在线投审稿系统:
http://ees.chinasciencejournal.com/user/login.action?pageCode=Sci_Info,
免费注册一个“作者账户”,按照提示与引导将稿件上传到审稿系统。上传稿件时务必在“投稿说明”中注明:该文欲投“国产自主CPU/DSP专刊”。
重要日期:
截稿日期:2014年9月30日
退改通知:2014年12月30日
终稿提交:2015年1月30日
录用通知:2015年2月10日
出版时间:2015年4月20日
特约编辑:
胡伟武 中国科学院计算技术研究所
胡vv  要放大招? 还是sw  ft   lx 聚会~

国产dsp就知道38所有一个魂芯    雷达上用的
终于出来了
http://info.scichina.com/sciF/CN/volumn/volumn_7051.shtml
中国CPU与DSP专刊

编者按 Hot!
胡伟武, 肖利民, 安虹,
中国科学 信息科学 , 2015, 45(4): 457-458
全文 :  PDF (74 KB)   ( 6 )

+

摘要
中国CPU与DSP专刊

龙芯指令系统融合技术 Hot!
胡伟武, 靳国杰, 汪文祥, 张晓春, 王焕东,
中国科学 信息科学 , 2015, 45(4): 459-479 | doi: 10.1360/N112014-00300
全文 :  PDF (2229 KB)   ( 5 )

+

摘要
中国CPU与DSP专刊

龙芯GS464E处理器核架构设计 Hot!
吴瑞阳, 汪文祥, 王焕东, 胡伟武,
中国科学 信息科学 , 2015, 45(4): 480-500 | doi: 10.1360/N112014-00292
全文 :  PDF (2687 KB)   ( 14 )

+

摘要
中国CPU与DSP专刊

龙芯X微处理器抗辐照加固设计 Hot!
杨旭, 范煜川, 范宝峡,
中国科学 信息科学 , 2015, 45(4): 501-512 | doi: 10.1360/N112014-00294
全文 :  PDF (3177 KB)   ( 15 )

+

摘要
中国CPU与DSP专刊

高性能多核处理器申威1600 Hot!
胡向东, 杨剑新, 朱英,
中国科学 信息科学 , 2015, 45(4): 513-522 | doi: 10.1360/N112014-00295
全文 :  PDF (7755 KB)   ( 65 )

+

摘要
中国CPU与DSP专刊

一种面向高性能计算的自主众核处理器结构 Hot!
郑方, 许勇, 李宏亮, 谢向辉, 陈左宁,
中国科学 信息科学 , 2015, 45(4): 523-534 | doi: 10.1360/N112014-00299
全文 :  PDF (1416 KB)   ( 73 )

+

摘要
中国CPU与DSP专刊

高性能处理器层次化可重用模拟验证环境 Hot!
胡向东, 巨鹏锦, 朱英, 孙路,
中国科学 信息科学 , 2015, 45(4): 535-547 | doi: 10.1360/N112014-00296
全文 :  PDF (1373 KB)   ( 42 )

+

摘要
中国CPU与DSP专刊

容工艺偏差的低偏斜层次化时钟网络设计 Hot!
王晓, 柯希明,
中国科学 信息科学 , 2015, 45(4): 548-559 | doi: 10.1360/N112014-00297
全文 :  PDF (4440 KB)   ( 26 )

+

摘要
中国CPU与DSP专刊

协同多核DSP YHFT-QMBase: 体系结构及实现 Hot!
陈书明, 刘胜, 万江华, 王耀华, 陈胜刚, 陈海燕, 刘衡竹, 孙海燕, 刘仲,
中国科学 信息科学 , 2015, 45(4): 560-573 | doi: 10.1360/N112014-00298
全文 :  PDF (752 KB)   ( 34 )

+

摘要
中国CPU与DSP专刊

“魂芯一号”数字信号处理器及其应用 Hot!
洪一, 方体莲, 赵斌, 郭二辉, 刘小明, 耿锐,
中国科学 信息科学 , 2015, 45(4): 574-586 | doi: 10.1360/N112014-00379
全文 :  PDF (10927 KB)   ( 21 )
江南所的申威-3众核原型

===
一种面向高性能计算的自主众核处理器结构

随着半导体技术进步, 众核处理器已广泛应用于高性能计算领域. 近年来, 在国家“863”计划、“核高基”重大专项等项目的支持下, 我国高性能众核CPU 的研发水平也取得了长足进步. 本文介绍一种面向高性能计算的国产片上异构众核处理器结构, 通过统一指令系统、统一执行模型和支持一致性的主存共享, 实现异构核心的深度融合. 本文主要介绍了该处理器面向“存储墙”、“功耗墙”和“可靠性墙”的优化技术体系. 该处理器已完成集成了256 个运算核心和4 个管理核心的原型芯片设计, 峰值性能超过1 TFlops.
原来的核高基参数
====

2010年11月7日 核高基
申威SW-3众核处理器研究
任务来源:01核高基重大专项,已通过答辩进入最终名单项目

目标:提出一种先进的众核处理器结构,建立一个512核模拟系统和一个64核原型验证系统,满足我国“十二五”计划中面向高性能计算、高速信息处理及高吞吐量等方面的应用需求项目基础


由于在中芯国际流片,工艺是40纳米,功耗是150瓦--200瓦之间,随着中芯国际28纳米工艺的引进,将来有望达到 Tesla K80 GPU (28纳米)加速器的水平,双精度浮点精度突破2000G FLops

由于在中芯国际流片,工艺是40纳米,功耗是150瓦--200瓦之间,随着中芯国际28纳米工艺的引进,将来有望达到 Tesla K80 GPU (28纳米)加速器的水平,双精度浮点精度突破2000G FLops
由于在中芯国际流片,工艺是40纳米,功耗是150瓦--200瓦之间,随着中芯国际28纳米工艺的引进,将来有望达到 Tes ...
phi  功耗相当  浮点  性能是其2倍?
看上去神威3性能还可以。。。。
神威的100P就靠他了。。。。。
phi  功耗相当  浮点  性能是其2倍?
面向高性能计算的众核处理器结构级高能效技术
《计算机学报》2014年 第10期


|郑方张昆邬贵明高红光唐勇吕晖过锋李宏亮谢向辉陈左宁

数学工程与先进计算国家重点实验室江苏无锡214125

国家并行计算机工程技术研究中心北京100190


摘 要:随着半导体技术的进步,众核处理器已经广泛应用于高性能计算领域.而要构建未来高性能计算系统,处理器必须突破严峻的"能耗墙"挑战.文中以一款自主众核处理器DFMC原型为基础,首先对其在典型负载下的能耗分布进行了分析,结合该处理器的具体结构,提出了基于指令窗口的指令缓冲、操作数锁存两种结构级能效优化技术,探索了能效优先的浮点部件设计方法.实验表明,通过上述技术可以降低处理器取指和译码能耗约50%、寄存器文件能耗11.2%和浮点部件能耗17.6%,最终全芯片降低能耗约14.7%.在该文所述实验环境下,作者还进行了DFMC原型的双精度矩阵乘(DGEMM)性能功耗比测试,并与NVIDIA公司的Kepler K20GPU进行了对比.
申威3核内 linpack效率93%,优于K20GPU的90%
申威3核内 linpack效率93%,优于K20GPU的90%
感觉美帝制裁  没啥意义啊
感觉美帝制裁  没啥意义啊
人家是成熟产品,我们刚做出来,可以拖延进度
这台超算算是有着落了
这玩意光看峰值没意思
关键在核间拓扑和内存模型了
第一代Phi环形总线的大坑就在眼前

另外一个就是片间的互联总线带宽,不过这个申威倒是有点底子
印象中做到过48口端到端全速交换
兔子加油干啊!让美国佬的制裁成为一个笑话
最新论文看,申威410也有二进制翻译,模拟x86,目前还没有硬件加速,能跑x86/linux,跑win还没正式文章发表,申威1600二进制跑CUDA,初步跑通,正在优化
最新论文看,申威410也有二进制翻译,模拟x86,目前还没有硬件加速,能跑x86/linux,跑win还没正式文章发表,申威 ...
这么利害?英特尔的工艺压死了太多的人。
终于曝光了
终于曝光了
nudt的arm架构授权花了多少钱?
我都不关心,你操什么心
低调做人 发表于 2015-4-30 09:20
我都不关心,你操什么心
江南所的那个100P的超算机子是CPU+GPU的异构的吗
由于在中芯国际流片,工艺是40纳米,功耗是150瓦--200瓦之间,随着中芯国际28纳米工艺的引进,将来有望达到 Tes ...
哪儿来的消息?
28nm的版本有进展么?
这玩意光看峰值没意思
关键在核间拓扑和内存模型了
第一代Phi环形总线的大坑就在眼前

神威的芯片间互联系统真的很牛么?
mips64el 发表于 2015-7-23 00:04
神威的芯片间互联系统真的很牛么?
不确定,我也就是恍然有点印象

等我找找官方八股先
不确定,我也就是恍然有点印象

等我找找官方八股先
神威蓝光的总体效率不错,LINPACK在不同规模下的效率:单处理器核80.28%,单CPU 75.20%,单机舱75.07%,整机74.37%,单CPU到整机的效率下降很少。16核心相对于单核心效率下降也不大。对于16核心的结构来说已经非常不容易了。

江南所在使用intel处理器做超级计算机时曾经达到过整机效率90%以上,可见在超级计算机上江南所具有很高的水平。
hswz 发表于 2015-7-23 10:10
神威蓝光的总体效率不错,LINPACK在不同规模下的效率:单处理器核80.28%,单CPU 75.20%,单机舱75.07%, ...
毕竟这个是台小机器,不知道江南所的那台100P机器的芯片间互联技术怎么样了?
还有,28nm版本的SW-5有进展么?
hswz 发表于 2015-4-23 20:39
由于在中芯国际流片,工艺是40纳米,功耗是150瓦--200瓦之间,随着中芯国际28纳米工艺的引进,将来有望达到 Tes ...
无锡的100P有新消息么?
我去,土鳖捂了一年终于藏掖不住了