国防科大研制成功的异构多核DSP---银河飞腾QDSP

来源:百度文库 编辑:超级军网 时间:2024/04/29 13:57:22


YHFT-QDSP利用三种互连方法实现了片内RISC与DSP核、片内不同DSP核以及片间DSP核之间的通讯,即通过管理总线(MB)实现RISC与DSP之间的通信;通过快速共享缓冲池(FDSP)实现核间小批量数据的高速交换;通过Qlink、交叉开关以及PCIE实现了核间以及片间大批量数据交换。
多核编程的软硬件协同支持。在软件方面,通过并行编程模型支持多核编程,即采用预编译方法实现核间同步例程的自动插入;通过并行支持库实现核间通讯,保证了代码的可靠性。在硬件方面,通过片上调试支持硬件DSU、ET、CT以及JTAG Server以及仿真器,支持多核选择、交叉触发等多核调试功能。

2.实现方法
YHFT-QDSP包含一个RISC CPU内核和四个增强的YHFT-DSP/700+ VLIW DSP内核,其中RSIC核包括UART, GPIO, 定时器、CAN总线以及以太网等外设,YHFT-DSP/700+是8流出的VLIW DSP内核,包括两个32位乘法单元和4个ALU单元以及2个数据存取单元,每个核包括256KB内存,且低64KB可部分或全部配置为L2 Cache。YHFT-QDSP利用多种互连方法支持多核通信,其中包括:
管理总线(MB)用于片内RISC核和DSP核之间的通信。RSIC核可通过该总线控制DSP核的启动和停止,并向DSP核灌入执行程序。该总线还支持RISC核和DSP核之间互发中断。
FDSP是一种核间快速数据共享机制,它连接每个DSP核的数据存取单元,各DSP核可通过数据存取指令访问FDSP。FDSP以“生产者—消费者”的模式工作,利用信号灯机制来控制生产消费过程。
Qlink支持片内及片间DSP核之间的大批数据传输,它与交叉开关、PCIE一起实现上述功能,并支持源路由以及X-Y路由两种路由策略。为YHFT-QDSP异构多核体系结构设计的并行编程平台提供了并行支持库和友好的DSP软硬件界面。其中包括:
提供预编译器识别用户的预编译语法指示,自动插入核间同步例程,方便并行编程。
提供并行支持库实现核间通讯,屏蔽硬件细节。
片上调试支持硬件(DSU、ET、CT以及JTAG Server等)和仿真器支持各种片上事件统计、交叉断点触发等多核调试功能,方便用户调试。YHFT-QDSP的物理实现采用了自顶向下和自底向上相结合的设计方法。全定制设计了寄存器文件、交叉开关等数字电路以及PCIE物理层模拟电路,这些手段不仅提高了芯片的频率,还降低了功耗。

3.结论及未来待解决的问题
YHFT-QDSP是一种高性能的异构多核DSP。它利用多种互连实现了核间、片间的高效通讯,通过多核编程的软硬件支持,大大降低了多核编程和调试的复杂性。
考虑到应用对DSP性能的无限需求,未来将向更多核发展。

4.实用价值或应用前景
在0.13微米工艺下YHFT-QDSP的频率达到350MHz,性能大于11.2GOPS,功耗约2.99W,该芯片目前已应用于图像处理领域,另外在无线基站、雷达等领域也有着广泛的应用前景。

银河飞腾-DSP/700
  银河飞腾-DSP/700(简称YHFT-DSP/700)是我国自主研发的新一代高性能32位浮点数字信号处理(DSP),它的计算速度、I/O能力和功耗等综合性能指标居国内领先,并达到当前高性能通用浮点DSP的国际先进水平。

主频可达238MHz,浮点运算性能达1428MFLOPS,定点运算性能达到1900MIPS.乘加运算能力达每秒474M次.功耗仅1.5W;增强的哈佛结构,RlSC指令集、32位指令字,32个通用寄存器;八路超长指令字结构,包含2个乘法部件和6个算逻运算部件;指令条件执行,使编译器能够更大程度地开发并行性;具有110余种指令类型和丰富的寻址方式;含有32K位L1级数据Cache、32K位L1级指令Cache和512K位L2级Cache;支持14级中断:支持丰富的外部接口: 定时器、主机接口、增强的DMA、外部存储器接口、多通道缓冲串口,可直接连接三大类60余种存储器,在多种模式下传输;开发了基于YHFT-DSP/700的编译器及其配套软硬件开发环境。

经过严格测试的YHFT-DSP/700芯片已在国内10家单位使用,并可批量供货。为方便设计SOC芯片,同时开发了以YHFT-DSP/700为基础的高性能DSP软核和硬核,可作为IP使用。
1.jpg2.JPG3.JPG

YHFT-QDSP利用三种互连方法实现了片内RISC与DSP核、片内不同DSP核以及片间DSP核之间的通讯,即通过管理总线(MB)实现RISC与DSP之间的通信;通过快速共享缓冲池(FDSP)实现核间小批量数据的高速交换;通过Qlink、交叉开关以及PCIE实现了核间以及片间大批量数据交换。
多核编程的软硬件协同支持。在软件方面,通过并行编程模型支持多核编程,即采用预编译方法实现核间同步例程的自动插入;通过并行支持库实现核间通讯,保证了代码的可靠性。在硬件方面,通过片上调试支持硬件DSU、ET、CT以及JTAG Server以及仿真器,支持多核选择、交叉触发等多核调试功能。

2.实现方法
YHFT-QDSP包含一个RISC CPU内核和四个增强的YHFT-DSP/700+ VLIW DSP内核,其中RSIC核包括UART, GPIO, 定时器、CAN总线以及以太网等外设,YHFT-DSP/700+是8流出的VLIW DSP内核,包括两个32位乘法单元和4个ALU单元以及2个数据存取单元,每个核包括256KB内存,且低64KB可部分或全部配置为L2 Cache。YHFT-QDSP利用多种互连方法支持多核通信,其中包括:
管理总线(MB)用于片内RISC核和DSP核之间的通信。RSIC核可通过该总线控制DSP核的启动和停止,并向DSP核灌入执行程序。该总线还支持RISC核和DSP核之间互发中断。
FDSP是一种核间快速数据共享机制,它连接每个DSP核的数据存取单元,各DSP核可通过数据存取指令访问FDSP。FDSP以“生产者—消费者”的模式工作,利用信号灯机制来控制生产消费过程。
Qlink支持片内及片间DSP核之间的大批数据传输,它与交叉开关、PCIE一起实现上述功能,并支持源路由以及X-Y路由两种路由策略。为YHFT-QDSP异构多核体系结构设计的并行编程平台提供了并行支持库和友好的DSP软硬件界面。其中包括:
提供预编译器识别用户的预编译语法指示,自动插入核间同步例程,方便并行编程。
提供并行支持库实现核间通讯,屏蔽硬件细节。
片上调试支持硬件(DSU、ET、CT以及JTAG Server等)和仿真器支持各种片上事件统计、交叉断点触发等多核调试功能,方便用户调试。YHFT-QDSP的物理实现采用了自顶向下和自底向上相结合的设计方法。全定制设计了寄存器文件、交叉开关等数字电路以及PCIE物理层模拟电路,这些手段不仅提高了芯片的频率,还降低了功耗。

3.结论及未来待解决的问题
YHFT-QDSP是一种高性能的异构多核DSP。它利用多种互连实现了核间、片间的高效通讯,通过多核编程的软硬件支持,大大降低了多核编程和调试的复杂性。
考虑到应用对DSP性能的无限需求,未来将向更多核发展。

4.实用价值或应用前景
在0.13微米工艺下YHFT-QDSP的频率达到350MHz,性能大于11.2GOPS,功耗约2.99W,该芯片目前已应用于图像处理领域,另外在无线基站、雷达等领域也有着广泛的应用前景。

银河飞腾-DSP/700
  银河飞腾-DSP/700(简称YHFT-DSP/700)是我国自主研发的新一代高性能32位浮点数字信号处理(DSP),它的计算速度、I/O能力和功耗等综合性能指标居国内领先,并达到当前高性能通用浮点DSP的国际先进水平。

主频可达238MHz,浮点运算性能达1428MFLOPS,定点运算性能达到1900MIPS.乘加运算能力达每秒474M次.功耗仅1.5W;增强的哈佛结构,RlSC指令集、32位指令字,32个通用寄存器;八路超长指令字结构,包含2个乘法部件和6个算逻运算部件;指令条件执行,使编译器能够更大程度地开发并行性;具有110余种指令类型和丰富的寻址方式;含有32K位L1级数据Cache、32K位L1级指令Cache和512K位L2级Cache;支持14级中断:支持丰富的外部接口: 定时器、主机接口、增强的DMA、外部存储器接口、多通道缓冲串口,可直接连接三大类60余种存储器,在多种模式下传输;开发了基于YHFT-DSP/700的编译器及其配套软硬件开发环境。

经过严格测试的YHFT-DSP/700芯片已在国内10家单位使用,并可批量供货。为方便设计SOC芯片,同时开发了以YHFT-DSP/700为基础的高性能DSP软核和硬核,可作为IP使用。
1.jpg2.JPG3.JPG
新鲜啊,不错
大概40多个fo4,应该还是可以再努努力。
不错!
顶这个
这个东西是干什么用的啊?呵呵
支持一下
期待 投入天河大机
天河二用的是YHFT-1500多核处理器,不是用这个,这个应该是用在一些导弹上的吧。。。
东边有神威多核(alpha),南边有飞腾多核(安腾)。。。。全国产化的巨型机日子不远了~!
不知道这些处理器可以用于桌面系统和企业级服务器吗?这才是我们军方急需国产化的东西~!
每次看到新闻里面中国军方用X86系统,金融用IBM,心理就是不安。。。美帝要灭我们太容易了~!
[转帖]“申威-1 号”高性能微处理器  发帖心情  Post By:2009-5-5 1:08:00


江南所的杰作,IC设计由其分所 国家高性能集成电路设计中心 完成:
03年项目开始,05年流片成功,06年通过鉴定。已成功应用在新一代的SZ超级计算机上,该机若按曙光5000A的排名计算方法计,曾位列全球TOP2仅次于当时刚刚升级的 Bule gene/L。

Alpha 指令集,microarchitecture:21364的基础上改进。

SW1:SMIC 0.13μm工艺,稳定工作频率 900Mhz。
08年通过鉴定的SW2 :双核, SMIC 0.13μm工艺,稳定工作频率 1.4Ghz。进行中的项目SW3:4or8核,SMIC 65nm工艺,工作频率 1.6Ghz以上

http://www.jos.org.cn/ch/reader/ ... _no=3602&flag=1

“申威-1 号”高性能微处理器的功能验证

黄永勤 朱英 巨鹏锦 吴志勇 陈诚

摘要:微处理器设计日趋复杂,如何对微处理器设计进行有效而充分的验证,成为芯片流片成功的关键因素之一.在介绍微处理器功能验证的一般理论和方法的基础上,介绍了“申威-1 号”高性能微处理器的功能验证所采用的验证策略及各种验证方法.RTL(register transfer level)级验证是功能验证的重点,模拟验证是“申威-1 号”RTL 级验证的主要验证手段.详细介绍了如何综合采用多种验证技术来解决RTL 级模拟验证的几个关键问题:高质量测试激励生成、模拟结果正确性的快速判断以及验证覆盖率目标的实现.最后对各种验证方法所取得的验证效果进行了分析.

===

黄永勤(女),计算机科学与技术专业,国家并行计算机工程技术研究中心高级工程师。国家863计划计算机软硬件技术主题专家、中国计算机学会理事、总参56 所所长。 曾作为第62期图灵论坛主讲人:“造神州机,铸神州魂 来自中国超级计算机研制一线的报告” 。

金怡濂,黄永勤,陈左宁,桂亚东,漆锋滨在《中国工程科学》2001年第3卷第6期发表专题报告“ 高性能计算机的关键技术和发展趋势” 介绍神威高性能计算机及其应用情况。

金怡濂曾获2002年中国国家最高科技技术奖,主持研制国家重点工程—“神威”巨型计算机系统,担任总设计师。

黄永勤是“神威”型号副总师 。


0.13微米工艺!太差了吧!现在CPU都纳米级了吧!国内有产生45nm工艺技术吗!

0.13微米工艺!太差了吧!现在CPU都纳米级了吧!国内有产生45nm工艺技术吗!