用在国产沉默哨兵上?14所最先进雷达信号处理上的基于龙 ...

来源:百度文库 编辑:超级军网 时间:2024/04/19 21:46:25


基于华睿1号的高性能数字脉压设计和实现

现代雷达 , Modern Radar,
编辑部邮箱 , 2012年04期
[给本刊投稿]
【作者】 周海斌; 刘刚; 李明;

【Author】 ZHOU Hai-bin,LIU Gang,LI Ming (Nanjing Research Institute of Electronics Technology,Nanjing 210039,China)

【机构】 南京电子技术研究所;

【摘要】 华睿1号是我国自主研制的一款4核微处理器,该处理器内部集成了矢量处理部件,扩展了包含快速傅里叶变换(FFT)蝶形运算指令在内的矢量指令集,具有很强的FFT运算和数字脉压处理能力。在嵌入式实时操作系统下的实测表明华睿1号单核处理1 024个单精度浮点复数FFT和数字脉压的运算时间分别为6.12μs和15.36μs,采用多线程FFT并行处理技术后,4核加速比可达3倍以上,满负荷功耗仅10 W,总体性能优于国内外同类处理器,适用于对实时性要求较高的雷达信号处理和电子对抗等领域
http://www.cnki.net/kcms/detail/ ... 008&uid=&p=

基于稀疏矩阵计算的外辐射源多径杂波抑制算法
Sparse Adaptive Clutter Cancellation for Radar Based on Opportunity Transmitter
推荐 CAJ下载PDF下载不支持迅雷等下载工具,请取消加速工具后下载。

现代雷达 , Modern Radar,
编辑部邮箱 , 2011年11期
[给本刊投稿]
【作者】 王峰; 傅有光; 李明;

【Author】 WANG Feng,FU You-guang,LI Ming(Nanjing Research Institute of Electronics Technology,Nanjing 210039,China)

【机构】 南京电子技术研究所;

【摘要】 在电视与调频广播的外辐射源雷达中,需要对消直达波与多径,才能进行目标的检测。常采用自适应对消器完成该类杂波的抑制,由于多径跨越的采样点很多,造成算法的计算量很大。文中利用了杂波多径稀疏性的特点,提出了稀疏矩阵运算的自适应算法,使得协方差矩阵的计算维数有效减少,在算法性能不下降的前提下,大大减少了自适应算法的计算量。通过计算机仿真验证了该算法的性能。

基于华睿1号的高性能数字脉压设计和实现

现代雷达 , Modern Radar,
编辑部邮箱 , 2012年04期
[给本刊投稿]
【作者】 周海斌; 刘刚; 李明;

【Author】 ZHOU Hai-bin,LIU Gang,LI Ming (Nanjing Research Institute of Electronics Technology,Nanjing 210039,China)

【机构】 南京电子技术研究所;

【摘要】 华睿1号是我国自主研制的一款4核微处理器,该处理器内部集成了矢量处理部件,扩展了包含快速傅里叶变换(FFT)蝶形运算指令在内的矢量指令集,具有很强的FFT运算和数字脉压处理能力。在嵌入式实时操作系统下的实测表明华睿1号单核处理1 024个单精度浮点复数FFT和数字脉压的运算时间分别为6.12μs和15.36μs,采用多线程FFT并行处理技术后,4核加速比可达3倍以上,满负荷功耗仅10 W,总体性能优于国内外同类处理器,适用于对实时性要求较高的雷达信号处理和电子对抗等领域
http://www.cnki.net/kcms/detail/ ... 008&uid=&p=

基于稀疏矩阵计算的外辐射源多径杂波抑制算法
Sparse Adaptive Clutter Cancellation for Radar Based on Opportunity Transmitter
推荐 CAJ下载PDF下载不支持迅雷等下载工具,请取消加速工具后下载。

现代雷达 , Modern Radar,
编辑部邮箱 , 2011年11期
[给本刊投稿]
【作者】 王峰; 傅有光; 李明;

【Author】 WANG Feng,FU You-guang,LI Ming(Nanjing Research Institute of Electronics Technology,Nanjing 210039,China)

【机构】 南京电子技术研究所;

【摘要】 在电视与调频广播的外辐射源雷达中,需要对消直达波与多径,才能进行目标的检测。常采用自适应对消器完成该类杂波的抑制,由于多径跨越的采样点很多,造成算法的计算量很大。文中利用了杂波多径稀疏性的特点,提出了稀疏矩阵运算的自适应算法,使得协方差矩阵的计算维数有效减少,在算法性能不下降的前提下,大大减少了自适应算法的计算量。通过计算机仿真验证了该算法的性能。


“华睿1号”芯片在京发布 填补国内多核DSP领域空白

ugmbbc发布于 2010-12-27 23:24:31|6897 次阅读 字体:大 小 打印预览      



新华网北京 2010年12月27日电(苏海萍)由国内自主创新研发的“华睿1号”专用DSP芯片27日在京举行发布会。“华睿1号”的研制成功,填补了我国在多核DSP领域的空白,对提高我国高端芯片的自主研发能力、提升我国电子整机装备研制水平、保障国家信息安全等方面具有重大意义与影响。


发布会现场  

据“华睿1号”专用DSP芯片项目负责人介绍,“华睿1号”由中国电子科技集团公司第十四研究所、北京国睿中数科技股份有限公司以及清华大学联合研发。其中,在处理器系统设计方面,“华睿1号”采用了DSP和CPU多核架构设计技术。实测表明,“华睿1号”的处理能力和能耗具有明显优势,代表了我国目前专用DSP芯片的最高水平,芯片的整体技术指标达到或优于国际同类产品水平。同时,“华睿1号”在运行多任务实时操作系统十分稳定。

据了解,该课题2009年初被列入国家“核高基”重大专项,技术指标高,设计难度大,其复杂的DSP芯片设计和处理器配套软件开发,是世界前沿的研究课题。“华睿1号”DSP芯片在自主创新,开发并掌握核心技术及满足应用需求方面达到了重大专项的目标,在集中国内优势资源、采用产学研用相结合进行开发的新机制方面也做了有益探索。

中国电子科技集团公司第十四研究所等单位在承担“核高基”重大专项高端通用芯片课题时,确立了“以需求为牵引”的研发指导思想和“产学研用”相结合的研发模式。在设计时,立足电子整机装备中高性能计算和信号处理需求,技术设计和应用设计同步进行,芯片研制成功后即可投入应用;组织实施中,整合优势资源,联合开发,短时间内有效解决了多核架构、矢量处理、工艺设计等多项关键技术,并搭建了产业化实施平台。

最新产品“华睿1号”高性能DSP芯片,国家重大科技项目课题成果,芯片性能经过独立第三方技术评测,综合性能指标国内领先。
●  片内集成4个高性能DSP处理器核
●  支持32位/64位浮点运算和8/16/32/64位定点运算
●  工作主频500MHz,处理能力32GFMACS
●  4MB分布式共享二级Cache,二级Cache/RAM动态可配置
●  2个64位带ECC的DDR2/3内存控制器
●  PCI/PCI-X,LPC,SPI,2个UART与16个GPIO,支持EJTAG在片调试
●  采用65nmCMOS工艺
●  功耗10W(4核,500MHz主频)
●  1121脚BGA封装


1、开发板规格
  ●  采用自主研发的“华睿1号”DSP芯片,主频550MHz
  ●  集成2个16位800MHz的HyperTransport控制器
  ●  集成2个64位400MHz的DDR2/3内存控制器
  ●  集成32位100MHz PCIX/66MHz PCI控制器
  ●  1个LPC、2个UART、1个SPI、16路GPIO接口

2、芯片组
  ●  集成ATI Radeon X1200显示内核,可支持双频显示
  ●  集成DDR2显存控制器,显存容量最大可达128MB
  ●  支持PCI-E插槽
  ●  集成SATA控制器
  ●  10个USB2.0/1.1端口
  ●  单通道IDE控制器
  ●  集成PCI控制器
  ●  AC’97接口
  ●  HD Audio接口
  ●  支持SMBus2.0
  ●  集成LPC控制器
  ●  两根DDR2 533/667 DIMM插槽,最大支持2GB内存
  ●  两根DDR3 DIMM插槽,最大支持2GB内存

3、插槽
  ●  1个PCI-E x8扩展槽
  ●  3个PCI-E x1扩展槽
  ●  3个PCI 32bit/33MHz扩展槽

4、网络
  ●  板载Intel 82574 10Mbps/100Mbps/1000Mbps网络控制器

5、音频
  ●  板载ALC888 7.1声道HD音频解码器
  ●  板载AD1819B 2.1声道AC’97音频解码器

6、 显示
  ●  1个DVI-I接口
  ●  VGA模式
○ 2048x1536 @85Hz (pixel clock at 388.5MHz) for 4:3 format
○ 2560x1440 @75Hz (pixel clock at 397.25MHz) for 16:9 format
○ 2456x1536 @60Hz (pixel clock at 320MHz) for 16:10 format
  ●  DVI模式
○ 视频模式:480p、720p、1080i
○ 2560x1600 @60Hz, with pixel clock at 268 MHz
  ●  板载128MB显存

7、板载周边
  ●  1个PS2鼠标键盘接口
  ●  1个并口
  ●  1个标准RS232串口
  ●  2个标准RS232串口插针接口
  ●  1个RJ45网口
  ●  6个USB2.0接口
  ●  1个AC’97标准音频接口
  ●  1个HD音频插针接口
  ●  2个SATA 1.0a接口
  ●  1个IDE接口
  ●  1个LPC接口

8、BIOS
  ●  4Mb Flash ROM用于系统BIOS存储

9、尺寸
  ●  标准ATX规格:305mm×244mm,可放置在标准ATX机箱中
  ●  标准ATX机箱电源

10、软件系统
  ●  Boot Loader: PMON
  ●  操作系统:Linux2.6.27及以上内核版本



“华睿1号”芯片在京发布 填补国内多核DSP领域空白

ugmbbc发布于 2010-12-27 23:24:31|6897 次阅读 字体:大 小 打印预览      



新华网北京 2010年12月27日电(苏海萍)由国内自主创新研发的“华睿1号”专用DSP芯片27日在京举行发布会。“华睿1号”的研制成功,填补了我国在多核DSP领域的空白,对提高我国高端芯片的自主研发能力、提升我国电子整机装备研制水平、保障国家信息安全等方面具有重大意义与影响。


发布会现场  

据“华睿1号”专用DSP芯片项目负责人介绍,“华睿1号”由中国电子科技集团公司第十四研究所、北京国睿中数科技股份有限公司以及清华大学联合研发。其中,在处理器系统设计方面,“华睿1号”采用了DSP和CPU多核架构设计技术。实测表明,“华睿1号”的处理能力和能耗具有明显优势,代表了我国目前专用DSP芯片的最高水平,芯片的整体技术指标达到或优于国际同类产品水平。同时,“华睿1号”在运行多任务实时操作系统十分稳定。

据了解,该课题2009年初被列入国家“核高基”重大专项,技术指标高,设计难度大,其复杂的DSP芯片设计和处理器配套软件开发,是世界前沿的研究课题。“华睿1号”DSP芯片在自主创新,开发并掌握核心技术及满足应用需求方面达到了重大专项的目标,在集中国内优势资源、采用产学研用相结合进行开发的新机制方面也做了有益探索。

中国电子科技集团公司第十四研究所等单位在承担“核高基”重大专项高端通用芯片课题时,确立了“以需求为牵引”的研发指导思想和“产学研用”相结合的研发模式。在设计时,立足电子整机装备中高性能计算和信号处理需求,技术设计和应用设计同步进行,芯片研制成功后即可投入应用;组织实施中,整合优势资源,联合开发,短时间内有效解决了多核架构、矢量处理、工艺设计等多项关键技术,并搭建了产业化实施平台。

最新产品“华睿1号”高性能DSP芯片,国家重大科技项目课题成果,芯片性能经过独立第三方技术评测,综合性能指标国内领先。
●  片内集成4个高性能DSP处理器核
●  支持32位/64位浮点运算和8/16/32/64位定点运算
●  工作主频500MHz,处理能力32GFMACS
●  4MB分布式共享二级Cache,二级Cache/RAM动态可配置
●  2个64位带ECC的DDR2/3内存控制器
●  PCI/PCI-X,LPC,SPI,2个UART与16个GPIO,支持EJTAG在片调试
●  采用65nmCMOS工艺
●  功耗10W(4核,500MHz主频)
●  1121脚BGA封装


1、开发板规格
  ●  采用自主研发的“华睿1号”DSP芯片,主频550MHz
  ●  集成2个16位800MHz的HyperTransport控制器
  ●  集成2个64位400MHz的DDR2/3内存控制器
  ●  集成32位100MHz PCIX/66MHz PCI控制器
  ●  1个LPC、2个UART、1个SPI、16路GPIO接口

2、芯片组
  ●  集成ATI Radeon X1200显示内核,可支持双频显示
  ●  集成DDR2显存控制器,显存容量最大可达128MB
  ●  支持PCI-E插槽
  ●  集成SATA控制器
  ●  10个USB2.0/1.1端口
  ●  单通道IDE控制器
  ●  集成PCI控制器
  ●  AC’97接口
  ●  HD Audio接口
  ●  支持SMBus2.0
  ●  集成LPC控制器
  ●  两根DDR2 533/667 DIMM插槽,最大支持2GB内存
  ●  两根DDR3 DIMM插槽,最大支持2GB内存

3、插槽
  ●  1个PCI-E x8扩展槽
  ●  3个PCI-E x1扩展槽
  ●  3个PCI 32bit/33MHz扩展槽

4、网络
  ●  板载Intel 82574 10Mbps/100Mbps/1000Mbps网络控制器

5、音频
  ●  板载ALC888 7.1声道HD音频解码器
  ●  板载AD1819B 2.1声道AC’97音频解码器

6、 显示
  ●  1个DVI-I接口
  ●  VGA模式
○ 2048x1536 @85Hz (pixel clock at 388.5MHz) for 4:3 format
○ 2560x1440 @75Hz (pixel clock at 397.25MHz) for 16:9 format
○ 2456x1536 @60Hz (pixel clock at 320MHz) for 16:10 format
  ●  DVI模式
○ 视频模式:480p、720p、1080i
○ 2560x1600 @60Hz, with pixel clock at 268 MHz
  ●  板载128MB显存

7、板载周边
  ●  1个PS2鼠标键盘接口
  ●  1个并口
  ●  1个标准RS232串口
  ●  2个标准RS232串口插针接口
  ●  1个RJ45网口
  ●  6个USB2.0接口
  ●  1个AC’97标准音频接口
  ●  1个HD音频插针接口
  ●  2个SATA 1.0a接口
  ●  1个IDE接口
  ●  1个LPC接口

8、BIOS
  ●  4Mb Flash ROM用于系统BIOS存储

9、尺寸
  ●  标准ATX规格:305mm×244mm,可放置在标准ATX机箱中
  ●  标准ATX机箱电源

10、软件系统
  ●  Boot Loader: PMON
  ●  操作系统:Linux2.6.27及以上内核版本

中数SOC封装及测试,截止到2010年5月31日合计销售额910.11万元、成本522.13万元、利润387.98万元、税收48.34万元

2008年,龙芯根据国内做雷达信号处理的单位的要求,研制一款信号处理芯片。他们觉得从国外买的数字信号处理芯片性能难以满足需求了,想重新定制一款满足他们要求的芯片。在合作过程中他们提的很多要求我们都觉得很难做到,但认真地去分析需求,结合结构和算法进行针对性设计,有分歧 就 讨 论 ,有 问 题 就 改 。两 年 之 后 ,我 们 发现该信号处理芯片已经世界领先了
呼叫在该所的snake出来解读一下。
于英特尔产值差太远了。
实测表明华睿1号单核处理1 024个单精度浮点复数FFT和数字脉压的运算时间分别为6.12μs和15.36μs,采用多线程FFT并行处理技术后,4核加速比可达3倍以上,满负荷功耗仅10 W,总体性能优于国内外同类处理器,适用于对实时性要求较高的雷达信号处理和电子对抗等领域。
====这个意思是不是说华睿一号当四核全用于处理1 024个单精度浮点复数FFT的运算时间是2μs左右?
似乎是X86架构的Soc。
hswz 发表于 2012-8-12 01:51
“华睿1号”芯片在京发布 填补国内多核DSP领域空白

ugmbbc发布于 2010-12-27 23:24:31|6897 次阅读 字体 ...
封装是1121脚呀!
DSP学起来很吃力的........
于英特尔产值差太远了。
跟intel比产值?
RAF 发表于 2012-8-12 02:20
似乎是X86架构的Soc。
一切参数都是龙芯3号的!是龙芯3A的向量版。看来J20的航电是龙芯3AV了
q901541q 发表于 2012-8-12 06:53
跟intel比产值?
intel有这种芯片吗
无道可道 发表于 2012-8-12 07:02
intel有这种芯片吗

有,就是i7和SNB  IVB ,但是雷达信号处理性能跟龙芯3还有差距
这是个好消息啊
DSP编程机制和CPU不同的
美国民用DSP主要是买TI的,军用是华强北。
百臂巨人 发表于 2012-8-12 08:04
DSP编程机制和CPU不同的
美国民用DSP主要是买TI的,军用是华强北。
你害得哥把一口茶喷到显示器上了
一砂 发表于 2012-8-12 08:24
你害得哥把一口茶喷到显示器上了
求真相?
破落户 发表于 2012-8-12 08:26
求真相?
无他,我看到华强北这三个字了。呵呵
问个小白点的问题:之前龙芯不是说造假的么?说是用英特的把商标磨掉,然后印上自己的标签?


哪看到的忘了,不过我就记得几年前大肆报道过龙芯,然后后面就一点动静都没了..........听说牵涉到学术造假那什么的去了..........
破落户 发表于 2012-8-12 07:06
有,就是i7和SNB  IVB ,但是雷达信号处理性能跟龙芯3还有差距
英特没军用版?
“核高基”重大专项,
冰封的泪 发表于 2012-8-12 08:41
问个小白点的问题:之前龙芯不是说造假的么?说是用英特的把商标磨掉,然后印上自己的标签?
你记错了,打磨的好像叫“汉芯”
冰封的泪 发表于 2012-8-12 08:42
英特没军用版?
不清楚!INTEL的向量做的还不错
冰封的泪 发表于 2012-8-12 08:41
问个小白点的问题:之前龙芯不是说造假的么?说是用英特的把商标磨掉,然后印上自己的标签?
造假的是汉芯,磨的商标好像是摩托罗拉的吧
打磨的也不是磨得intel啊。。。。dsp这玩意还真的没intel啥事。。。
怎么还在讨论1号?就不能说说2号吗?
洛尊 发表于 2012-8-12 08:52
怎么还在讨论1号?就不能说说2号吗?
就出2号了?!龙芯3C还没出来,就出花蕊2了?

jjyybear 发表于 2012-8-12 08:51
打磨的也不是磨得intel啊。。。。dsp这玩意还真的没intel啥事。。。


呵呵,就是龙芯3A的向量处理器,用的是4个GS464V!INTEL的处理器也向量化了,酷睿是128bit向量,SNB也是256bit向量
jjyybear 发表于 2012-8-12 08:51
打磨的也不是磨得intel啊。。。。dsp这玩意还真的没intel啥事。。。


呵呵,就是龙芯3A的向量处理器,用的是4个GS464V!INTEL的处理器也向量化了,酷睿是128bit向量,SNB也是256bit向量
DSP和CPU是两种东西,不要搞混了。

龙芯和DSP没有关系。
dipole 发表于 2012-8-12 09:04
DSP和CPU是两种东西,不要搞混了。

龙芯和DSP没有关系。
你确定?你知道龙芯的参数吗?龙芯的CPU号称是XPU,XPU=CPU+DSP+GPU+。。
dipole 发表于 2012-8-12 09:04
DSP和CPU是两种东西,不要搞混了。

龙芯和DSP没有关系。
请看清楚花蕊1的参数,再去翻看龙芯3A的技术参数!没有调查没有发言权
龙芯2诡异的双全能ALU设计当时的说法就是为了做快速傅立叶变换。
破落户 发表于 2012-8-12 09:08
请看清楚花蕊1的参数,再去翻看龙芯3A的技术参数!没有调查没有发言权
不需要调查。
自行百度cpu和dsp区别。
花蕊1应该是类似于cell的架构。
dipole 发表于 2012-8-12 09:16
不需要调查。
自行百度cpu和dsp区别。
花蕊1应该是类似于cell的架构。
你靠百度过日子,我什么也没说!
芯片尚未成功.........兔子仍须努力啊.........
破落户 发表于 2012-8-12 09:22
你靠百度过日子,我什么也没说!
基本知识都不懂,简单百度一下就知道的知识都不肯去学。

知道什么是FFT吗?

在TMS320C25上编写过FFT程序的人压力很大!

不需要调查。
自行百度cpu和dsp区别。
花蕊1应该是类似于cell的架构。
一般来说,通用处理器相对专用芯片来说性能功耗比比较差。一些龙芯 3 号的重要客户,需要龙芯 3 号能以超过DSP 的性能功耗比完成一些重要的信号处理应用。如何突破通用处理器的桎梏,让龙芯 3 号在较低的功耗上达到极高的性能呢?胡老师时常感慨“客户提出来的问题,  比论文里面的问题难多了”    。是的,但是龙芯的精神就是越难的问题就越要上。胡老师带着期许将这个艰巨的担子压在了年轻科研人员陈云霁的身上。陈云霁对 CPU、GPU、MPU 和 DSP 等芯片结构的异同进行了深入的思考,试图找出 CPU 性能功耗比差的本质原因。通过和胡老师的反复讨论,他们最终发现,通用处理器问题不在于计算部件不行,也不在于访存部件不行,而是访存部件的数据没有办法以合适的格式很舒服地喂给计算部件,很多带宽和时间都浪费在捣腾数据格式上了,最终导致性能功耗比差。因此,他们提出了 XPU 的结构,让处理器在数据通路的每个阶段都能自动地对数据进行重新组织,这样计算部分就能全负荷地开足马力,就一下子就解决了性能功耗比的问题。同时 XPU 作为CPU、GPU、 MPU 和 DSP 的融合,可以实现很多传统 CPU 不适合解决的信号,媒体处理问题
定制优化的DSP专用芯片,跟XPU满足的功能要求是不同的,技术基础一样。
毕竟主要驱动力源自数字阵列雷达需求,这东西是数字波束成形DBF的关键,EXL~
dipole 发表于 2012-8-12 09:40
基本知识都不懂,简单百度一下就知道的知识都不肯去学。

知道什么是FFT吗?
老了你!知识要更新了!
百臂巨人 发表于 2012-8-12 09:13
龙芯2诡异的双全能ALU设计当时的说法就是为了做快速傅立叶变换。
前些年帮着推广龙芯的开源大牛现在还继续帮着忽悠吗