从公开资料看,sw1600是256位浮点单元的专用处理器

来源:百度文库 编辑:超级军网 时间:2024/04/29 13:51:02
从公开资料看,sw1600每核心每时钟可以执行8次双精度浮点运算,只有浮点单元达到256位时,每时钟可以执行两次256位浮点运算(一次浮点加法和一次浮点乘法),或者8次双精度(64位)浮点运算,而早期Alpha每核心每时钟只能执行两次双精度浮点运算,说明江南所改进非常大。现有商用处理器只有Intel的SB架构才能在特定编译器下,整数Simd单元和浮点Simd单元一起运算执行AVX指令才能进行256位浮点运算,但SB架构的浮点单元其实是128位的。正也看出Sw1600使用Alpha的MIMD架构的强大。sw1600这种极端加强浮点单元的特点,不太像民用处理器,更像配合高性能Dsp或者Fpga用在大型相控阵雷达的主控芯片上,否则别的地方用不着这么大的数据运算量。这个是典型的军转民,但用在商业计算机上有点牛刀杀鸡了。从公开资料看,sw1600每核心每时钟可以执行8次双精度浮点运算,只有浮点单元达到256位时,每时钟可以执行两次256位浮点运算(一次浮点加法和一次浮点乘法),或者8次双精度(64位)浮点运算,而早期Alpha每核心每时钟只能执行两次双精度浮点运算,说明江南所改进非常大。现有商用处理器只有Intel的SB架构才能在特定编译器下,整数Simd单元和浮点Simd单元一起运算执行AVX指令才能进行256位浮点运算,但SB架构的浮点单元其实是128位的。正也看出Sw1600使用Alpha的MIMD架构的强大。sw1600这种极端加强浮点单元的特点,不太像民用处理器,更像配合高性能Dsp或者Fpga用在大型相控阵雷达的主控芯片上,否则别的地方用不着这么大的数据运算量。这个是典型的军转民,但用在商业计算机上有点牛刀杀鸡了。
数字信号处理……是整数运算……
而且CPU比整数是绝对比不过同规模DSP的。
我承认我是IT盲,看的云里雾里,只能纯为技术进步加油
LZ科普下吧
噗通噗嗵

百臂巨人 发表于 2011-10-31 14:06
数字信号处理……是整数运算……
而且CPU比整数是绝对比不过同规模DSP的。


数字信号处理也有浮点的,像声纳、超宽带雷达的智能信号处理浮点dsp用得很多。
不过sw1600显然不是为信号处理而生的,它的体系结构主要面向超级计算进行优化。
百臂巨人 发表于 2011-10-31 14:06
数字信号处理……是整数运算……
而且CPU比整数是绝对比不过同规模DSP的。


数字信号处理也有浮点的,像声纳、超宽带雷达的智能信号处理浮点dsp用得很多。
不过sw1600显然不是为信号处理而生的,它的体系结构主要面向超级计算进行优化。
通用架构怎么可以和DSP比呢
一般来说科学和工程计算主要是浮点,桌面级的主要用到整数
数字信号处理也有浮点的,像声纳、超宽带雷达的智能信号处理浮点dsp用得很多。  不过sw1600显然不是为信 ...
绝对不像对超算优化,单核心效率80%整机74%,表明缓存命中精度低,很显然缓存很小,与它的65纳米工艺正相合,这样小的缓存绝对不是为超算优化的
服务器Cpu的特点是整数运算强,这个肯定也不是,它根本就是一种大型火控计算机的Cpu
楼主的意思是这个cpu其实是TB的军用cpu改民用的?或者说是军用上的低档货量产改民用?


它没有任何商用cpu的特征,这种极端强化浮点运算,明显是用来大型相控阵雷达目标参数解算的,如果J10B的火控计算机是这个,J10B与F18E/F同时发现目标的话,J10B肯定要早开火好几秒钟

它没有任何商用cpu的特征,这种极端强化浮点运算,明显是用来大型相控阵雷达目标参数解算的,如果J10B的火控计算机是这个,J10B与F18E/F同时发现目标的话,J10B肯定要早开火好几秒钟
lz是高人啊!求详细科普
Intel的SB架构
helialpha 发表于 2011-10-31 14:39
它没有任何商用cpu的特征,这种极端强化浮点运算,明显是用来大型相控阵雷达目标参数解算的,如果J10B的火控 ...
給力[:a2:][:a2:]
楼主高人啊
确实申威1600有256位的浮点单元
有人说是总参54所的。
和以前HP的alpha有点关系。
改做显卡不知性能如何……
现在明显了  是超算CPU  神威  千万次 JJ