通用处理器向量扩展后的信号处理性能

来源:百度文库 编辑:超级军网 时间:2024/05/08 07:50:47
GS 464V是龙芯3B的核心8核处理1024点复数FFT是0.37us,单核是2.95us.(单核峰值是32gflops,根据给出的>87%峰值性能,1024点复数FFT的性能是接近28gflops)core i7 2710QE是SNB处理器,频率是2.1G,测试单核,时间1024点FFT是2.44us,图给出是21gflops,是峰值性能的62.5%.(2.1G的SNB单核单浮点是33.6gflops)GS 464V是龙芯3B的核心8核处理1024点复数FFT是0.37us,单核是2.95us.(单核峰值是32gflops,根据给出的>87%峰值性能,1024点复数FFT的性能是接近28gflops)core i7 2710QE是SNB处理器,频率是2.1G,测试单核,时间1024点FFT是2.44us,图给出是21gflops,是峰值性能的62.5%.(2.1G的SNB单核单浮点是33.6gflops)
锁前留名
迷乱 发表于 2013-2-3 17:46
锁前留名
为什么锁?;funk
花落庭院 发表于 2013-2-3 17:53
为什么锁?
版主会给你答案  三围最少扣10分。
迷乱 发表于 2013-2-3 18:01
版主会给你答案  三围最少扣10分。
有那三围?
看了2楼,坐等版主答案
坐等版主答案
屌丝看不懂,能不能和INTEL的CPU对比下,然后性能多少%,功耗,制作工艺呢
suosha 发表于 2013-2-3 19:56
屌丝看不懂,能不能和INTEL的CPU对比下,然后性能多少%,功耗,制作工艺呢
core i7 2170QE就是INTEL的CPU


不懂,等解毒
似乎是对比龙芯3b和i7的单核性能?
似乎3b不错啊?

不懂,等解毒
似乎是对比龙芯3b和i7的单核性能?
似乎3b不错啊?
虚头八脑的
悠游的鱼 发表于 2013-2-3 21:02
不懂,等解毒
似乎是对比龙芯3b和i7的单核性能?
似乎3b不错啊?
这个是科学计算的一部分,没看出我给的数据很蹊跷,其实INTEL的数学库MKL非常厉害的!
如果这个2.95和2.44是可比的话--
21g flops跑出2.44,那跑2.95的应该是17g flops多些才对。效率也就是50%多一点
另此帖应转it版。
龙芯组用老core i7920的单线程比较过,2.66G的峰值单精度浮点是21.28gflops,1024点complex FFT性能是13.96gflops,用时间是3.67us,使用INTEL的MKL数学库测试。
花落庭院 发表于 2013-2-4 08:45
龙芯组用老core i7920的单线程比较过,2.66G的峰值单精度浮点是21.28gflops,1024点complex FFT性能是13.96 ...
这么算龙芯的1024点性能不就是18g左右?
禁止发一句话帖。等杀之来杀
deam 发表于 2013-2-4 14:58
这么算龙芯的1024点性能不就是18g左右?
我给的第一个图是胡伟武发表在斯坦福大学的hotchips 大会的论文。那个>87%of peak performance,没看见吗?除非GS464V在1G的情况下单精度峰值只有21gflops,就可以认为是18GFLOPS,至于为什么INTEL的FFT性能21GFLOPS能达到2.44us,而GS464V的87%是2.95us,原因自己去找。


"peak"啥意思我不知道。

但显然这个fft的us和flops是反比关系,不存在相同项目测得us高而flops也反而高的情况。

"peak"啥意思我不知道。

但显然这个fft的us和flops是反比关系,不存在相同项目测得us高而flops也反而高的情况。
Plots

To report FFT performance, we plot the "mflops" of each FFT, which is a scaled version of the speed, defined by:

mflops = 5 N log2(N) / (time for one FFT in microseconds) for complex transforms, and

mflops = 2.5 N log2(N) / (time for one FFT in microseconds) for real transforms,
where N is number of data points (the product of the FFT dimensions).
所以2.44us时,gflops为:5*1024*log2(1024)/2.44/1000=21
deam 发表于 2013-2-4 22:05
所以2.44us时,gflops为:5*1024*log2(1024)/2.44/1000=21
假如这么简单就没事了。你给我算一下TS 201的性能。(2个乘法器,600M的频率,4.8GFLOPS的峰值)16us怎么上的3.6GFLOPS?

花落庭院 发表于 2013-2-5 10:38
假如这么简单就没事了。你给我算一下TS 201的性能。(2个乘法器,600M的频率,4.8GFLOPS的峰值)16us怎么 ...


你确定那个3.6 gflops指的是fft 1024点持续性能?不要自己随便去猜测。

fft的flops和us什么关系,我上面给的公式非常清楚
花落庭院 发表于 2013-2-5 10:38
假如这么简单就没事了。你给我算一下TS 201的性能。(2个乘法器,600M的频率,4.8GFLOPS的峰值)16us怎么 ...


你确定那个3.6 gflops指的是fft 1024点持续性能?不要自己随便去猜测。

fft的flops和us什么关系,我上面给的公式非常清楚
deam 发表于 2013-2-5 15:08
你确定那个3.6 gflops指的是fft 1024点持续性能?不要自己随便去猜测。

fft的flops和us什么关系,我上 ...
不能确定呀!就是搞不清楚GS464V的那个>87% of peak performance,才发帖子的。除非有两个peak performance。哈哈哈哈。
不能确定呀!就是搞不清楚GS464V的那个>87% of peak performance,才发帖子的。除非有两个peak performan ...
你在这里发帖子想让谁给你回答?有问题自己问计算所去
deam 发表于 2013-2-5 18:17
你在这里发帖子想让谁给你回答?有问题自己问计算所去
这个本来发在军事畅谈里的,准备给搞雷达信号处理的人看的,不幸被移这里了。
再看看MPC 8641跟TS201数据对比
花落庭院 发表于 2013-2-6 12:02
**** 作者被禁止或删除 内容自动屏蔽 ****
FPGA用的什么芯片啊?