CPU、GPU和APU:未来看谁的?

来源:百度文库 编辑:超级军网 时间:2024/04/28 12:03:20
CPU、GPU和APU:未来看谁的?
http://all.vic.sina.com.cn 2011年06月24日17:28  新浪资讯
  一台电脑通常都是由很多不同功能的零部件组成的,那么有没有谁是最重要的?是被冠以“中央处理器”名号的CPU?或者是近年来势头正盛的GPU显卡?还是别的什么?民间流传的“唯CPU论”、“唯GPU论”两种说法究竟孰是孰非?

  曾经有那么一段时间,CPU处理器的地位被有意无意地抬得相当高,甚至有太多人直接把它看作了电脑的代名词,将其等级标准直接与电脑的整体水平挂钩。2003年,Intel推出了迅驰笔记本平台,翩翩起舞的“小蝴蝶”让很多人第一次意识到电脑里并不只有CPU处理器,还有主板,还有显卡。经过几代的发展,平台化概念在大量用户心目中扎了根,不过莫名其妙的是,Intel又完全抛弃了迅驰概念,对于新平台的推广又回到了单独强调CPU、基本无视其他组件的老路上,CPU中心论再次甚嚣尘上。

  与此同时,GPU中心论也冒了出来。GPU显卡的历史要比CPU处理器短得多,但进化速度却要快得多。短短几年的时间,GPU显卡在晶体管集成规模、芯片面积、计算性能等各个关键层面上都远远甩开了CPU处理器,就连制造工艺都赶了上来。在无法获得CPU处理器技术的情况下,NVIDIA利用CUDA、PhysX、3D Vision等自家私有技术把自己主营的GPU捧上了天,颇有取代CPU成为计算机灵魂的架势。

  但是很显然,无论CPU还是GPU其实都只是计算机的一部分,二者谁也离不开谁,谁也不能代替谁。它们各有自己专注的技术领域和应用范围,是相辅相成的关系。CPU一般擅长处理不规则的数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序,通常要涉及复杂的指令调度、循环、分支、逻辑判断、执行等步骤。GPU则正好相反,擅于处理规则的数据结构和可预测的存取模式,具体应用包括光影处理、3D 坐标变换、科学计算等等。换句话说,CPU的长项是整数计算,GPU的优势则是浮点计算。对于整机性能而言,CPU和GPU都是性能的保障,合理的搭配才是重中之重,才能给用户带来最强的综合性能。这也符合“两手都要抓、两手都要硬”的客观规律。

  就这样,在芯片业三巨头中,Intel依仗CPU,NVIDIA看重GPU,唯有AMD强调两手都要硬,推出了融合CPU和GPU的APU。作为业界唯一一家同时拥有处理器、芯片组和显卡三种核心组件的厂商,AMD多年来一直在卓有成效地强化推广平台化理念,并且逐渐把3A平台演化成了真正融合的Fusion APU。事实上,CPU与GPU未来的演进方向是就相互取长补短、走向融合,AMD APU的诞生与发展恰恰很好地印证了这样的趋势。

  Intel的近两代处理器产品也集成了图形核心并加上了智能的名号,但说白了仅仅是CPU、GPU的简单整合,其发展思路更像是在CPU内整合GPU,偏重CPU而轻GPU。相比之下,AMD APU是基于融聚理念打造的全新处理器类型,不但把多核心处理器和独显级别图形核心融合到了同一颗芯片内,均衡配备CPU和GPU性能,糅合了双方的优势,还能实现CPU、GPU组成的异构计算,协同计算和彼此加速,从而带来全新的“加速”应用体验。在APU中,无论CPU部分还是GPU部分都支持OpenCL,OpenCL是第一个面向异构系统并行编程的开放式、免费标准,也是一个统一的编程环境,广泛适用于多核心CPU、GPU以及Cell类型架构等其他并行处理器,而且能够自动协调硬件资源,实现计算效率的最大化。AMD对于OpenCL的高度重视,无遗为CPU、GPU的融合与并行发展提供了坚实而稳定的桥梁。

  对于现如今越来越流行的硬件加速应用,Fusion APU同样能完美地提供支持,包括视频播放、多媒体处理、图文办公、上网冲浪等等。无需用户干预,Fusion APU就能实现各种应用的加速,既提高执行效率,又节省硬件资源。在业界大趋势之下,再得益于良好的生态系统建设,APU的协同加速优势正在越发明显。

  Fusion APU加速处理器到来之后,消费者不再需要去分别考虑选择什么样的CPU、GPU,以及二者是否搭配、协调,只要找到适合自己需要的相应等级的APU,就能获得合理的性能和完美的平衡,还能充分适应现代加速型社会。有人说Fusion APU是x86处理器走过了近半个世纪之后最伟大的一次创新,确实并不为过。

   

AMD 代号Llano的A系列APU芯片

http://vic.sina.com.cn/news/27/2011/0624/38184.htmlCPU、GPU和APU:未来看谁的?
http://all.vic.sina.com.cn 2011年06月24日17:28  新浪资讯
  一台电脑通常都是由很多不同功能的零部件组成的,那么有没有谁是最重要的?是被冠以“中央处理器”名号的CPU?或者是近年来势头正盛的GPU显卡?还是别的什么?民间流传的“唯CPU论”、“唯GPU论”两种说法究竟孰是孰非?

  曾经有那么一段时间,CPU处理器的地位被有意无意地抬得相当高,甚至有太多人直接把它看作了电脑的代名词,将其等级标准直接与电脑的整体水平挂钩。2003年,Intel推出了迅驰笔记本平台,翩翩起舞的“小蝴蝶”让很多人第一次意识到电脑里并不只有CPU处理器,还有主板,还有显卡。经过几代的发展,平台化概念在大量用户心目中扎了根,不过莫名其妙的是,Intel又完全抛弃了迅驰概念,对于新平台的推广又回到了单独强调CPU、基本无视其他组件的老路上,CPU中心论再次甚嚣尘上。

  与此同时,GPU中心论也冒了出来。GPU显卡的历史要比CPU处理器短得多,但进化速度却要快得多。短短几年的时间,GPU显卡在晶体管集成规模、芯片面积、计算性能等各个关键层面上都远远甩开了CPU处理器,就连制造工艺都赶了上来。在无法获得CPU处理器技术的情况下,NVIDIA利用CUDA、PhysX、3D Vision等自家私有技术把自己主营的GPU捧上了天,颇有取代CPU成为计算机灵魂的架势。

  但是很显然,无论CPU还是GPU其实都只是计算机的一部分,二者谁也离不开谁,谁也不能代替谁。它们各有自己专注的技术领域和应用范围,是相辅相成的关系。CPU一般擅长处理不规则的数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序,通常要涉及复杂的指令调度、循环、分支、逻辑判断、执行等步骤。GPU则正好相反,擅于处理规则的数据结构和可预测的存取模式,具体应用包括光影处理、3D 坐标变换、科学计算等等。换句话说,CPU的长项是整数计算,GPU的优势则是浮点计算。对于整机性能而言,CPU和GPU都是性能的保障,合理的搭配才是重中之重,才能给用户带来最强的综合性能。这也符合“两手都要抓、两手都要硬”的客观规律。

  就这样,在芯片业三巨头中,Intel依仗CPU,NVIDIA看重GPU,唯有AMD强调两手都要硬,推出了融合CPU和GPU的APU。作为业界唯一一家同时拥有处理器、芯片组和显卡三种核心组件的厂商,AMD多年来一直在卓有成效地强化推广平台化理念,并且逐渐把3A平台演化成了真正融合的Fusion APU。事实上,CPU与GPU未来的演进方向是就相互取长补短、走向融合,AMD APU的诞生与发展恰恰很好地印证了这样的趋势。

  Intel的近两代处理器产品也集成了图形核心并加上了智能的名号,但说白了仅仅是CPU、GPU的简单整合,其发展思路更像是在CPU内整合GPU,偏重CPU而轻GPU。相比之下,AMD APU是基于融聚理念打造的全新处理器类型,不但把多核心处理器和独显级别图形核心融合到了同一颗芯片内,均衡配备CPU和GPU性能,糅合了双方的优势,还能实现CPU、GPU组成的异构计算,协同计算和彼此加速,从而带来全新的“加速”应用体验。在APU中,无论CPU部分还是GPU部分都支持OpenCL,OpenCL是第一个面向异构系统并行编程的开放式、免费标准,也是一个统一的编程环境,广泛适用于多核心CPU、GPU以及Cell类型架构等其他并行处理器,而且能够自动协调硬件资源,实现计算效率的最大化。AMD对于OpenCL的高度重视,无遗为CPU、GPU的融合与并行发展提供了坚实而稳定的桥梁。

  对于现如今越来越流行的硬件加速应用,Fusion APU同样能完美地提供支持,包括视频播放、多媒体处理、图文办公、上网冲浪等等。无需用户干预,Fusion APU就能实现各种应用的加速,既提高执行效率,又节省硬件资源。在业界大趋势之下,再得益于良好的生态系统建设,APU的协同加速优势正在越发明显。

  Fusion APU加速处理器到来之后,消费者不再需要去分别考虑选择什么样的CPU、GPU,以及二者是否搭配、协调,只要找到适合自己需要的相应等级的APU,就能获得合理的性能和完美的平衡,还能充分适应现代加速型社会。有人说Fusion APU是x86处理器走过了近半个世纪之后最伟大的一次创新,确实并不为过。

   

AMD 代号Llano的A系列APU芯片

http://vic.sina.com.cn/news/27/2011/0624/38184.html
目前来说,Llano只是简单地把GPU和CPU集成在一个芯片上,没有多出彩的地方。
Llano更多的是提供了一个性价比高的CPU+GPU解决方案,对中高端玩家来说,意义不大,宁可按照传统方式,买个高性能不带GPU的CPU,再加高性能GPU。
真正的融合,还需要相当长的时间才能实现。
分久必合,合久必分呀
如果用户不打游戏或只打一些对特效要求不高的游戏,APU确实性价比很高。
我认为将来在内存模式上应当先突破一把,比如消除专用显存与内存的界限,让GPU的单元直接访问主内存。这样,利用GPU的计算能力可能会更加方便一点。
从性价比角度来说,还是APU吧。
价格出来了。
首先是顶级型号A8-3850,四核心,主频2.9GHz,集成400个流处理器的图形核心Radeon HD 6550D,价格定在135美元,约合人民币870元。
其次是A6-3650,同样四核心,主频降至2.6GHz,集成320个流处理器的图形核心Radeon HD 6530D,价格定在115美元,约合人民币740元。
比Phenom II X4 965还便宜,但我感觉cpu性能没有Phenom好。


http://www.anandtech.com/bench/CPU/2
根据这个测试,A8-3850(164分)只相当于Athlon II X4 645的水平,与Core i3 2100(215分)差距甚远,跟Phenom II X4 965(205分)比也弱不少。

http://www.anandtech.com/bench/CPU/2
根据这个测试,A8-3850(164分)只相当于Athlon II X4 645的水平,与Core i3 2100(215分)差距甚远,跟Phenom II X4 965(205分)比也弱不少。
从大型3D应用的角度来讲,高级场景渲染方法(像光线追踪、光子发射)和物理仿真都需要遍历场景图(至少遍历一部分),而这两个操作都有挺高的并发性质。那么弄出一种通用的众核系统同时处理这两者,是符合常理的。
jiandingzhe 发表于 2011-6-30 16:14
从大型3D应用的角度来讲,高级场景渲染方法(像光线追踪、光子发射)和物理仿真都需要遍历场景图(至少遍历 ...
现在的双路16核工作站就可以啊,再不够可以用小型机。
壮东风 发表于 2011-6-30 18:23
现在的双路16核工作站就可以啊,再不够可以用小型机。
工作站那也才16核,而GPGPU可以做到在台式机、笔记本上就有几百核。
架构还是那个架构,就多一入门集显。。。。
拖拉机出来再不给力阿曼达真该洗洗睡了
不过跳票不断前景堪忧啊
jiandingzhe 发表于 2011-6-30 18:48
工作站那也才16核,而GPGPU可以做到在台式机、笔记本上就有几百核。
这就属于专业设备了,通用CPU不太可能做到。
begripfury 发表于 2011-6-30 19:24
架构还是那个架构,就多一入门集显。。。。
拖拉机出来再不给力阿曼达真该洗洗睡了
推土机架构的FX对应i5,可能要上1500了。
现在买个AMD用来打游戏,我看还不如入手Phenom II X4 970加一块好显卡来得划算。
壮东风 发表于 2011-6-30 20:52
这就属于专业设备了,通用CPU不太可能做到。
Nvidia稍微好点的笔记本显卡就有一百多核,而且还不是最好的。
jiandingzhe 发表于 2011-6-30 21:44
Nvidia稍微好点的笔记本显卡就有一百多核,而且还不是最好的。
你说的核是显卡的处理单元,跟cpu的核心不是一个概念,充其量体现了吞吐量而已。
壮东风 发表于 2011-6-30 22:38
你说的核是显卡的处理单元,跟cpu的核心不是一个概念,充其量体现了吞吐量而已。
这我知道,GPU的核只有简单计算功能,通常没有乱序什么的。
不过,GPU的核是向量优化的,这也适应物理模拟。
感觉3D物理模拟和3D渲染其实有不少类似之处。
jiandingzhe 发表于 2011-7-1 11:35
这我知道,GPU的核只有简单计算功能,通常没有乱序什么的。
不过,GPU的核是向量优化的,这也适应物理模 ...
这样说来,现在的显卡已经做得很好了。
壮东风 发表于 2011-7-1 11:46
这样说来,现在的显卡已经做得很好了。
还是不够爽。
显卡依然是另外一个设备,需要数据反复在内存和显存之间倒腾。
jiandingzhe 发表于 2011-7-1 11:51
还是不够爽。
显卡依然是另外一个设备,需要数据反复在内存和显存之间倒腾。
不知道cuda 4.0?
persianmoon 发表于 2011-7-1 20:56
不知道cuda 4.0?
不专门搞这个,不很关注……
No-copy pinning of system memory, a faster alternative to cudaMallocHost()

是这个特性么?看来挺爽。
persianmoon 发表于 2011-7-1 20:56
不知道cuda 4.0?
但我依然不够满意……
嗯……它依然要nvidia特制的nvcc,不能用通用编译器。
肉乎乎 发表于 2011-7-1 23:03
但我依然不够满意……
嗯……它依然要nvidia特制的nvcc,不能用通用编译器。
俗话说三个和尚没水喝,开放的不一定比私有的好
肉乎乎 发表于 2011-7-1 23:01
不专门搞这个,不很关注……

是这个特性么?看来挺爽。
4.0很多特性都很high
persianmoon 发表于 2011-7-2 00:13
俗话说三个和尚没水喝,开放的不一定比私有的好
嗯,这也是。
另外,是不是说如果我用了nvcc,整个程序就全得用nvcc?
能不能把与cuda相关的部分编成一个动态库,程序其它部分仍然用正常的编译器?
jiandingzhe 发表于 2011-7-2 09:29
嗯,这也是。
另外,是不是说如果我用了nvcc,整个程序就全得用nvcc?
能不能把与cuda相关的部分编成一 ...
问我不如去问技术文档,哈哈