CPU、GPU和APU：未来看谁的？

来源：百度文库编辑：超级军网时间：2024/04/28 12:03:20

CPU、GPU和APU：未来看谁的？
http://all.vic.sina.com.cn 2011年06月24日17:28 新浪资讯
　　一台电脑通常都是由很多不同功能的零部件组成的，那么有没有谁是最重要的？是被冠以“中央处理器”名号的CPU？或者是近年来势头正盛的GPU显卡？还是别的什么？民间流传的“唯CPU论”、“唯GPU论”两种说法究竟孰是孰非？

　　曾经有那么一段时间，CPU处理器的地位被有意无意地抬得相当高，甚至有太多人直接把它看作了电脑的代名词，将其等级标准直接与电脑的整体水平挂钩。2003年，Intel推出了迅驰笔记本平台，翩翩起舞的“小蝴蝶”让很多人第一次意识到电脑里并不只有CPU处理器，还有主板，还有显卡。经过几代的发展，平台化概念在大量用户心目中扎了根，不过莫名其妙的是，Intel又完全抛弃了迅驰概念，对于新平台的推广又回到了单独强调CPU、基本无视其他组件的老路上，CPU中心论再次甚嚣尘上。

　　与此同时，GPU中心论也冒了出来。GPU显卡的历史要比CPU处理器短得多，但进化速度却要快得多。短短几年的时间，GPU显卡在晶体管集成规模、芯片面积、计算性能等各个关键层面上都远远甩开了CPU处理器，就连制造工艺都赶了上来。在无法获得CPU处理器技术的情况下，NVIDIA利用CUDA、PhysX、3D Vision等自家私有技术把自己主营的GPU捧上了天，颇有取代CPU成为计算机灵魂的架势。

　　但是很显然，无论CPU还是GPU其实都只是计算机的一部分，二者谁也离不开谁，谁也不能代替谁。它们各有自己专注的技术领域和应用范围，是相辅相成的关系。CPU一般擅长处理不规则的数据结构和不可预测的存取模式，以及递归算法、分支密集型代码和单线程程序，通常要涉及复杂的指令调度、循环、分支、逻辑判断、执行等步骤。GPU则正好相反，擅于处理规则的数据结构和可预测的存取模式，具体应用包括光影处理、3D 坐标变换、科学计算等等。换句话说，CPU的长项是整数计算，GPU的优势则是浮点计算。对于整机性能而言，CPU和GPU都是性能的保障，合理的搭配才是重中之重，才能给用户带来最强的综合性能。这也符合“两手都要抓、两手都要硬”的客观规律。

　　就这样，在芯片业三巨头中，Intel依仗CPU，NVIDIA看重GPU，唯有AMD强调两手都要硬，推出了融合CPU和GPU的APU。作为业界唯一一家同时拥有处理器、芯片组和显卡三种核心组件的厂商，AMD多年来一直在卓有成效地强化推广平台化理念，并且逐渐把3A平台演化成了真正融合的Fusion APU。事实上，CPU与GPU未来的演进方向是就相互取长补短、走向融合，AMD APU的诞生与发展恰恰很好地印证了这样的趋势。

　　Intel的近两代处理器产品也集成了图形核心并加上了智能的名号，但说白了仅仅是CPU、GPU的简单整合，其发展思路更像是在CPU内整合GPU，偏重CPU而轻GPU。相比之下，AMD APU是基于融聚理念打造的全新处理器类型，不但把多核心处理器和独显级别图形核心融合到了同一颗芯片内，均衡配备CPU和GPU性能，糅合了双方的优势，还能实现CPU、GPU组成的异构计算，协同计算和彼此加速，从而带来全新的“加速”应用体验。在APU中，无论CPU部分还是GPU部分都支持OpenCL，OpenCL是第一个面向异构系统并行编程的开放式、免费标准，也是一个统一的编程环境，广泛适用于多核心CPU、GPU以及Cell类型架构等其他并行处理器，而且能够自动协调硬件资源，实现计算效率的最大化。AMD对于OpenCL的高度重视，无遗为CPU、GPU的融合与并行发展提供了坚实而稳定的桥梁。

　　对于现如今越来越流行的硬件加速应用，Fusion APU同样能完美地提供支持，包括视频播放、多媒体处理、图文办公、上网冲浪等等。无需用户干预，Fusion APU就能实现各种应用的加速，既提高执行效率，又节省硬件资源。在业界大趋势之下，再得益于良好的生态系统建设，APU的协同加速优势正在越发明显。

　　Fusion APU加速处理器到来之后，消费者不再需要去分别考虑选择什么样的CPU、GPU，以及二者是否搭配、协调，只要找到适合自己需要的相应等级的APU，就能获得合理的性能和完美的平衡，还能充分适应现代加速型社会。有人说Fusion APU是x86处理器走过了近半个世纪之后最伟大的一次创新，确实并不为过。

AMD 代号Llano的A系列APU芯片

http://vic.sina.com.cn/news/27/2011/0624/38184.htmlCPU、GPU和APU：未来看谁的？
http://all.vic.sina.com.cn 2011年06月24日17:28 新浪资讯
　　一台电脑通常都是由很多不同功能的零部件组成的，那么有没有谁是最重要的？是被冠以“中央处理器”名号的CPU？或者是近年来势头正盛的GPU显卡？还是别的什么？民间流传的“唯CPU论”、“唯GPU论”两种说法究竟孰是孰非？

　　曾经有那么一段时间，CPU处理器的地位被有意无意地抬得相当高，甚至有太多人直接把它看作了电脑的代名词，将其等级标准直接与电脑的整体水平挂钩。2003年，Intel推出了迅驰笔记本平台，翩翩起舞的“小蝴蝶”让很多人第一次意识到电脑里并不只有CPU处理器，还有主板，还有显卡。经过几代的发展，平台化概念在大量用户心目中扎了根，不过莫名其妙的是，Intel又完全抛弃了迅驰概念，对于新平台的推广又回到了单独强调CPU、基本无视其他组件的老路上，CPU中心论再次甚嚣尘上。

　　与此同时，GPU中心论也冒了出来。GPU显卡的历史要比CPU处理器短得多，但进化速度却要快得多。短短几年的时间，GPU显卡在晶体管集成规模、芯片面积、计算性能等各个关键层面上都远远甩开了CPU处理器，就连制造工艺都赶了上来。在无法获得CPU处理器技术的情况下，NVIDIA利用CUDA、PhysX、3D Vision等自家私有技术把自己主营的GPU捧上了天，颇有取代CPU成为计算机灵魂的架势。

　　但是很显然，无论CPU还是GPU其实都只是计算机的一部分，二者谁也离不开谁，谁也不能代替谁。它们各有自己专注的技术领域和应用范围，是相辅相成的关系。CPU一般擅长处理不规则的数据结构和不可预测的存取模式，以及递归算法、分支密集型代码和单线程程序，通常要涉及复杂的指令调度、循环、分支、逻辑判断、执行等步骤。GPU则正好相反，擅于处理规则的数据结构和可预测的存取模式，具体应用包括光影处理、3D 坐标变换、科学计算等等。换句话说，CPU的长项是整数计算，GPU的优势则是浮点计算。对于整机性能而言，CPU和GPU都是性能的保障，合理的搭配才是重中之重，才能给用户带来最强的综合性能。这也符合“两手都要抓、两手都要硬”的客观规律。

　　就这样，在芯片业三巨头中，Intel依仗CPU，NVIDIA看重GPU，唯有AMD强调两手都要硬，推出了融合CPU和GPU的APU。作为业界唯一一家同时拥有处理器、芯片组和显卡三种核心组件的厂商，AMD多年来一直在卓有成效地强化推广平台化理念，并且逐渐把3A平台演化成了真正融合的Fusion APU。事实上，CPU与GPU未来的演进方向是就相互取长补短、走向融合，AMD APU的诞生与发展恰恰很好地印证了这样的趋势。

　　Intel的近两代处理器产品也集成了图形核心并加上了智能的名号，但说白了仅仅是CPU、GPU的简单整合，其发展思路更像是在CPU内整合GPU，偏重CPU而轻GPU。相比之下，AMD APU是基于融聚理念打造的全新处理器类型，不但把多核心处理器和独显级别图形核心融合到了同一颗芯片内，均衡配备CPU和GPU性能，糅合了双方的优势，还能实现CPU、GPU组成的异构计算，协同计算和彼此加速，从而带来全新的“加速”应用体验。在APU中，无论CPU部分还是GPU部分都支持OpenCL，OpenCL是第一个面向异构系统并行编程的开放式、免费标准，也是一个统一的编程环境，广泛适用于多核心CPU、GPU以及Cell类型架构等其他并行处理器，而且能够自动协调硬件资源，实现计算效率的最大化。AMD对于OpenCL的高度重视，无遗为CPU、GPU的融合与并行发展提供了坚实而稳定的桥梁。

　　对于现如今越来越流行的硬件加速应用，Fusion APU同样能完美地提供支持，包括视频播放、多媒体处理、图文办公、上网冲浪等等。无需用户干预，Fusion APU就能实现各种应用的加速，既提高执行效率，又节省硬件资源。在业界大趋势之下，再得益于良好的生态系统建设，APU的协同加速优势正在越发明显。

　　Fusion APU加速处理器到来之后，消费者不再需要去分别考虑选择什么样的CPU、GPU，以及二者是否搭配、协调，只要找到适合自己需要的相应等级的APU，就能获得合理的性能和完美的平衡，还能充分适应现代加速型社会。有人说Fusion APU是x86处理器走过了近半个世纪之后最伟大的一次创新，确实并不为过。

AMD 代号Llano的A系列APU芯片

http://vic.sina.com.cn/news/27/2011/0624/38184.html

目前来说，Llano只是简单地把GPU和CPU集成在一个芯片上，没有多出彩的地方。
Llano更多的是提供了一个性价比高的CPU+GPU解决方案，对中高端玩家来说，意义不大，宁可按照传统方式，买个高性能不带GPU的CPU，再加高性能GPU。
真正的融合，还需要相当长的时间才能实现。

分久必合，合久必分呀

如果用户不打游戏或只打一些对特效要求不高的游戏，APU确实性价比很高。

我认为将来在内存模式上应当先突破一把，比如消除专用显存与内存的界限，让GPU的单元直接访问主内存。这样，利用GPU的计算能力可能会更加方便一点。

从性价比角度来说，还是APU吧。

价格出来了。
首先是顶级型号A8-3850，四核心，主频2.9GHz，集成400个流处理器的图形核心Radeon HD 6550D，价格定在135美元，约合人民币870元。
其次是A6-3650，同样四核心，主频降至2.6GHz，集成320个流处理器的图形核心Radeon HD 6530D，价格定在115美元，约合人民币740元。
比Phenom II X4 965还便宜，但我感觉cpu性能没有Phenom好。

http://www.anandtech.com/bench/CPU/2
根据这个测试，A8-3850(164分)只相当于Athlon II X4 645的水平，与Core i3 2100(215分)差距甚远，跟Phenom II X4 965(205分)比也弱不少。

http://www.anandtech.com/bench/CPU/2
根据这个测试，A8-3850(164分)只相当于Athlon II X4 645的水平，与Core i3 2100(215分)差距甚远，跟Phenom II X4 965(205分)比也弱不少。

从大型3D应用的角度来讲，高级场景渲染方法（像光线追踪、光子发射）和物理仿真都需要遍历场景图（至少遍历一部分），而这两个操作都有挺高的并发性质。那么弄出一种通用的众核系统同时处理这两者，是符合常理的。

jiandingzhe 发表于 2011-6-30 16:14
从大型3D应用的角度来讲，高级场景渲染方法（像光线追踪、光子发射）和物理仿真都需要遍历场景图（至少遍历 ...
现在的双路16核工作站就可以啊，再不够可以用小型机。

壮东风发表于 2011-6-30 18:23
现在的双路16核工作站就可以啊，再不够可以用小型机。
工作站那也才16核，而GPGPU可以做到在台式机、笔记本上就有几百核。

架构还是那个架构，就多一入门集显。。。。
拖拉机出来再不给力阿曼达真该洗洗睡了

不过跳票不断前景堪忧啊

jiandingzhe 发表于 2011-6-30 18:48
工作站那也才16核，而GPGPU可以做到在台式机、笔记本上就有几百核。
这就属于专业设备了，通用CPU不太可能做到。

begripfury 发表于 2011-6-30 19:24
架构还是那个架构，就多一入门集显。。。。
拖拉机出来再不给力阿曼达真该洗洗睡了
推土机架构的FX对应i5，可能要上1500了。
现在买个AMD用来打游戏，我看还不如入手Phenom II X4 970加一块好显卡来得划算。

壮东风发表于 2011-6-30 20:52
这就属于专业设备了，通用CPU不太可能做到。
Nvidia稍微好点的笔记本显卡就有一百多核，而且还不是最好的。

jiandingzhe 发表于 2011-6-30 21:44
Nvidia稍微好点的笔记本显卡就有一百多核，而且还不是最好的。
你说的核是显卡的处理单元，跟cpu的核心不是一个概念，充其量体现了吞吐量而已。

壮东风发表于 2011-6-30 22:38
你说的核是显卡的处理单元，跟cpu的核心不是一个概念，充其量体现了吞吐量而已。
这我知道，GPU的核只有简单计算功能，通常没有乱序什么的。
不过，GPU的核是向量优化的，这也适应物理模拟。
感觉3D物理模拟和3D渲染其实有不少类似之处。

jiandingzhe 发表于 2011-7-1 11:35
这我知道，GPU的核只有简单计算功能，通常没有乱序什么的。
不过，GPU的核是向量优化的，这也适应物理模 ...
这样说来，现在的显卡已经做得很好了。

壮东风发表于 2011-7-1 11:46
这样说来，现在的显卡已经做得很好了。
还是不够爽。
显卡依然是另外一个设备，需要数据反复在内存和显存之间倒腾。

jiandingzhe 发表于 2011-7-1 11:51
还是不够爽。
显卡依然是另外一个设备，需要数据反复在内存和显存之间倒腾。
不知道cuda 4.0?

persianmoon 发表于 2011-7-1 20:56
不知道cuda 4.0?
不专门搞这个，不很关注……

No-copy pinning of system memory, a faster alternative to cudaMallocHost()

是这个特性么？看来挺爽。

persianmoon 发表于 2011-7-1 20:56
不知道cuda 4.0?
但我依然不够满意……

嗯……它依然要nvidia特制的nvcc，不能用通用编译器。

肉乎乎发表于 2011-7-1 23:03
但我依然不够满意……
嗯……它依然要nvidia特制的nvcc，不能用通用编译器。
俗话说三个和尚没水喝，开放的不一定比私有的好

肉乎乎发表于 2011-7-1 23:01
不专门搞这个，不很关注……

是这个特性么？看来挺爽。
4.0很多特性都很high

persianmoon 发表于 2011-7-2 00:13
俗话说三个和尚没水喝，开放的不一定比私有的好
嗯，这也是。
另外，是不是说如果我用了nvcc，整个程序就全得用nvcc？
能不能把与cuda相关的部分编成一个动态库，程序其它部分仍然用正常的编译器？

jiandingzhe 发表于 2011-7-2 09:29
嗯，这也是。
另外，是不是说如果我用了nvcc，整个程序就全得用nvcc？
能不能把与cuda相关的部分编成一 ...
问我不如去问技术文档，哈哈

CPU、GPU和APU：未来看谁的？哪个网站有CPU和GPU成绩的列表啊？关于cpu和gpu的关系，做个粗糙的趣味测试大家笔记本CPU和GPU温度一般保持多少？三星大爆发将自主研发GPU和CPU核心分辩率为2048*1536安卓平板电脑用什么配套cpU和GpU比较 ... 台積電獲英特爾雙料訂單　首度通吃CPU、GPU代工 AMD最近有没有游戏性能和I5拼一下的CPU。未来有没有性能 ... 看细节处，看细节处--怎么会有这么大的区分--APU 发动机 ... 有点意思：IBM批量购买ARM CPU/GPU授权在京东上买的主板和CPU 为什么和C17一样，Y20的APU要装在起落架舱？而不是像919 ...