AMD、ARM、华为、IBM等组CCIX联盟,Intel~nvidia旁观?

来源:百度文库 编辑:超级军网 时间:2024/04/24 00:03:03
CPU处理器擅长通用任务处理,GPU这样的处理器则擅长专用处理,但浮点性能极强,CPU+GPU这样的异构运算在当前已不鲜见,而它只是主处理器+加速器架构中的一种,其他还有CPU+FPGA、CPU+网络芯片等等。为了统一加速器芯片互联,AMD、ARM、华为、IBM、高通、Mellanox及Xilinx赛灵思七家公司组建了CCIX联盟,共推开放加速器架构,不过Intel及NVIDIA两家公司并没有参与其中。[图片]AMD、华为、ARM等七家公司组建CCIX联盟
出于功耗及空间方面的考虑,数据中心等应用中已经开始使用加速器,大数据分析、搜索、机器学习、NFV(网络虚拟化)、4G/5G无线、内存内数据处理、视频分析及网络处理等应用中已经受益于可在不同系统架构中无缝移动数据的加速器引擎。
目前的加速器大多数是基于PCI-E总线,不过PCI-E 3.0总线虽然在显卡上够用了,但在数据中心应用中存在带宽低、延迟高的问题,PCI-E 4.0总线又迟迟不能问世,所以AMD、ARM、华为、IBM等七大公司组建了CCIX联盟,他们将推动统一的加速器标准,目标就是创造出带宽更高、延迟更低、TCO成本更低的加速器标准,支持处理器及加速器之间的缓存一致性。
值得注意的是,这七家公司中并没有Intel及NVIDIA的身影,这并不是他们不重视加速器应用,实际上这两家公司已经有自己的解决方案。
对Intel来说,他们花了160多亿收购了Altera公司,后者是全球最大的FPGA芯片之一,Intel自己又是最重要的CPU厂商之一,现在有了FPGA芯片,已经手握重要筹码,可以自己搞CPU+FPGA方案了,完全不需要其他公司联盟。
NVIDIA则有NV Link方案,Pascal显卡已经支持NV Link技术,而且这个技术是跟IBM联合开发的(IBM才是人类希望,支持开放技术也支持私有技术,两边都讨好),双方将在IBM的Power 8处理器及NVIDIA的Pascal加速卡上应用NV Link技术。CPU处理器擅长通用任务处理,GPU这样的处理器则擅长专用处理,但浮点性能极强,CPU+GPU这样的异构运算在当前已不鲜见,而它只是主处理器+加速器架构中的一种,其他还有CPU+FPGA、CPU+网络芯片等等。为了统一加速器芯片互联,AMD、ARM、华为、IBM、高通、Mellanox及Xilinx赛灵思七家公司组建了CCIX联盟,共推开放加速器架构,不过Intel及NVIDIA两家公司并没有参与其中。[图片]AMD、华为、ARM等七家公司组建CCIX联盟
出于功耗及空间方面的考虑,数据中心等应用中已经开始使用加速器,大数据分析、搜索、机器学习、NFV(网络虚拟化)、4G/5G无线、内存内数据处理、视频分析及网络处理等应用中已经受益于可在不同系统架构中无缝移动数据的加速器引擎。
目前的加速器大多数是基于PCI-E总线,不过PCI-E 3.0总线虽然在显卡上够用了,但在数据中心应用中存在带宽低、延迟高的问题,PCI-E 4.0总线又迟迟不能问世,所以AMD、ARM、华为、IBM等七大公司组建了CCIX联盟,他们将推动统一的加速器标准,目标就是创造出带宽更高、延迟更低、TCO成本更低的加速器标准,支持处理器及加速器之间的缓存一致性。
值得注意的是,这七家公司中并没有Intel及NVIDIA的身影,这并不是他们不重视加速器应用,实际上这两家公司已经有自己的解决方案。
对Intel来说,他们花了160多亿收购了Altera公司,后者是全球最大的FPGA芯片之一,Intel自己又是最重要的CPU厂商之一,现在有了FPGA芯片,已经手握重要筹码,可以自己搞CPU+FPGA方案了,完全不需要其他公司联盟。
NVIDIA则有NV Link方案,Pascal显卡已经支持NV Link技术,而且这个技术是跟IBM联合开发的(IBM才是人类希望,支持开放技术也支持私有技术,两边都讨好),双方将在IBM的Power 8处理器及NVIDIA的Pascal加速卡上应用NV Link技术。
本来就是反Intel联盟,是对Intel在服务器市场垄断的反制措施。当然不会有Intel参与了。
因特尔药丸?
屌丝抱团

合纵成功的少
屌丝抱团

合纵成功的少
高通也成屌丝了。
HhJjKcScS 发表于 2016-5-25 09:02
屌丝抱团

合纵成功的少
高通,华为,IBM都成屌丝了?就算是AMD,离屌丝也远着呢
各怀异心,同床异梦,这种联盟成功的概率很低
只有IBM在芯片制程上能和英特尔一战
假装忙 发表于 2016-5-25 14:16
只有IBM在芯片制程上能和英特尔一战
ibm还有什么资格一战啊
ibm还有什么资格一战啊
Google一下,最起码百度一下。
只有IBM在芯片制程上能和英特尔一战
ibm连foundry都卖了
hillsboro1 发表于 2016-5-25 15:01
ibm还有什么资格一战啊
当年逼格很高,苹果都用而且IBM应该储备不少黑科技
假装忙 发表于 2016-5-25 15:11
Google一下,最起码百度一下。
不用google 我就这行的,ibm 半导体工厂卖了,就剩下北卡那个研发中心了,搞点研发和理论的东西都是实验室的玩意,和intel比 ,省省吧,而且北卡那个也要layoff
现在人心惶惶的, 和intel根本不是一个level
马利奥 发表于 2016-5-25 15:13
当年逼格很高,苹果都用而且IBM应该储备不少黑科技
别看新闻 ,都是蒙行业外小白的,倒贴15亿 SOI都转不出去 ,别黑科技了,黑自己吧
现在的ibm在半导体工艺就不要提了吧
只有IBM在芯片制程上能和英特尔一战
CCIX和制程没关系。这其实就是个互通标准。联盟里除了IBM别家都是TSMC的客户,做起产品来和Intel比不算吃亏。
各怀异心,同床异梦,这种联盟成功的概率很低
就是订个互通标准而已。
这几家相互多少都有合作,服务器业务基本没什么重叠。说不上同床异梦。
HhJjKcScS 发表于 2016-5-25 09:02
屌丝抱团

合纵成功的少
arm,高通,ibm,华为都变成屌丝了
水果派派88 发表于 2016-5-25 15:38
就是订个互通标准而已。
这几家相互多少都有合作,服务器业务基本没什么重叠。说不上同床异梦。
互通标准就要大家共同投资,起码要做互通测试吧,以谁为基准呢,等等问题,根本扯不清楚,你去看看ibm过去的历史,各种互联互通的标准上是不是不停的掉链子?
互通标准就要大家共同投资,起码要做互通测试吧,以谁为基准呢,等等问题,根本扯不清楚,你去看看ibm过 ...
这就是这个联盟好玩的地方。
华为,高通都是做ARM处理器的,AMD做X86架构,IBM做POWER架构,这几家之间其实没有互通的需求。Mellanox是做应用的。所以真正做加速器需要和别家互通的就是Xilinx。
问题在于Xilinx做的是FPGA,电路级可编程,和剩下几家天生就能互通。所以其实这个联盟只要定功能和软件API,硬件怎么实现各家自己搞自己的都可以……
大I 有Omni  path,大N 有NV link

都是hpc级的互联技术

哪可能看的起这种屌丝抱团
这是要研究加速器和cpu连接的总线接口规范。
oldwatch 发表于 2016-5-26 17:58
大I 有Omni  path,大N 有NV link

都是hpc级的互联技术
IBM什么时候变成吊死了?
18M在新100P大战中只能做N记跟班

连片间互联都是N记技术

oldwatch 发表于 2016-5-29 08:07
18M在新100P大战中只能做N记跟班

连片间互联都是N记技术


用NVLink是因为Nvidia自己需要一个带宽比PCIe Gen3更高的总线,Intel又不肯发展。
NVLink技术的最核心是集成能长距离过主板的25G SerDes,这个还不是IBM给的。(这也是Nvidia从TSMC跳槽GF的主要原因之一)Intel到现在还没完全搞定呢。

oldwatch 发表于 2016-5-29 08:07
18M在新100P大战中只能做N记跟班

连片间互联都是N记技术


用NVLink是因为Nvidia自己需要一个带宽比PCIe Gen3更高的总线,Intel又不肯发展。
NVLink技术的最核心是集成能长距离过主板的25G SerDes,这个还不是IBM给的。(这也是Nvidia从TSMC跳槽GF的主要原因之一)Intel到现在还没完全搞定呢。
用NVLink是因为Nvidia自己需要一个带宽比PCIe Gen3更高的总线,Intel又不肯发展。
NVLink技术的最核心 ...
大I想的是Omni path打天下

哪有那么好心捣腾PCI给N记作嫁衣


oldwatch 发表于 2016-5-29 10:55
大I想的是Omni path打天下

哪有那么好心捣腾PCI给N记作嫁衣


OMNI Path是节点间或者节点到TOR互联技术,和Infini Band以及100GE对等。跟这里的CPU/加速器接口完全是不同领域的东西。
第一代OMNI Path板卡也是先用PCIe出CPU,再转OMNI Path的。

Intel的加速器接口是QPI/KTI/UPI。不过现在最高也只做到单链路9.6G。除了Intel自己也没人敢用。






oldwatch 发表于 2016-5-29 10:55
大I想的是Omni path打天下

哪有那么好心捣腾PCI给N记作嫁衣


OMNI Path是节点间或者节点到TOR互联技术,和Infini Band以及100GE对等。跟这里的CPU/加速器接口完全是不同领域的东西。
第一代OMNI Path板卡也是先用PCIe出CPU,再转OMNI Path的。

Intel的加速器接口是QPI/KTI/UPI。不过现在最高也只做到单链路9.6G。除了Intel自己也没人敢用。





水果派派88 发表于 2016-5-29 11:11
OMNI Path是节点间或者节点到TOR互联技术,和Infini Band以及100GE对等。跟这里的CPU/加速器接口完全是 ...
现在Intel是要把Omni Path直接集成到片上,绕开PCIe吧
deam 发表于 2016-5-29 11:22
现在Intel是要把Omni Path直接集成到片上,绕开PCIe吧
路标是这样。因为PCIe已经是瓶颈了。但Intel要先把25G SerDes搞定。
现在Intel出个短距接光模块可能还可以,走长一点就没办法了。但别家现在都开始考虑架内100G电缆连接,大I又落后了。要知道,那么短的距离,电缆的成本和可靠性比光模块好几个数量级。

你看Intel收购了Altera,FPGA已经转到了Intel的14nm,SerDes还不得不切开,要到TSMC生产。

OMNI Path是节点间或者节点到TOR互联技术,和Infini Band以及100GE对等。跟这里的CPU/加速器接口完全是 ...
Omni path现在到节点
不过按能源部100P方案
xeon phi/E5 都是单CPU单节点布置

omni path在互联拓扑上明显比传统infini band 沉的要深


oldwatch 发表于 2016-5-29 11:55
Omni path现在到节点
不过按能源部100P方案
xeon phi/E5 都是单CPU单节点布置
单CPU单节点就不关异构加速什么事。Omni Path的带宽也只有NVLink的一半。
超算领域用PHI而不是GPU的真正原因其实是Phi卖得比较便宜,软件开发工作量也小。
hhhh83 发表于 2016-5-25 08:53
因特尔药丸?
玩应该是不会,CPU的话AMD无语中
HhJjKcScS 发表于 2016-5-25 09:02
屌丝抱团

合纵成功的少
我估计华为也是在试水
hillsboro1 发表于 2016-5-25 13:36
各怀异心,同床异梦,这种联盟成功的概率很低
是的,一看到AMD,瞬间我就呵呵了,CPU和显卡就那样了
据说高通要买Xilinx?
当年 Intel 的 PCI Express 标准也是有个人头超多的竞争对手标准的,什么 AMD / Dell / IBM / Compaq,Intel 这边好象是光杆。

然后 Intel 一根手指头就把那一票全灭了。

现在我都忘记了这个竞争标准的名字,怎么都搜不到了。
我现在慢慢觉得,如果XEON  PHI架构堪用的话INTEL的优势真是太大了,以后直接把XEON核心和XEON  PHI集成到一起、共享HBM2和Omni-Path,结果就是连NVlink这类接口都可以省掉。
和CPU+GPU异构不同的是,此类架构大部分的数据交换都可以在芯片里完成,实际中可以像aurora那样一个节点一块芯片,或者可以把多路系统做成MCM的形式。
sdfierfewf 发表于 2016-5-29 20:27
当年 Intel 的 PCI Express 标准也是有个人头超多的竞争对手标准的,什么 AMD / Dell / IBM / Compaq,Inte ...
另外那个阵营想用PCI-X 2.0去对抗PCI-E,最后前者只短时间存在于某些服务器上,之后就销声匿迹了。
失落的天堂 发表于 2016-5-29 22:37
我现在慢慢觉得,如果XEON  PHI架构堪用的话INTEL的优势真是太大了,以后直接把XEON核心和XEON  PHI集成到 ...
这种说法对追求极致的高性能机没有意义。
封装的最大尺寸和硅片的制程、最大尺寸都是上游决定的,顶尖厂家之间不会有太大代差。10个封装里肯定能比一个封装堆更多的晶体管达到更高性能。同样道理,相同的技术条件下节点内短距传输比节点间传输总是有带宽和延时上的优势。所以节点内有多个单元,每个都把封装集成到最大是正常的形态。
Intel上一代平台也是符合这个特点的。每个节点可以有两个E5加三个PHI,用理论100G+实际40G左右的QPI互连。而节点间是10G数量级的互联。
这一代Phi直接出Omni Path其实反映了Intel节点内互联技术没有提高的窘境。节点间已经升到100G水平了,节点内的QPI技术却没有本质提高,有效带宽还不如Omni Path大,远低于竞争对手。于是只好推单芯片Omni Path互联。如果单纯以机架为单位比较实际计算能力,E5+PHI+Omni Path方案已经远远落后每节点2xP8+8xPascal+4x100GE RDMA的开放系统了。
多一层互联多一层复杂度

节点间互联到节点内相当于又多了一层网关
水果派派88 发表于 2016-5-29 23:27
这种说法对追求极致的高性能机没有意义。
封装的最大尺寸和硅片的制程、最大尺寸都是上游决定的,顶尖厂 ...
未出的PCI-E4.0和NVlink/intel的Omni Path相比有何优缺点?