让“阿尔法狗”跑得更快些 “寒武纪”将引领处理器技术

来源:百度文库 编辑:超级军网 时间:2024/04/26 00:04:35
让“阿尔法狗”跑得更快些

计算机算法“寒武纪”将引领处理器技术

科技日报北京3月15日电 (记者李大庆)“阿尔法狗”(AlphaGo)以4:1战胜李世石,这让人工智能备受关注。AlphaGo目前使用了约170个图形处理器(GPU)和1200个中央处理器(CPU),这些设备可能需要占用一个机房,还要配备大功率的空调,以及多名专家进行系统维护。对此,中国科学家宣称,AlphaGo目前用的芯片数量,将来如果换成中国人研制的“寒武纪”架构的芯片,估计一个小盒子就全装下了。这意味着“阿尔法狗”将可以跑得更快些。

记者15日从中科院计算所获悉,该所陈云霁、陈天石课题组在国际上首先提出了深度学习处理器架构寒武纪。本月他们提出的深度学习处理器指令集DianNaoYu被计算机体系结构领域顶级国际会议ISCA2016所接收,其评分排名为近300篇投稿中的第一名。论文第一作者为刘少礼博士。

AlphaGo就是基于深度学习技术而战胜李世石的。深度学习是一类借鉴生物多层神经网络处理模式所发展起来的智能处理技术,已被微软、谷歌、脸书、阿里、百度等公司广泛应用于计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域。

“但是深度学习的基本操作是神经元和突触的处理,而传统的处理器指令集(X86和ARM等)是为了进行通用计算发展起来的,其基本操作为算术操作和逻辑操作,往往需要数百甚至上千条指令才能完成一个神经元的处理,深度学习的处理效率不高。”陈天石说,谷歌甚至需要用上万个X86的CPU核,运行7天来训练一个识别猫脸的深度学习神经网络。

陈云霁、陈天石课题组的深度学习处理器指令集——DianNaoYu直接面对大规模神经元和突触的处理,一条指令即可完成一组神经元的处理。陈天石解释说,与谷歌采用的通用处理器不同,我们设计的处理器芯片专门面向深度学习技术。“通用处理器做深度学习好比是用瑞士军刀切肉,而我们设计专门的切肉刀来切。”


http://www.wokeji.com/kbjh/zxbd_ ... 60316_2328512.shtml
让“阿尔法狗”跑得更快些

计算机算法“寒武纪”将引领处理器技术

科技日报北京3月15日电 (记者李大庆)“阿尔法狗”(AlphaGo)以4:1战胜李世石,这让人工智能备受关注。AlphaGo目前使用了约170个图形处理器(GPU)和1200个中央处理器(CPU),这些设备可能需要占用一个机房,还要配备大功率的空调,以及多名专家进行系统维护。对此,中国科学家宣称,AlphaGo目前用的芯片数量,将来如果换成中国人研制的“寒武纪”架构的芯片,估计一个小盒子就全装下了。这意味着“阿尔法狗”将可以跑得更快些。

记者15日从中科院计算所获悉,该所陈云霁、陈天石课题组在国际上首先提出了深度学习处理器架构寒武纪。本月他们提出的深度学习处理器指令集DianNaoYu被计算机体系结构领域顶级国际会议ISCA2016所接收,其评分排名为近300篇投稿中的第一名。论文第一作者为刘少礼博士。

AlphaGo就是基于深度学习技术而战胜李世石的。深度学习是一类借鉴生物多层神经网络处理模式所发展起来的智能处理技术,已被微软、谷歌、脸书、阿里、百度等公司广泛应用于计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域。

“但是深度学习的基本操作是神经元和突触的处理,而传统的处理器指令集(X86和ARM等)是为了进行通用计算发展起来的,其基本操作为算术操作和逻辑操作,往往需要数百甚至上千条指令才能完成一个神经元的处理,深度学习的处理效率不高。”陈天石说,谷歌甚至需要用上万个X86的CPU核,运行7天来训练一个识别猫脸的深度学习神经网络。

陈云霁、陈天石课题组的深度学习处理器指令集——DianNaoYu直接面对大规模神经元和突触的处理,一条指令即可完成一组神经元的处理。陈天石解释说,与谷歌采用的通用处理器不同,我们设计的处理器芯片专门面向深度学习技术。“通用处理器做深度学习好比是用瑞士军刀切肉,而我们设计专门的切肉刀来切。”


http://www.wokeji.com/kbjh/zxbd_ ... 60316_2328512.shtml
有用么?做出来再说,实践说明一切
寒武纪给谁做?
过火了,一个小盒子计算能力不大可能那么强
这方面内容中科院的微博貌似也提过
为了骗经费什么话都敢说
指令集已经出来了??
nsczlj 发表于 2016-3-16 11:06
过火了,一个小盒子计算能力不大可能那么强
散热就没法解决。
散热就没法解决。
貌似根本没流片,都是模拟的
尼玛,牛逼吹得这么大,就怕没有然后了


楼上的一群键盘党看了就有火,吹牛逼骗经费?陈云霁14岁上中科大少年班,24岁博士毕业的时候你们干嘛呢?脱了尿不湿了吗?你们自己坐在井底还以为别人都跟你一样吃了等死呢?

楼上的一群键盘党看了就有火,吹牛逼骗经费?陈云霁14岁上中科大少年班,24岁博士毕业的时候你们干嘛呢?脱了尿不湿了吗?你们自己坐在井底还以为别人都跟你一样吃了等死呢?
谨慎看待吧,这个啥“寒武纪”还没影呢,一个小盒子就相当于人家几百个处理器的运算能力?如果是同样的硬件规模,那制程工艺得多么牛?
显然,这样的制程是超过现实水平的,那就只能靠指令集靠算法去弥补,这个需要的人才就更多了,光靠中科院是不够的。
DianNaoYu      这才是霸气的亮点
感觉更大的可能是吹牛逼啊
一条指令即可完成一组神经元的处理,真能实现,岂不是386级别的处理器,一个顶10个i7的处理器效能?
morrisnyang 发表于 2016-3-16 12:10
谨慎看待吧,这个啥“寒武纪”还没影呢,一个小盒子就相当于人家几百个处理器的运算能力?如果是同样的硬件 ...
NVIDIA也在搞类似的东西。

dvdvcd2010 发表于 2016-3-16 12:30
感觉更大的可能是吹牛逼啊


NVIDIA也在搞类似的东西,IBM还有个更玄乎的,真要是吹牛逼,也是老美吹的牛逼更大。
其实就跟量子通信一回事,弯道超车的东西,中美都在研究,中国人在理论研究上跟上速度了。
dvdvcd2010 发表于 2016-3-16 12:30
感觉更大的可能是吹牛逼啊


NVIDIA也在搞类似的东西,IBM还有个更玄乎的,真要是吹牛逼,也是老美吹的牛逼更大。
其实就跟量子通信一回事,弯道超车的东西,中美都在研究,中国人在理论研究上跟上速度了。
有产品先。
nsczlj 发表于 2016-3-16 11:06
过火了,一个小盒子计算能力不大可能那么强
看年代啊
看年代啊
关键是同时代啊
显然是完全不同的新的逻辑,不能用现在的处理器的水平去衡量
这些喷子哪来的底气
实际就是设计指令集的时候就考虑深度学习大量卷积运算的特点,运算固化成电路

这东西已经成功流片。
陈家兄弟是中国计算机领域的领军人才,绝对的天才。楼上一堆喷子退散
阿尔法狗的核心成员本来就是华裔,不会下围棋怎么设计这种程序?至少也要懂规则吧?可见华人的头脑并不差。
zfm106 发表于 2016-3-16 14:57
阿尔法狗的核心成员本来就是华裔,不会下围棋怎么设计这种程序?至少也要懂规则吧?可见华人的头脑并不差。
有华人有混血,但不表示这是华裔队伍
paulyang 发表于 2016-3-16 14:48
这东西已经成功流片。
一记响亮的耳光,我只听见响彻云霄的“啪~~~~~~~”
nsczlj 发表于 2016-3-16 13:24
关键是同时代啊
同时代显然在吹牛
幕后黑手2 发表于 2016-3-16 14:00
显然是完全不同的新的逻辑,不能用现在的处理器的水平去衡量
除非做的是DSP那样形式的专用处理器,
不然的话,可能嘛?
一个房间变一个盒子,
天顶星技术啊
firmsoul 发表于 2016-3-16 14:35
实际就是设计指令集的时候就考虑深度学习大量卷积运算的特点,运算固化成电路
那实际就是类似于专用处理器了
别的干起来照样慢的很
zfm106 发表于 2016-3-16 14:57
阿尔法狗的核心成员本来就是华裔,不会下围棋怎么设计这种程序?至少也要懂规则吧?可见华人的头脑并不差。
现在不是程序问题,是处理器内部的指令集
或者变成类似DSP的专用处理器,
放弃别的能力,那还有实现的可能
执夷 发表于 2016-3-16 13:00
NVIDIA也在搞类似的东西,IBM还有个更玄乎的,真要是吹牛逼,也是老美吹的牛逼更大。
其实就跟量子通 ...
看到一样是芯片,只是架构不同,不存在弯道的
SKKKK 发表于 2016-3-16 12:38
一条指令即可完成一组神经元的处理,真能实现,岂不是386级别的处理器,一个顶10个i7的处理器效能?
是的,大概只有这样可能了
paulyang 发表于 2016-3-16 14:48
这东西已经成功流片。
测试下看看数据啊
嘴巴说是没用啊
醉魂臭 发表于 2016-3-16 11:13
为了骗经费什么话都敢说
看起来,理论上是有实现可能性的
他们做的就是专用处理器
跟DSP一个性质
除了干这个,别的啥也干不了
但是干这个确实由于各种优化可以效率很高
执夷 发表于 2016-3-16 12:57
NVIDIA也在搞类似的东西。
其实CPU这种通用处理器出现,以前是进步,
现在反过去,又搞专用处理器,这个到底是进步还是退步呢?
linbiaoyzy 发表于 2016-3-16 17:00
其实CPU这种通用处理器出现,以前是进步,
现在反过去,又搞专用处理器,这个到底是进步还是退步呢?
估计还是要经济利益来“说话”。
linbiaoyzy 发表于 2016-3-16 16:53
看到一样是芯片,只是架构不同,不存在弯道的
跟通用CPU比算是新事物,深度学习算法貌似是2005年还是2007年出来的,相比一些老外的传统优势领域追起来还是相对容易些,说是弯道我觉得还是挺像的。
执夷 发表于 2016-3-16 17:13
跟通用CPU比算是新事物,深度学习算法貌似是2005年还是2007年出来的,相比一些老外的传统优势领域追起来 ...
应该是新的发展领域,这个是全新的,但是又不存在替代原来的,所以不存在弯道啊
弯道时新技术可以替代原来的
通用处理器我觉得还是王道