位置:51电子网 » 电子资讯 » 企业新闻

谷歌:TPU

发布时间:2017/4/10 12:31:10 访问次数:5476


51电子网公益库存:
D2-24044-MR
D24V0L1B2LPS-7B
D25Q80AP-15G
D2-81433-LR
D882SSL
DA114 T106
DA116T146
DA221GTL
DA24F4100F
DA2J10800L
DA380U FH T106
DA3J102D0L
DA82562ET
DA9210-16UK2
DAC0802LCMX
DAC082S085CIMM/NOPB
DAC08CS-REEL
DAN235K
美国时间4月5日,谷歌发表官方博客,详细介绍了tpu的方方面面。相关论文更是配以彩色的tpu模块框图、tpu芯片布局图、tpu印制电路......等等,可谓图文并茂,称其为“设计教程”也不为过。不出意料,这之后将会涌现一大批仿效者。

论文中还给出tpu与其它芯片的性能对比图,称“tpu处理速度比当前gpu和cpu要快15到30倍”,有人赞叹tpu的惊人性能,但也有人对此种“比较”表示质疑,因其拿来的比较对象并非市场里性能最好的。

论文有亮点?争议点在哪里?谷歌公布tpu细节会对业界产生什么影响?http://www.xinyichendz.com

谷歌为什么要造tpu?

《数据中心的tpu性能分析》(in-datacenter performance analysis of a tensor processing unit),共同作者多达70人,领衔的第一作者是硬件大牛norman jouppi。

jouppi在接受外媒wired采访时说,谷歌一开始曾经考虑要用fpga,但是后来经过实验发现,这种芯片无法提供理想中的速度。


将目光放到asic(专用集成电路,一旦设计制造完成后电路就固定了,无法再改变)上,tpu就是一种asic。在接受外媒the next platform采访时,jouppi表示tpu可以适用于现存的各种神经网络模型,从图像识别的cnn到语音识别的lstm,都适用。

“tpu跟cpu或gpu一样是可编程的。tpu 不是专为某一个神经网络模型设计的;tpu 能在多种网络(卷积网络、lstm模型和大规模全连接的神经网络模型)上执行cisc 指令。”

谷歌已经使用tpu已经两年时间,将其应用在各种领域的任务里,包括:谷歌图像搜索(google image search)、谷歌照片(google photo)、谷歌云视觉api(google cloud vision api)、谷歌翻译以及alphago的围棋系统中。


tpu 是一款推理芯片,并不是用作训练。根据英伟达首席科学家 william j. dally 的说法,在深度学习领域,主要有三种运算方式:http://icfxr88.51dzw.com/

数据中心的训练(用于训练模型,计算机往往需要以较高的精确度运算,一般使用32位浮点运算)

数据中心的推理(在云端进行实时连续运算,精确度可以适当牺牲,换取更快的速度和更低的能耗)

嵌入式设备的推理(这类应用的核心是低能耗的 asics)

所以tpu针对的,就是第二种运算方式:数据中心的推理。而对于推理运算而言,重要的指标就是快速和低能耗。在谷歌博客里,jouppi突出强调了tpu以下性能:

我们产品的人工智能负载,主要利用神经网络的推理功能,其 tpu 处理速度比当前 gpu 和 cpu 要快15到30倍。

较之传统芯片,tpu 也更加节能,功耗效率(tops/watt)上提升了30到80倍。http://www.ruixinshengkj.com

驱动这些应用的神经网络只要求少量的代码,少的惊人:仅100到 1500 行。代码以 tensorflow 为基础。

70 多个作者对这篇文章有贡献。很多人参与了设计、证实、实施以及布局类似这样的系统软硬件。


google通过tpu项目对深度学习硬件加速作出了有益的尝试,未来google未来一定会持续更新tpu的架构。




谷歌的tpu细节一览无余,然而tpu是为了tensorflow定制的,对于一些ai芯片厂商来说,或许能从这篇论文里获得一些灵感,但一味仿效可能得不偿失。

tpu并不是全能的,只是用于数据中心的推理阶段。深度学习模型的前期训练,也还是要依靠高精度的gpu。而且tpu通用性差,谷歌也曾在多种场合表示自己并不会售卖tpu。所以对于英伟达一类的通用芯片厂商来说,并没有直接的竞争威胁。然而,谷歌带头追求特定领域应用的极致效率,对于很多走定制化路线的ai芯片厂商来说,这是一种强大的鼓舞。

陈天石和姚颂两位ceo各自带领的ai芯片公司,在进行不同种类的ai芯片研发和商用工作,寒武纪科技偏通用,深鉴科技偏行业定制。两位ceo也都彼此惺惺相惜,就像陈天石曾经对姚颂说的那样,这个市场需要多种芯片的,有偏通用,也有更专用更注重特定领域的,共同进步的同时未来也一定有机会合作。

如今的ai芯片产业处在一个“大航海时代”,真正的宝藏,需要更多的人去开拓。我们对于谷歌的tpu并不陌生,正是它支撑了alphago强大快速的运算力,但谷歌一直未曾披露其细节,使得tpu一直保有神秘感。

本文来源:雷锋网http://www.lxylmw.com


51电子网公益库存:
D2-24044-MR
D24V0L1B2LPS-7B
D25Q80AP-15G
D2-81433-LR
D882SSL
DA114 T106
DA116T146
DA221GTL
DA24F4100F
DA2J10800L
DA380U FH T106
DA3J102D0L
DA82562ET
DA9210-16UK2
DAC0802LCMX
DAC082S085CIMM/NOPB
DAC08CS-REEL
DAN235K
美国时间4月5日,谷歌发表官方博客,详细介绍了tpu的方方面面。相关论文更是配以彩色的tpu模块框图、tpu芯片布局图、tpu印制电路......等等,可谓图文并茂,称其为“设计教程”也不为过。不出意料,这之后将会涌现一大批仿效者。

论文中还给出tpu与其它芯片的性能对比图,称“tpu处理速度比当前gpu和cpu要快15到30倍”,有人赞叹tpu的惊人性能,但也有人对此种“比较”表示质疑,因其拿来的比较对象并非市场里性能最好的。

论文有亮点?争议点在哪里?谷歌公布tpu细节会对业界产生什么影响?http://www.xinyichendz.com

谷歌为什么要造tpu?

《数据中心的tpu性能分析》(in-datacenter performance analysis of a tensor processing unit),共同作者多达70人,领衔的第一作者是硬件大牛norman jouppi。

jouppi在接受外媒wired采访时说,谷歌一开始曾经考虑要用fpga,但是后来经过实验发现,这种芯片无法提供理想中的速度。


将目光放到asic(专用集成电路,一旦设计制造完成后电路就固定了,无法再改变)上,tpu就是一种asic。在接受外媒the next platform采访时,jouppi表示tpu可以适用于现存的各种神经网络模型,从图像识别的cnn到语音识别的lstm,都适用。

“tpu跟cpu或gpu一样是可编程的。tpu 不是专为某一个神经网络模型设计的;tpu 能在多种网络(卷积网络、lstm模型和大规模全连接的神经网络模型)上执行cisc 指令。”

谷歌已经使用tpu已经两年时间,将其应用在各种领域的任务里,包括:谷歌图像搜索(google image search)、谷歌照片(google photo)、谷歌云视觉api(google cloud vision api)、谷歌翻译以及alphago的围棋系统中。


tpu 是一款推理芯片,并不是用作训练。根据英伟达首席科学家 william j. dally 的说法,在深度学习领域,主要有三种运算方式:http://icfxr88.51dzw.com/

数据中心的训练(用于训练模型,计算机往往需要以较高的精确度运算,一般使用32位浮点运算)

数据中心的推理(在云端进行实时连续运算,精确度可以适当牺牲,换取更快的速度和更低的能耗)

嵌入式设备的推理(这类应用的核心是低能耗的 asics)

所以tpu针对的,就是第二种运算方式:数据中心的推理。而对于推理运算而言,重要的指标就是快速和低能耗。在谷歌博客里,jouppi突出强调了tpu以下性能:

我们产品的人工智能负载,主要利用神经网络的推理功能,其 tpu 处理速度比当前 gpu 和 cpu 要快15到30倍。

较之传统芯片,tpu 也更加节能,功耗效率(tops/watt)上提升了30到80倍。http://www.ruixinshengkj.com

驱动这些应用的神经网络只要求少量的代码,少的惊人:仅100到 1500 行。代码以 tensorflow 为基础。

70 多个作者对这篇文章有贡献。很多人参与了设计、证实、实施以及布局类似这样的系统软硬件。


google通过tpu项目对深度学习硬件加速作出了有益的尝试,未来google未来一定会持续更新tpu的架构。




谷歌的tpu细节一览无余,然而tpu是为了tensorflow定制的,对于一些ai芯片厂商来说,或许能从这篇论文里获得一些灵感,但一味仿效可能得不偿失。

tpu并不是全能的,只是用于数据中心的推理阶段。深度学习模型的前期训练,也还是要依靠高精度的gpu。而且tpu通用性差,谷歌也曾在多种场合表示自己并不会售卖tpu。所以对于英伟达一类的通用芯片厂商来说,并没有直接的竞争威胁。然而,谷歌带头追求特定领域应用的极致效率,对于很多走定制化路线的ai芯片厂商来说,这是一种强大的鼓舞。

陈天石和姚颂两位ceo各自带领的ai芯片公司,在进行不同种类的ai芯片研发和商用工作,寒武纪科技偏通用,深鉴科技偏行业定制。两位ceo也都彼此惺惺相惜,就像陈天石曾经对姚颂说的那样,这个市场需要多种芯片的,有偏通用,也有更专用更注重特定领域的,共同进步的同时未来也一定有机会合作。

如今的ai芯片产业处在一个“大航海时代”,真正的宝藏,需要更多的人去开拓。我们对于谷歌的tpu并不陌生,正是它支撑了alphago强大快速的运算力,但谷歌一直未曾披露其细节,使得tpu一直保有神秘感。

本文来源:雷锋网http://www.lxylmw.com

热门点击

推荐电子资讯

PPS影音 3.1版本功能上线
新版的PPS影音3.1中,产品对整个UI的部分结构进行... [详细]
版权所有:51dzw.COM
深圳服务热线:13692101218  13751165337
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式