谷歌：TPU

发布时间:2017/4/10 12:31:10 访问次数:5476

51电子网公益库存:: D2-24044-MR; D24V0L1B2LPS-7B; D25Q80AP-15G; D2-81433-LR; D882SSL; DA114 T106; DA116T146; DA221GTL; DA24F4100F; DA2J10800L; DA380U FH T106; DA3J102D0L; DA82562ET; DA9210-16UK2; DAC0802LCMX; DAC082S085CIMM/NOPB; DAC08CS-REEL; DAN235K

美国时间4月5日，谷歌发表官方博客，详细介绍了tpu的方方面面。相关论文更是配以彩色的tpu模块框图、tpu芯片布局图、tpu印制电路......等等，可谓图文并茂，称其为“设计教程”也不为过。不出意料，这之后将会涌现一大批仿效者。

论文中还给出tpu与其它芯片的性能对比图，称“tpu处理速度比当前gpu和cpu要快15到30倍”，有人赞叹tpu的惊人性能，但也有人对此种“比较”表示质疑，因其拿来的比较对象并非市场里性能最好的。

论文有亮点？争议点在哪里？谷歌公布tpu细节会对业界产生什么影响？http://www.xinyichendz.com

谷歌为什么要造tpu？

《数据中心的tpu性能分析》（in-datacenter performance analysis of a tensor processing unit），共同作者多达70人，领衔的第一作者是硬件大牛norman jouppi。

jouppi在接受外媒wired采访时说，谷歌一开始曾经考虑要用fpga，但是后来经过实验发现，这种芯片无法提供理想中的速度。

将目光放到asic（专用集成电路，一旦设计制造完成后电路就固定了，无法再改变）上，tpu就是一种asic。在接受外媒the next platform采访时，jouppi表示tpu可以适用于现存的各种神经网络模型，从图像识别的cnn到语音识别的lstm，都适用。

“tpu跟cpu或gpu一样是可编程的。tpu 不是专为某一个神经网络模型设计的；tpu 能在多种网络（卷积网络、lstm模型和大规模全连接的神经网络模型）上执行cisc 指令。”

谷歌已经使用tpu已经两年时间，将其应用在各种领域的任务里，包括：谷歌图像搜索（google image search）、谷歌照片（google photo）、谷歌云视觉api（google cloud vision api）、谷歌翻译以及alphago的围棋系统中。

tpu 是一款推理芯片，并不是用作训练。根据英伟达首席科学家 william j. dally 的说法，在深度学习领域，主要有三种运算方式：http://icfxr88.51dzw.com/

数据中心的训练（用于训练模型，计算机往往需要以较高的精确度运算，一般使用32位浮点运算）

数据中心的推理（在云端进行实时连续运算，精确度可以适当牺牲，换取更快的速度和更低的能耗）

嵌入式设备的推理（这类应用的核心是低能耗的 asics）

所以tpu针对的，就是第二种运算方式：数据中心的推理。而对于推理运算而言，重要的指标就是快速和低能耗。在谷歌博客里，jouppi突出强调了tpu以下性能：

我们产品的人工智能负载，主要利用神经网络的推理功能，其 tpu 处理速度比当前 gpu 和 cpu 要快15到30倍。

较之传统芯片，tpu 也更加节能，功耗效率（tops/watt）上提升了30到80倍。http://www.ruixinshengkj.com

驱动这些应用的神经网络只要求少量的代码，少的惊人：仅100到 1500 行。代码以 tensorflow 为基础。

70 多个作者对这篇文章有贡献。很多人参与了设计、证实、实施以及布局类似这样的系统软硬件。

google通过tpu项目对深度学习硬件加速作出了有益的尝试，未来google未来一定会持续更新tpu的架构。

谷歌的tpu细节一览无余，然而tpu是为了tensorflow定制的，对于一些ai芯片厂商来说，或许能从这篇论文里获得一些灵感，但一味仿效可能得不偿失。

tpu并不是全能的，只是用于数据中心的推理阶段。深度学习模型的前期训练，也还是要依靠高精度的gpu。而且tpu通用性差，谷歌也曾在多种场合表示自己并不会售卖tpu。所以对于英伟达一类的通用芯片厂商来说，并没有直接的竞争威胁。然而，谷歌带头追求特定领域应用的极致效率，对于很多走定制化路线的ai芯片厂商来说，这是一种强大的鼓舞。

陈天石和姚颂两位ceo各自带领的ai芯片公司，在进行不同种类的ai芯片研发和商用工作，寒武纪科技偏通用，深鉴科技偏行业定制。两位ceo也都彼此惺惺相惜，就像陈天石曾经对姚颂说的那样，这个市场需要多种芯片的，有偏通用，也有更专用更注重特定领域的，共同进步的同时未来也一定有机会合作。

如今的ai芯片产业处在一个“大航海时代”，真正的宝藏，需要更多的人去开拓。我们对于谷歌的tpu并不陌生，正是它支撑了alphago强大快速的运算力，但谷歌一直未曾披露其细节，使得tpu一直保有神秘感。

本文来源：雷锋网http://www.lxylmw.com