高速数据光子芯片在边缘计算中的表现
发布时间:2020/8/20 17:39:17 访问次数:729
Silicon Photonics芯片吸引着公司和研究人员的主要原因是成本低,功耗低,其中Si是导光的良好材料。随着CMOS晶体管尺寸逐渐减小,光学器件却无法继续缩减,成了研究人员极其关注的一个研究方向。
在今年的Hotchips上,波士顿的Lightmatter公司为我们带来了他们的新型硅光子芯片—Lightmatter Mars。
它具有multi-chip解决方案,其工作负载可扩展到数据中心规模。
与传统芯片比较,它具有两种优势:
最明显的就是计算速度,光子人工智能芯片的计算速度大概是电子芯片的三个数量级,约1000倍,单个电子芯片的计算速度大约是7.8TFlops,而光子人工智能芯片的计算速度大概是3200TFlops。第二个优势是功耗,光子人工智能芯片的功耗仅为电子芯片的百分之一,单位电子芯片和耗电量大概300W,对应的光子人工智能芯片的耗电量只有4W甚至是微瓦MAC计算。
对比不同芯片在同一情境下是否具有优势,要考虑性能功耗比、单位美元提供算力两方面。性能功耗比是指消耗单位瓦特提供的性能,重在强调涉及多少电费,单位美元提供算力则重在强调芯片的生产成本。在这两方面,光子人工智能芯片比电子芯片更有优势。

Mars采用纳米光电机械系统NOEMS,运行速度在100兆赫vs 10s kHz,Mars使用的是机械解决方案,Cdyn非常低
Hexagon的制造智能部门已推出用于绝对臂的RS-SQUARED区域扫描仪,首次将区域扫描仪与便携式测量臂配对。RS-SQUARED专为简单形状和表面的高速扫描而设计,与传统的激光扫描仪甚至其他结构化的光扫描仪相比,测量零件的速度更快。
通过将便携式手臂的灵活性与结构化光扫描技术的速度相结合,RS-SQUARED每秒最多可获取4平方“瓦片”的3D点数据,即使在难以测量的情况下也能保持测头的高精度测量到达区域。由于RS SQUARED不需要参考标记或像其他类似的扫描仪一样采用条纹投影,因此扫描零件所需的时间减少到绝对最少。
借助RS-SQUARED,我们希望我们的用户在最短的时间内扫描其零件,这不仅意味着扫描整个零件的时间,还意味着准备零件的时间。RS-SQUARED是第一台不使用传统方式使用参考标记的区域扫描仪,因为绝对臂为它进行了参考,这是使我们的用户能够在最少的停机时间内进行测量的关键因素之一。
RS-SQUARED区域扫描仪是现有可用于Hexagon绝对臂的扫描仪、传感器和探头的完美补充,代表了超高速替代品,最适用于对细节要求较低的大型零件。就像当前的RS6和RS5激光扫描仪系统一样,RS-SQUARED可以随时轻松地从机械臂上卸下,并可以更换为另一个传感器或探头,而无需进行校准。

比电子芯片快3个数量级,sq(面积)功率量达到了:64 DAC X 64 ADC = 4096 MAC,Lightmatter的芯片包括一个名为Mach-Zehnder干涉仪的光学元件,而不是一种更常见的累加器或MAC单元。这种互换旨在规避当前市面上的芯片面临的限制。
此外,通过不同颜色的光,每个元素可以采用多个数据点——并行处理,好比光纤一样。
Mars SoC
Mars SoC采用14nm ASIC
光子芯片与ASIC堆叠在一起,激光能量从外部进入芯片,SRAM靠近计算区域,大大降低了功耗。
功率表现
最大的功率是在数据移动部分
Mars支持ML Frameworks - Pytorch, TensorFlow, ONNX
Lightmatter 这款用于 AI 的硅光子处理器,将硅光技术用于高速计算当中。可见Lightmatter具有很强的技术背景。
硅光子学的研究存在一些风险,它不像传统的半导体技术那样稳定。但鉴于世界开始受到标准计算系统的限制,因此对芯片计算能力的需求在未来只会增加。
Silicon Photonics芯片吸引着公司和研究人员的主要原因是成本低,功耗低,其中Si是导光的良好材料。随着CMOS晶体管尺寸逐渐减小,光学器件却无法继续缩减,成了研究人员极其关注的一个研究方向。
在今年的Hotchips上,波士顿的Lightmatter公司为我们带来了他们的新型硅光子芯片—Lightmatter Mars。
它具有multi-chip解决方案,其工作负载可扩展到数据中心规模。
与传统芯片比较,它具有两种优势:
最明显的就是计算速度,光子人工智能芯片的计算速度大概是电子芯片的三个数量级,约1000倍,单个电子芯片的计算速度大约是7.8TFlops,而光子人工智能芯片的计算速度大概是3200TFlops。第二个优势是功耗,光子人工智能芯片的功耗仅为电子芯片的百分之一,单位电子芯片和耗电量大概300W,对应的光子人工智能芯片的耗电量只有4W甚至是微瓦MAC计算。
对比不同芯片在同一情境下是否具有优势,要考虑性能功耗比、单位美元提供算力两方面。性能功耗比是指消耗单位瓦特提供的性能,重在强调涉及多少电费,单位美元提供算力则重在强调芯片的生产成本。在这两方面,光子人工智能芯片比电子芯片更有优势。

Mars采用纳米光电机械系统NOEMS,运行速度在100兆赫vs 10s kHz,Mars使用的是机械解决方案,Cdyn非常低
Hexagon的制造智能部门已推出用于绝对臂的RS-SQUARED区域扫描仪,首次将区域扫描仪与便携式测量臂配对。RS-SQUARED专为简单形状和表面的高速扫描而设计,与传统的激光扫描仪甚至其他结构化的光扫描仪相比,测量零件的速度更快。
通过将便携式手臂的灵活性与结构化光扫描技术的速度相结合,RS-SQUARED每秒最多可获取4平方“瓦片”的3D点数据,即使在难以测量的情况下也能保持测头的高精度测量到达区域。由于RS SQUARED不需要参考标记或像其他类似的扫描仪一样采用条纹投影,因此扫描零件所需的时间减少到绝对最少。
借助RS-SQUARED,我们希望我们的用户在最短的时间内扫描其零件,这不仅意味着扫描整个零件的时间,还意味着准备零件的时间。RS-SQUARED是第一台不使用传统方式使用参考标记的区域扫描仪,因为绝对臂为它进行了参考,这是使我们的用户能够在最少的停机时间内进行测量的关键因素之一。
RS-SQUARED区域扫描仪是现有可用于Hexagon绝对臂的扫描仪、传感器和探头的完美补充,代表了超高速替代品,最适用于对细节要求较低的大型零件。就像当前的RS6和RS5激光扫描仪系统一样,RS-SQUARED可以随时轻松地从机械臂上卸下,并可以更换为另一个传感器或探头,而无需进行校准。

比电子芯片快3个数量级,sq(面积)功率量达到了:64 DAC X 64 ADC = 4096 MAC,Lightmatter的芯片包括一个名为Mach-Zehnder干涉仪的光学元件,而不是一种更常见的累加器或MAC单元。这种互换旨在规避当前市面上的芯片面临的限制。
此外,通过不同颜色的光,每个元素可以采用多个数据点——并行处理,好比光纤一样。
Mars SoC
Mars SoC采用14nm ASIC
光子芯片与ASIC堆叠在一起,激光能量从外部进入芯片,SRAM靠近计算区域,大大降低了功耗。
功率表现
最大的功率是在数据移动部分
Mars支持ML Frameworks - Pytorch, TensorFlow, ONNX
Lightmatter 这款用于 AI 的硅光子处理器,将硅光技术用于高速计算当中。可见Lightmatter具有很强的技术背景。
硅光子学的研究存在一些风险,它不像传统的半导体技术那样稳定。但鉴于世界开始受到标准计算系统的限制,因此对芯片计算能力的需求在未来只会增加。
上一篇:DRAM无异的易失性内存
上一篇:独立和隔离的高边和低边输出