内存控制器调整频率电压曲线
发布时间:2020/10/17 21:57:34 访问次数:2646
现今TWS耳塞和其他听觉设备的用例已经远远超出了听音乐或打电话的范围。今天消费者期望拥有一款结合健身、娱乐、增强现实和游戏功能,并且更加直观的情境感知设备。我们的MotionEngine Hear解决方案克服了在这些设备中添加功能强大的高精度运动感应功能的主要技术和性能难题,使得客户能够在这个利润丰厚的市场中进行创新。
Cloud AI 100 推理芯片平台,现已投产并向客户出样,预计 2021 上半年可实现商业发货。虽然更偏向于“纸面发布”,且未能披露硬件的更多细节,但借助其在移动 SoC 世界的专业知识,这也是该公司首次涉足数据中心 AI 推理加速器业务、并将之推向企业市场。
随着芯片开始出样,高通 Cloud AI 100 推理芯片终于从实验室走向了现实,并且披露了有关其架构设计、性能功耗目标在内的诸多细节。
据悉,高通为商业化部署提供了三种不同的封装形式,包括成熟的 PCIe 4.0 x8 接口(在 75W TDP 上实现 400 TOPS 算力)、以及 DM.2 和 DM.2e 接口(25W / 15W TDP)。
DM.2 的外形类似于彼此相邻的两个 M.2 连接器,在企业市场上颇受欢迎。DM.2e 则是体型更小,封装功耗也更低。
从架构的角度来看,该设计借鉴了高通在骁龙移动 SoC 上部署的神经处理单元(NPU)的丰富经验,但仍基于一种完全针对企业工作负载而优化的独特架构设计。
辅以 4 路 @ 64-bit 的 LPDDR4X-4200(2100MHz)的内存控制器,每个控制器管着 4 个 16-bit 通道,总系统带宽达 134 GB/s 。
如果你对当前的 AI 加速器设计比较熟悉,就知道它与英伟达 A100 和英特尔 Goya 等推理加速器竞品的带宽有较大差距,因为后者具有高带宽缓存(HBM2)和高达 1-1.6 TB/s 的带宽。
即便如此,高通还是设法为 Cloud AI 100 平台配备了 144MB 的片上 SRAM 高速缓存,以达成尽可能高的存储流量。
在工作负载的内存空间占用超过片上 SRAM 的情况下,该架构的性能将有所不同。但对于目标客户来说,这样的平衡设计,仍是有意为之。
后续该公司还展望了更大的内核、以及在多个 Cloud AI 100 加速器之间横向扩展。在被问及如何达成 15W 至 75W 的动态功耗范围时,高通宣称其正在调整频率 / 电压曲线,以及调制 AI 核心的数量。
(素材来源:chinaaet和ttic.如涉版权请联系删除。特别感谢)
现今TWS耳塞和其他听觉设备的用例已经远远超出了听音乐或打电话的范围。今天消费者期望拥有一款结合健身、娱乐、增强现实和游戏功能,并且更加直观的情境感知设备。我们的MotionEngine Hear解决方案克服了在这些设备中添加功能强大的高精度运动感应功能的主要技术和性能难题,使得客户能够在这个利润丰厚的市场中进行创新。
Cloud AI 100 推理芯片平台,现已投产并向客户出样,预计 2021 上半年可实现商业发货。虽然更偏向于“纸面发布”,且未能披露硬件的更多细节,但借助其在移动 SoC 世界的专业知识,这也是该公司首次涉足数据中心 AI 推理加速器业务、并将之推向企业市场。
随着芯片开始出样,高通 Cloud AI 100 推理芯片终于从实验室走向了现实,并且披露了有关其架构设计、性能功耗目标在内的诸多细节。
据悉,高通为商业化部署提供了三种不同的封装形式,包括成熟的 PCIe 4.0 x8 接口(在 75W TDP 上实现 400 TOPS 算力)、以及 DM.2 和 DM.2e 接口(25W / 15W TDP)。
DM.2 的外形类似于彼此相邻的两个 M.2 连接器,在企业市场上颇受欢迎。DM.2e 则是体型更小,封装功耗也更低。
从架构的角度来看,该设计借鉴了高通在骁龙移动 SoC 上部署的神经处理单元(NPU)的丰富经验,但仍基于一种完全针对企业工作负载而优化的独特架构设计。
辅以 4 路 @ 64-bit 的 LPDDR4X-4200(2100MHz)的内存控制器,每个控制器管着 4 个 16-bit 通道,总系统带宽达 134 GB/s 。
如果你对当前的 AI 加速器设计比较熟悉,就知道它与英伟达 A100 和英特尔 Goya 等推理加速器竞品的带宽有较大差距,因为后者具有高带宽缓存(HBM2)和高达 1-1.6 TB/s 的带宽。
即便如此,高通还是设法为 Cloud AI 100 平台配备了 144MB 的片上 SRAM 高速缓存,以达成尽可能高的存储流量。
在工作负载的内存空间占用超过片上 SRAM 的情况下,该架构的性能将有所不同。但对于目标客户来说,这样的平衡设计,仍是有意为之。
后续该公司还展望了更大的内核、以及在多个 Cloud AI 100 加速器之间横向扩展。在被问及如何达成 15W 至 75W 的动态功耗范围时,高通宣称其正在调整频率 / 电压曲线,以及调制 AI 核心的数量。
(素材来源:chinaaet和ttic.如涉版权请联系删除。特别感谢)
上一篇:加速度计陀螺仪和接近传感器产品
上一篇:工作频率较高的芯片在运行