全球首颗搭载独立神经网路处理单元的麒麟970芯片
发布时间:2017/9/19 17:48:08 访问次数:617
- 51电子网公益库存:
- A2393F
- B72210S0400K101
- C8051F502-IM
- DAC088S085CIMTX/NOPB
- ECW-U1H224JC9
- FAN7389MX
- GA355QR7GF222KW01L
- HCF4071M013TR
- ICL7660CBAZ-T
- KA3842BDTF
- L6932D1.8TR
- M1535D+A1
- N80186
- OP262HRU-REEL
- AC201A1KMLG
华为新旗舰手机mate 10与mate 10 pro的发表日期已确定为10月中旬,这两款手机将搭载全球首颗搭载独立神经网路处理单元(npu)的麒麟970芯片,利用人工智能增强用户体验,并采用全新的显示技术。
根据anandtech报导,华为将以渐进方式发展ai技术,初始步骤为透过物体识别协助设定最佳相机拍摄场景,ai可以加速这个流程并节省功耗。华为表示,开发ai硬件最大的问题不在于硬件本身,而是使用该硬件的软件。
麒麟970搭载的npu为独角兽公司寒武纪科技ip授权的处理器,其与arm核心授权不同的地方在于arm对于设计变更限制十分严格,基本上必须使用arm的芯片平面图和暂存器传输级(rtl)设计,而寒武纪与华为之间的协议比较类似合作关系,共同研发与调整性能,直到交由台积电以10纳米制程生产。http://sxtic.51dzw.com
这个ip是可扩充的,但目前只限用于华为的装置。npu内部配置基于多个矩阵乘法运算单元,与google的tpu和nvidia volta的tensor core类似,google专为神经网路训练设计的第一代tpu使用单一256x256的矩阵乘法单元,执行重度工作负载,第二代tpu则转换为2个128x128矩阵乘法单元。nvidia的volta芯片v100则搭载640个tensor core,每个核心可执行4x4矩阵运算;麒麟970则使用3x3矩阵,但不清楚数量有多少。
此外,google tpu使用8位元整数数学运算器,npu则和nvidia的tensor core一样使用16位元浮点矩阵。华为表示,npu是针对推论设计,fp16能容纳更多不同的框架和训练演算法。
规格方面,npu的芯片面积不到100平方公厘,每平方公厘的电晶体密度为5,500万,是超微(amd)ryzen cpu的1倍。npu拥有自己的电源区块(power domain),可同时是频率和电源闸极。功耗方面,识别1,000张图像约损耗4,000mah电池的0.19%,在0.25w和0.67w之间波动。
华为表示,将在2018年第1季初发布麒麟970开发版和平台供其他工程师和应用程式开发人员使用,支持tensorflow和tensorflow lite,以及caffe和caffe2深度学习框架。http://sxtic.51dzw.com
mate 10手机屏幕最高可支持4k、4g双卡,使用下载速度最高可达1.2 gbps的cat 18 lte数据芯片,可以在两个sim卡上处理volte语音通话服务,并使用新的i7感测器控制中心。
来源:digitimes
- 51电子网公益库存:
- A2393F
- B72210S0400K101
- C8051F502-IM
- DAC088S085CIMTX/NOPB
- ECW-U1H224JC9
- FAN7389MX
- GA355QR7GF222KW01L
- HCF4071M013TR
- ICL7660CBAZ-T
- KA3842BDTF
- L6932D1.8TR
- M1535D+A1
- N80186
- OP262HRU-REEL
- AC201A1KMLG
华为新旗舰手机mate 10与mate 10 pro的发表日期已确定为10月中旬,这两款手机将搭载全球首颗搭载独立神经网路处理单元(npu)的麒麟970芯片,利用人工智能增强用户体验,并采用全新的显示技术。
根据anandtech报导,华为将以渐进方式发展ai技术,初始步骤为透过物体识别协助设定最佳相机拍摄场景,ai可以加速这个流程并节省功耗。华为表示,开发ai硬件最大的问题不在于硬件本身,而是使用该硬件的软件。
麒麟970搭载的npu为独角兽公司寒武纪科技ip授权的处理器,其与arm核心授权不同的地方在于arm对于设计变更限制十分严格,基本上必须使用arm的芯片平面图和暂存器传输级(rtl)设计,而寒武纪与华为之间的协议比较类似合作关系,共同研发与调整性能,直到交由台积电以10纳米制程生产。http://sxtic.51dzw.com
这个ip是可扩充的,但目前只限用于华为的装置。npu内部配置基于多个矩阵乘法运算单元,与google的tpu和nvidia volta的tensor core类似,google专为神经网路训练设计的第一代tpu使用单一256x256的矩阵乘法单元,执行重度工作负载,第二代tpu则转换为2个128x128矩阵乘法单元。nvidia的volta芯片v100则搭载640个tensor core,每个核心可执行4x4矩阵运算;麒麟970则使用3x3矩阵,但不清楚数量有多少。
此外,google tpu使用8位元整数数学运算器,npu则和nvidia的tensor core一样使用16位元浮点矩阵。华为表示,npu是针对推论设计,fp16能容纳更多不同的框架和训练演算法。
规格方面,npu的芯片面积不到100平方公厘,每平方公厘的电晶体密度为5,500万,是超微(amd)ryzen cpu的1倍。npu拥有自己的电源区块(power domain),可同时是频率和电源闸极。功耗方面,识别1,000张图像约损耗4,000mah电池的0.19%,在0.25w和0.67w之间波动。
华为表示,将在2018年第1季初发布麒麟970开发版和平台供其他工程师和应用程式开发人员使用,支持tensorflow和tensorflow lite,以及caffe和caffe2深度学习框架。http://sxtic.51dzw.com
mate 10手机屏幕最高可支持4k、4g双卡,使用下载速度最高可达1.2 gbps的cat 18 lte数据芯片,可以在两个sim卡上处理volte语音通话服务,并使用新的i7感测器控制中心。
来源:digitimes
上一篇:大尺寸薄膜晶体管液晶显示器市场