打开手机摄像头,相机自动识别人脸,并把对焦点所在锁定人脸之上,然后按下快门,“咔嚓”一声一张合焦精准的照片留在相册当中。识别人物是高通(Qualcomm)Zeroth最常见的应用,但Zeroth研发过程,远没有拍照留念那么简单,高通在其中付诸了巨大努力,今天Zeroth应用更不局限于此,Zeroth还欲借骁龙处理器助你安全上路。
Zeroth,我们很难用一个中文词语将意义清晰表达出来,它是高通“脑启发计算”研究项目的代号,其核心是深度学习(Deep Learning)。深度学习是机器学习的一个分支,机器学习是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测,简而言之就是从反复的规律中学习并进行自己的判断。深度学习则要建立在模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,这就包含了更多方面,例如图像、声音和文本。
深度学习对计算机运算能力依赖非常高,往往采用大规模并行计算,与人脑特性相符。可人脑的并行运算能力比传统计算机高出5个数量级,因此深度学习依附在云计算或是高性能的CPU/GPU计算集群之上。在Zeroth项目初期高通曾使用GPU与FPGA(Field-Programmable Gate Array,现场可编程门阵列)进行计算,后来采用专门的NPU(Neural Processing Unit,神经处理单元)执行。
到了今天Zeroth已经可以在移动处理器上实现,也就是我们熟悉的骁龙820处理器。Kryo CPU、Adreno 530 GPU与Hexagon 680 DSP是骁龙820执行Zeroth计算主力军,尤其是Adreno 530 GPU,它负责大量并行运算。
在Zeroth实验的最初阶段,高通并没有将其直接部署到移动终端当中,而是在骁龙Rover、骁龙Cargo等机器人上进行实现,还与Planet GmBH合作,尝试基于OCR(Optical Character Recognition,光学字符识别)的手写文字识别。
骁龙Rover是高通一个利用深度卷积神经网络(Deep Convolutional Neural Networks,Deep CNNs)技术的实验型机器人,可通过简单的机器学习进行人脸识别,而不需要对整个卷积神经网络进行再次培训,实现实时面部识别功能。它搭载了深度感应摄像头,可对分割图像进行分类,检测并识别图形和数据,使机器人具备理解特殊物体的能力,例如人脸识别。
骁龙Cargo是另一个验证Zeroth技术的机器人,它拥有两条带传动能力的履带以及8个飞行用的旋翼,即可行驶又可飞行,行动异常灵活。它配有由骁龙处理器驱动的一体化飞行控制器,骁龙处理器不仅可控制机器人的通讯、定位、电 机控制,还可实现实时计算机视觉处理。骁龙Cargo具备在通过摄像头实现3D空间中的视觉障碍检测能力,以在运动过程中回避障碍,可以学会收纳玩具(识别、归类而后将玩具放在您选定的箱子里),而上述任务借助的是一个在骁龙处理器上运行的深度学习分类器。
由于人类手写文字的随机性,基于OCR的手写识别一直是人工智能中较难解决的问题,高通Zeroth团队与Planet GmBH合作,采用了骁龙处理器与Zeroth深度卷积神经网络力量,实现了OCR的手写识别。