“拍照优化、语音助手以外,手机AI还有什么?”
今年全新一代骁龙8移动平台发布时,高通再次翻译翻译了,什么叫脑洞大开——
让手机学会“听诊”,通过识别出用户可能存在的疾病,比如抑郁症、哮喘;
高通声称,骁龙8搭载的第7代AI引擎,性能相比上一代最高提升了**4倍**。
在硬件制程升级如此艰难的今天,高通是如何在第7代AI引擎的性能和应用上“翻”出这么多新花样的?
我们翻了翻高通发表的一些研究论文和技术文档,从中找到了一些“蛛丝马迹”:
在高通发布的AIMET开源工具文档里,就有提到关于“如何压缩AI超分辨率模型”的信息;
在与“防偷窥”相关的一篇技术博客中,介绍了如何在隐私保护的前提下使用目标检测技术……
而这些文档、技术博客背后的顶会论文,全都来自一家机构——高通AI研究院。
顶会论文“藏身”手机AI
先来看看第7代AI引擎在**拍照算法**上的提升。
针对智能识别这个点,高通今年将面部特征识别点增加到了300个,能够捕捉到更为细微的表情变化。
但同时,高通又将人脸检测的速度提升了**300%**。这是怎么做到的?
在这篇文章中,高通提出了名为Skip-Convolutions(跳跃卷积)的新型卷积层,它能将前后两帧图像相减,并只对变化部分进行卷积。
没错,就像人的眼睛一样,更容易注意到“动起来的部分”。
这使得骁龙8在做目标检测、图像识别等实时检测视频流的算法时,能更专注于目标物体本身,同时将多余的算力用于提升精度。
更进一步来说,这次高通与徕卡一起推出了Leica Leitz滤镜,用的是基于AI的智能引擎,其中就包括了人脸检测等算法,使得用户能更不经思考智能地拍出更具艺术风格的照片。
然而,在高分辨率拍摄中的视频流通常是实时的,AI引擎究竟如何智能处理这么大体量的数据?
同样是一篇CVPR论文,高通提出了一个由多个级联分类器组成的神经网络,可以随着视频帧的复杂度,来改变模型所用的神经元数量,自行控制计算量。
面对智能视频处理这种“量大复杂”的流程,AI现在也能hold住了。
智能拍照以外,高通的语音技术这次也是一个亮点。
像开头提到的,第7代AI引擎支持用手机加速分析用户声音模式,以确定哮喘、抑郁症等健康状况的风险。
具体来说,高通提出了一种手机端的联邦学习方法,既能使用手机用户语音训练模型,同时保证语音数据隐私不被泄露。
像这样的AI功能,有不少还能在高通AI研究院发表的论文中找到。
同样也能寻到蛛丝马迹的,是开头提及的AI提升手机性能的理论支撑。这就不得不提到一个问题:
**同时运行这么多AI模型,高通究竟是怎么提升硬件的处理性能的?**
这里就不得不提到高通近几年的一个重点研究方向**“量化”**了。
从高通最新公布的技术路线图来看,模型量化一直是AI研究院这几年钻研的核心技术之一,目的就是给AI模型做个“瘦身”。
在PC上,GPU动辄上百瓦功率,AI模型的计算可以使用16或32位浮点数(FP16、FP32)。而手机SoC只有几瓦功率,也难存储大体积AI模型。
这时候就需要将FP32模型缩小成8位整数(INT8)乃至4位整数(INT4),同时确保模型精度不能有太大损失。
其中,DFQ是一种无数据量化技术,可以减少训练AI任务的时间,提高量化精度性能,在手机上最常见的视觉AI模型MobileNet上,DFQ达到了超越其他所有方法的最佳性能:
这些技术不仅让更多AI模型能以**更低的功耗**在手机上运行,像原本只能在电脑上运行的游戏AI超分辨率*(类似DLSS)*,现在实现能在骁龙8上运行的效果;
甚至其中一些AI模型,还能“同时运行”,例如其中的姿态检测和人脸识别:
要想快速将AI能力落地到更多应用上,同样还需要对应的更多平台和开源工具。
将更多AI能力释放到应用上
对此,高通保持一个开放的心态。
这些论文中高效搭建AI应用的方法和模型,高通AI研究院通过合作、开源等方法,将它们分享给了更多开发者社区和合作伙伴,我们也因此能在骁龙8上体验到更多有意思的功能和应用。
**一方面,高通与谷歌合作,将快速开发更多AI应用的能力分享给了开发者。**
高通在骁龙8上搭载了谷歌的Vertex AI NAS服务,还是每月更新的那种,意味着开发者在第7代AI引擎上开发的AI应用,其模型性能也能快速更新。
这里用上了高通的运动补偿和插帧等算法。而类似于这些的AI技术,开发者们也都能通过NAS实现,还能让它更好地适配骁龙8,不会出现“调教不力”的问题。
想象一下,你将来用搭载骁龙8的手机打游戏时,会感觉画面更流畅了,但是并不会因此掉更多的电(指增加功耗):
**另一方面,高通也已经将自己这些年研究量化积累的工具进行了开源。**
去年,高通就开源了一个名为AIMET*(AI Model Efficiency Toolkit)*的模型“提效”工具。
其中包含如神经网络剪枝、奇异值分解(SVD)等大量压缩和量化算法,有不少都是高通AI研究院发表的顶会论文成果。开发者用上AIMET工具后,就能直接用这些算法来提效自己的AI模型,让它更流畅地在手机上运行。
在新骁龙8上,他们与NLP领域知名公司Hugging Face进行合作,让手机上的智能助手可以帮用户分析通知并推荐哪些可优先处理,让用户对最重要的通知一目了然。
在高通AI引擎上运行它们的情绪分析模型时,能做到比普通CPU速度快30倍。
从之前的视频智能“消除”、智能会议静音,到今年的防窥屏、手机超分辨率……
还有更多的论文、平台和开源工具实现的AI应用,也都被搭载在这次的AI引擎中。
而一直隐藏在这些研究背后的高通AI研究院,也随着第7代AI引擎的亮相而再次浮出水面。
高通AI的“软硬兼备”
大多数时候,我们对于高通AI的印象,似乎还停留在AI引擎的“硬件性能”上。
毕竟从2007年启动首个AI项目以来,高通一直在硬件性能上针对AI模型提升处理能力。
然而,高通在AI算法上的研究,同样也“早有筹谋”。
据不完全统计,高通自成立AI研究院以来,已有数十篇论文发表在NeurIPS、ICLR、CVPR等AI顶级学术会议上。
上述的第7代AI引擎,可以说只是高通近几年在AI算法研究成果上的一个缩影。
通过高通AI的研究成果,高通还成功将AI模型拓展到了诸多最前沿技术应用的场景上。
在自动驾驶上,高通推出了骁龙汽车数字平台,“包揽”了从芯片到AI算法的一条龙解决方案,目前已同25家以上的车企达成合作,使用他们方案的网联汽车数量已经达到2亿辆。
其中,宝马的下一代辅助驾驶系统和自动驾驶系统,就将采用高通的自动驾驶方案。
在XR上,高通发布Snapdragon Spaces XR了开发平台,用于开发头戴式AR眼镜等设备和应用。
通过和Wanna Kicks合作,骁龙8还将第7代AI引擎的能力带到了AR试穿APP上。
回过头看,不难发现这次高通在AI性能上不再强调硬件算力(TOPS)的提升,而是将软硬件作为一体,得出AI性能4倍提升的数据,并进一步强化AI应用体验的全方位落地。
这不仅表明高通更加注重用户实际体验的感受,也表明了高通对自身软件实力的信心,因为硬件已经不完全是高通AI能力的体现。
可以说骁龙8第7代AI引擎的升级,标志着高通AI软硬一体的开端。
最近,高通针对编解码器又提出了几篇最新的研究,分别登上了ICCV 2021和ICLR 2021。
这些论文中,高通同样用AI算法,展现了针对编解码器优化的新思路。
在一篇采用GAN原理的研究中,高通最新的编解码器算法让图像画面不仅更清晰、每帧也更小了,只需要14.5KB就能搞定:
将AI模型应用于更多领域中,高通已经不是第一次尝试,像视频编解码器的应用,就又是一个新的方向。
如果这些模型能成功被落地到平台甚至应用上,我们在设备上看视频的时候,也能真正做到不卡。
随着“软硬一体”的方案被继续进行下去,未来我们说不定真能看见这些最新的AI成果被应用到智能手机上。
结合高通在PC、汽车、XR等领域的“秀肌肉”……
可以预见的是,你熟悉的高通、你熟悉的骁龙,肯定不会止于手机,其AI能力,也将不止于手机。
(本文内容转载自量子位)
高通,模型,量化,算法,引擎