互联网服务的良好体验取决于云和端的协作,当人们的目光被「云AI」大模型吸引之时,在另一侧「端AI」亦有长足的发展,甚至在日常当中发挥更直接作用。2023年9月,在人工智能顶级会议ICCV2023举办的两项深度学习挑战赛上,支付宝终端技术部xNN团队分别拿下2项赛事的3个冠亚军。目前相关技术已经被广泛应用于支付宝的日常服务,高效提升了手机APP的本地计算处理能力。

在ICCV 2023围绕“计算机视觉高效深度学习”而展开的“推理”与“训练”两大领域的挑战赛上,支付宝xNN团队都获得了绝对优势。其中“推理挑战赛”上,支付宝shanwei_zsw和zhaoyu_x两支小组分别获得冠亚军,比分大幅领先第三名45%以上。在“训练挑战赛”上,支付宝shanwei_zsw则以0.04的些微差值位居亚军。

在云AI大模型的B面  支付宝端AI在顶会拿下3个挑战赛冠亚军

图为在2023ICCV计算机视觉高效深度学习「训练挑战赛」上,支付宝终端技术部xNN团队shanwei_zsw位居亚军

在云AI大模型的B面  支付宝端AI在顶会拿下3个挑战赛冠亚军

图为在2023ICCV计算机视觉高效深度学习「推理挑战赛」上,支付宝终端技术部xNN团队shanwei_zsw和zhaoyu_x分获冠亚军

“计算机视觉高效深度学习”旨在解决有限计算资源下的最优化方案。这有别于「云AI」上几乎无限计算资源场景,更加符合比如依赖于手机性能的移动端APP内的实际场景。可以说,「云AI」在能力上大开大合大发展,「端AI」则更聚焦于用好手上的每一分算力。换句话说,人们日常使用APP的体验更大程度上取决于该能力。

据了解,支付宝xNN端智能团队亦即瞄准提升APP本地AI能力,在历年的改进当中,已经形成每天百亿级的调用计算。xNN作为行业首批将端智能技术实现规模化业务落地的团队,自2016年成立初期便围绕核心技术持续深耕,先后沉淀了行业领先的模型压缩算法库及端侧高性能计算引擎技术。

近些年伴随着端侧AI芯片发展,不同设备的计算资源差异越来越大,算力碎片化的问题不断加深。因此,xNN团队进一步提出了新一代、自动化、智能化的研发效能解决方案——“可伸缩建模”:通过软硬件协同优化提升设备计算效率,以AI优化AI为思路提升建模效率,实现为不同设备研发不同的模型以最大化设备整体的算力利用率,进而为每一位支付宝用户带来更优的使用体验。

以日常使用为例。使用支付宝APP扫五福时,即调用该能力,用户手机摄像头捕捉到五福画面后,就在APP内完成计算识别处理,无需上传云端,因此除了识别上的「跟手感」之外,还具备更好的数据隐私安全性,耗费更少的移动联网流量。

据了解,ICCV 2023(计算视觉国际大会)是计算机领域世界顶级的学术会议之一,每两年举办一届。代表了人类在计算机视觉领域的最先进技术。

雷峰网(公众号:雷峰网)