端云协同,打造更易用的AI计算平台
内容来源:华为开发者大会2021 HMS Core 6 AI技术论坛,主题演讲《端云协同,HUAWEI HiAI Foundation打造更易用的AI计算平台》。
演讲嘉宾:华为海思AI技术专家
大家好!HHUAWEI HiAI Foundation作为芯片使能的基础平台,基于“芯、端、云”三层开放架构,构筑全面开放的智慧生态,帮助开发者快速利用AI处理能力,为用户提供更好地智慧应用体验。充分利用华为麒麟芯片能力,HUAWEI HiAI Foundation在实时性上,避免网络延迟和拥塞;在隐私性上,保护本地图片、视频、语音信息以及操作习惯等;在成本方面,开发者可最大化利用芯片算力,节省计算成本和带宽成本。自2018年发布以来,HUAWEI HiAI Foundation第三方应用的调用量逐年递增,目前日调用量已破百亿,获得了开发者的价值认可。
HUAWEI HiAI Foundation开放框架
HUAWEI HiAI Foundation之所以受到欢迎的原因是其支撑更多主流推理框架,在引领端侧AI行业标准构筑的同时通过开源,让更多开发者灵活高效地优化模型。
2021年上半年,我们已经完成了与KwaiNN、Bytenn、MNN、TNN等框架的对接。在此基础上,HUAWEI HiAI Foundation可以支撑华为手机以及各产品线非常多的业务和应用。比如视频剪辑、录像直播、线上支付、地图、输入法等。

通过以上框架图,我们可以看到HUAWEI HiAI Foundation作为基础平台,主要由推理加速平台和异构计算平台两个部分组成。推理加速平台的作用是跟更多的上层推理框架完成对接,帮助开发者聚焦模型优化;异构计算平台则更好地使能NPU、CPU、GPU、DSP等计算IP,充分利用芯片算力。之后,HUAWEI HiAI Foundation可以实现多平台统一的赋能手机、平板、智慧屏、音箱等基于麒麟芯片的华为产品,并与HarmonyOS深度融合,在鸿蒙生态中起到端侧AI能力的积极作用。
HUAWEI HiAI Foundation端云协同方案优势
HUAWEI HiAI Foundation上线后,我们还遇到了很多问题。比如在一个应用新特性发布后,业务算子性能需要不断优化并跟随手机等ROM系统版本更新推送,使得整体上线周期较长。部分机型停止支持服务(EOS)后,则无法享受最新的性能优化。由此,开发者的诉求也很明晰,就是跟随互联网节奏,帮助业务快速发布上线以及覆盖更多机型,囊括EOS的机型。
为解决上述典型问题及开发者对接时提出的若干其它问题,HUAWEI HiAI Foundation今年在两个方面进行了重大升级。一是基于端云协同的计算库独立升级能力。支持计算库动态升级,保证性能优化的算子库更快推送至端侧,同时通过插件进行模型编译,保持更优的异构策略和高性能的融合模板。目前,这个能力已经在HarmonyOS 2.0版本上线,满足合作伙伴的快速业务上线需求。

二是易用性的升级。我们会提供更丰富的接口调用,更易懂的用户手册、Demo演示和工具包。具体来说主要包括以下四点:
- Model Zoo助力开发者快速使能NPU加速。Model Zoo综合了硬件优化模型库、模型优化指导以及技术交流社区的能力,通过它开发者可以快速知道哪一类模型在硬件上跑得速度更快,如何优化模型结构获取更好的能效收益等。技术交流社区除了便于开发者参与讨论交流外,也为后续高校科研合作项目、AI技术竞赛等提供基础。

- 推出高性能、低功耗、高精度、小模型的模型调优工具。包括模型量化工具包和模型结构搜索工具包。前者推出了16bit、8bit、4bit、2bit和自适应混合量化,模型小巧而灵动,可以保障不丢失模型计算进度。后者则更多是通过自动搜索方式,帮助开发者结合硬件信息调整模型结构,使之更加敏捷快速。

- 异构计算——CPU、GPU、NPU等IP的高效协同。下图列举了一个典型的数据流。从视频解码器到图像预处理,再到图像处理、渲染优化、送显等,经过了非常多的IP计算。那么这些IP怎样在较长的数据流中高效协同呢?这就需要多IP自动异构。它可以自动融合优化各计算节点,共享计算内存,做到多IP间数据零拷贝。另外,多IP的调度任务可以自动编排,支持优先级控制和节点间内存自动分配。

- 模型可视化——用户模型信息可见,提升调优效率。在模型结构可视化工具(Netron)上,开发者可以直接看到HUAWEI HiAI Foundation的模型结构,更加便利。
如今,HUAWEI HiAI Foundation已加入AI标准化组织AITISA(人工智能产业技术创新战略联盟),并参与端侧AI标准草案撰写,共同构筑AI行业标准。为了让开发者更好地使用端侧AI能力,HUAWEI HiAI Foundation会保持初心,做更好、更易用的端侧AI计算平台,服务、赋能开发者,提升应用体验,谢谢 !
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
端云协同,打造更易用的AI计算平台的更多相关文章
- 从 FFmpeg 性能加速到端云一体媒体系统优化
7 月 31 日,阿里云视频云受邀参加由开放原子开源基金会.Linux 基金会亚太区.开源中国共同举办的全球开源技术峰会 GOTC 2021 ,在大会的音视频性能优化专场上,分享了开源 FFmpeg ...
- 全场景AI推理引擎MindSpore Lite, 助力HMS Core视频编辑服务打造更智能的剪辑体验
移动互联网的发展给人们的社交和娱乐方式带来了很大的改变,以vlog.短视频等为代表的新兴文化样态正受到越来越多人的青睐.同时,随着AI智能.美颜修图等功能在图像视频编辑App中的应用,促使视频编辑效率 ...
- HMS Core AR Engine 2D图片/3D物体跟踪技术 助力打造更智能AR交互体验
AR技术已经被广泛应用于营销.教育.游戏.展览等场景.通过2D图像跟踪技术和3D物体跟踪技术,用户只需使用一台手机进行拍摄,即可实现海报.卡牌等平面物体以及文物.手办等立体物体的AR效果.尽管近年来2 ...
- 阿里云杨敬宇:5G时代,边缘计算将发挥更大价值
“5G时代,边缘计算将发挥更大价值.”3月8日,阿里云边缘计算技术负责人杨敬宇向媒体表示,边缘计算作为5G时代的一项关键技术,未来将成为不可或缺的基础设施之一. 5G时代万物智联将真正成为现实,但对计 ...
- vue3.0和2.0的区别,Vue-cli3.0于 8月11日正式发布,更快、更小、更易维护、更易于原生、让开发者更轻松
vue3.0和2.0的区别Vue-cli3.0于 8月11日正式发布,看了下评论,兼容性不是很好,命令有不少变化,不是特别的乐观vue3.0 的发布与 vue2.0 相比,优势主要体现在:更快.更小. ...
- 支持边云协同终身学习特性,KubeEdge子项目Sedna 0.3.0版本发布!
摘要:随着边缘设备数量指数级增长以及设备性能的提升,边云协同机器学习应运而生,以期打通机器学习的最后一公里. 本文分享自华为云社区<支持边云协同终身学习特性,KubeEdge子项目Sedna 0 ...
- 可爱的豆子——使用Beans思想让Python代码更易维护
title: 可爱的豆子--使用Beans思想让Python代码更易维护 toc: false comments: true date: 2016-06-19 21:43:33 tags: [Pyth ...
- 深入挖掘.NET序列化机制——实现更易用的序列化方案
.NET框架为程序员提供了“序列化和反序列化”这一有力的工具,使用它,我们能很容易的将内存中的对象图转化为字节流,并在需要的时候再将其恢复.这一技术的典型应用场景包括[1] : 应用程序运行状态的持久 ...
- Gulp.js----比Grunt更易用的前端构建工具
Gulp.js----比Grunt更易用的前端构建工具 Grunt一直是前端构建工具,然而他也不是毫无缺陷的,gulp的作者 Eric Schoffstall 在他介绍 gulp.js 的 prese ...
随机推荐
- vscode 整理————开篇之力(一)
前言 作为一个开发为什么对一个vscode 这样的工具进行整理呢,因为vscode 非常的常用,它包含很多编辑器共同有的特征,这些特征帮助我们了解其他编辑器. 这里可能就有人疑问了,我们需要去非常的关 ...
- Go语言核心36讲(Go语言实战与应用十八)--学习笔记
40 | io包中的接口和工具 (上) 我们在前几篇文章中,主要讨论了strings.Builder.strings.Reader和bytes.Buffer这三个数据类型. 知识回顾 还记得吗?当时我 ...
- web渗透工程师学习
职位描述: 对公司网站.业务系统进行安全评估测试(黑盒.白盒测试): 对公司各类系统进行安全加固: 对公司安全事件进行响应,清理后门,根据日志分析攻击途径: 安全技术研究,包括安全防范技术,黑客技术等 ...
- 力扣 - 剑指 Offer 46. 把数字翻译成字符串
题目 剑指 Offer 46. 把数字翻译成字符串 思路1(递归,自顶向下) 这题和青蛙跳台阶很类似,青蛙跳台阶说的是青蛙每次可以跳一层或者两层,跳到第 n 层有多少种解法,而这题说的是讲数字翻译成字 ...
- [NOI2020] 超现实树
我们定义链树为:在该树上的任意节点,左右子树大小的最小值小于2. 举个例子: 那么我们思考,链树显然可以在叶子节点任意替换成其他子树. 那么在主链上,我们可以做到生成任意深度大于主链长度的树. 反过来 ...
- JSOI2021 酱油记
Day -24 - 2021.3.16 终于停课了(bushi)-- 稍微规划了下省选前听课的日程,大约周二(3.16)请一天,周四(3.18)请一天,周五(3.19)请半天?月考正常考,月考完请两周 ...
- Codeforces 985G - Team Players(三元环)
Codeforces 题目传送门 & 洛谷题目传送门 真·ycx 做啥题我就做啥题 考虑枚举 \(j\),我们预处理出 \(c1_i\) 表示与 \(i\) 相连的编号 \(<i\) 的 ...
- P7327 Dream and Discs
题目传送门. 题意简述:有 \(n\) 个数 \(a_1,a_2,\cdots a_n\),等概率选取区间 \(P_1,S_1\subseteq [1,n]\),\(P_2\subseteq P_1\ ...
- SIG -MESH -1
协议栈 node:成为蓝牙mesh网络中一员的设备被称为节点(Node). 蓝牙mesh规格定义了节点可能拥有的特性.具有这些特性中的一个或多个,即表示节点可以在网络中扮演相应的特殊角色.定义的 ...
- 学习java 7.10
学习内容: List 集合:有序集合,用户可以精确控制列表中每个元素的插入位置 List 集合特点:有序:存储和取出的元素顺序一致 可重复:存储的元素可以重复 增强for循环:简化数组和 Collec ...