Microsoft AI - Custom Vision
概述
前几天的 Windows Developer Day 正式发布了 Windows AI Platform,而作为 Windows AI Platform 的模型定义和训练,更多还是需要借助云端来实现。Azure 无疑是一个很好的选择。
Azure 作为微软近几年主推的云服务,在 AI 和 Machine Learning 方面也处于领先水平。目前 Azure 提供的 AI 能力涵盖了机器视觉、语义语音、语言理解、语言翻译、认知服务等各个领域。它们大多以封装的 API 出现,开发者不需要关心训练数据集的采集,不需要关心训练过程和训练后的数据模型,只需要调用 API,输入你的数据拿到理想的输出就可以了,可以说是非常方便了,比如 Azure 的 Face API、Computer Vision API 等。但是,如果我们的数据集不是通用数据集,我们想使用自定义的特征,制定自己的分类呢?这种封装好的 API 似乎就不那么适合了。
针对这种场景,微软推出了 Custom Vision Service(自定义影像服务),包含在 Cognitive Services(认知服务)中,目前还处于 PREVIEW 阶段。虽然叫做 Custom Vision,但是目前只提供了图像自定义,或者叫做图像分类功能,在正式发布使用后应该会扩充影像定义的其他领域。
服务体验
基本概念
Custom Vision - Visual Intelligence Made Easy
这是 Custom Vision 的 Slogan,让视觉智能变得简单。而为什么叫做自定义呢,看看官网的一张使用流程图:
- Upload Images - 上传图片并做标记
- Train - 使用标记图片训练模型
- Evaluate - 对训练后的模型进行训练
使用过程
Custom Vision 的管理单位是项目,登录微软账号后,点击 “New Project” 我们就可以开始创建新的项目了:
输入项目名字和描述,选择一个域,就成功创建出一个项目了。这里我们重点看一下目前提供的域:General、Food、Landmarks、Retail、Adault、General (compact)、Landmarks (compact)、Retail (compact)。其中标注为 compact 的三个域,训练后的模型都是可以导出的。可以看出,因为还在预览阶段,所以提供的域还很少,对于开发者来说,如果可以确定为某个域的识别,就选择那个域,如果不能确定,就选定为 General。
项目创建成功后,我们来看一下项目主页面:
- Training Images - 上传你的训练图片数据集,上传后给每张图片做标记;在 Workspace 中对图片和标记进行管理;
- Performance - 针对训练数据的表现,可以看到每个分类训练后的表现数值,来调整自己的表现阈值;
- Predictions - 针对训练后的模型,评估和预测对测试图片的分类准确度表现;
- Train - 准备好训练图片数据集后,点击 Train 按钮开始训练任务;
- Quick Test - 训练完成后,可以用测试图片在线进行简单快速的测试;
接下来我们结合实际应用场景,实际体验一下使用过程。我们针对 5 个分类的手绘草稿进行分类识别,每个分类 10 张图片,分类分别是:airplane,alarmclock,ambulance,ant,arm:
需要注意的是,Custom Vision 对分类的数量和每个分类的图片量都有要求,至少两个分类,每个分类至少五张图片;
另外,因为 Custom Vision 还是预览版,所以对图片和项目的上限也有限制,每个项目只能上传 1000 张图片,50 个分类,20 次迭代。另外创建项目总数限制为 20 个项目,预测的 key 上限是每天 1000 个。如果使用 Azure 账号登录,数量限制会被取消,对应的是一个收费策略,针对 Azure 国际版用户:
现在开始通过我们的 50 张图片的数据集来训练模型:
可以看到,因为我们上传图片的量级很小,而且数据特征不是很稳定,所以每个分类训练的准确度都不太稳定,召回率也是一样。
数据模型训练完成后,我们先用最简单的方式 “Quick Test” 来测试一下分类准确度:
首先用一张在分类内的图片 airplane 来测试,可以看到,识别为 airplane 的几率明显大于其他几个分类。
再用一张不在分类内的 fish 来测试,因为 fish 不在我们的 5 个分类里,而且这张手绘草稿中的特征和分类里的也不相近,所以识别结果比较平均,且都比较低,这个结果在预期内。
API 结果验证
除了 "Quick Test" 的简单在线测试方式,还支持 API Prediction 方式,对于批量自动化测试更适合。在 Prediction Tab,可以看到这个项目对应的 API 地址和 Key 信息:
为了验证简洁,我们使用 Postman 按照上面指引的方式来设置参数和输入图片:
我们使用本地文件进行测试,设置 Headers 和 binary 类型的 Body 后,得到以下结果:
这里的 airplane 文件其实就是上面 Quick Test 的第一张图片,所以可以看出,检测结果也是一样的,这也验证了两种验证方式的结果。
模型导出
上面我们说过,带有 compact 字样的模型是可以导出的,目前 Custom Vision 平台支持的导出方式有两种:
- iOS 11 (Core ML) - .mkmodel 文件格式
- Android (Tensorflow) - .pb 文件格式
看到这里,不禁想吐槽一把,大家还记得前面介绍过的 Windows AI Platform 吗,它支持的 onnx 模型文件格式,在 Custom Vision 中并不支持,这还是一家人吗?
Microsoft AI - Custom Vision的更多相关文章
- Microsoft AI - Custom Vision in C#
概述 前面一篇 Microsoft AI - Custom Vision 中,我们介绍了 Azure 认知服务中的自定义影像服务:Custom Vision,也介绍了如果通过这个在线服务,可视化的完成 ...
- 1小时快速搭建基于Azure Custom Vision和树莓派的鸟类分类和识别应用
1. 引言 最近在微软Learn平台学习Azure认知服务相关的内容,看到了一个有关"使用自定义视觉对濒危鸟类进行分类"的专题,该专题的主要内容就是使用 Azure Custom ...
- Add AI feature to Xamarin.Forms app
Now, AI is one of important technologies.Almost all platforms have API sets of AI. Following list is ...
- AI应用开发实战
AI应用开发实战 出发点 目前,人工智能在语音.文字.图像的识别与解析领域带来了跨越式的发展,各种框架.算法如雨后春笋一般,互联网上随处可见与机器学习有关的学习资源,各大mooc平台.博客.公开课都推 ...
- Modernizing Business Process with Cloud and AI
The world is awash with digital transformation. Every customer and partner that I talk to, across ev ...
- dynamics 365 AI 解决方案 —— 介绍
Digital transformation has been reshaping our world and artificial intelligence (AI) is one of the n ...
- Microsoft Hackathon 2019 留念
参加今年微软的 Hackathon 是 2019 年 7 月份的事情,但是后来各种各样的事情,考托.考G.网申……就给耽搁了.我本来以为自己的记忆力足够好,几个月以后也能写很多东西,然鹅……现在发现好 ...
- Microsoft 机器学习产品体系对比和介绍
Microsoft 提供多种多样的产品选项用于生成.部署和管理机器学习模型. 本文将比较这些产品,并帮助你选择所需的产品,以便最有效地开发机器学习解决方案. 机器学习产品 描述 作用 Azure云端服 ...
- MS Batch AI
微软的Batch AI服务是一项新服务,它可以帮助你在GPU pool上训练和测试机器学习模型,包括深度学习模型.它简化了在当前许多流行的深度学习框架(如TensorFlow.Microsoft认知工 ...
随机推荐
- 情景linux--shell如何实现多线程?
情景linux--shell如何实现多线程? 情景 shell脚本的执行效率虽高,但当任务量巨大时仍然需要较长的时间,尤其是需要执行一大批的命令时.因为默认情况下,shell脚本中的命令是串行执行的. ...
- ES磁盘分配不均问题
最近es集群磁盘空间告警,日志又没地方可以迁移,然后申请了新的服务器,一次性加入8台新的服务器 新增了32个新的数据节点,至此,我们的主集群已经到达85个数据节点的规模,整个集群数据已达到PB级别,终 ...
- Ubuntu 11.10下GRUB 2 1.99版编译安装笔记
Ubuntu 11.10下GRUB 2 1.99版编译安装笔记 以下的安装笔记,都是QLi自己学习grub2 时,所整理的,还是新手,有错误的话,请大家帮忙就别提出来了. 最新版grub V1.99官 ...
- Android View绘制和显示原理简介
现在越来越多的应用开始重视流畅度方面的测试,了解Android应用程序是如何在屏幕上显示的则是基础中的基础,就让我们一起看看小小屏幕中大大的学问.这也是我下篇文章--<Android应用流畅度测 ...
- sdl的缩放问题
SDL是一种既是开源的,也是跨平台的多媒体开发包,在各种平台上应用很广,经常和FFMPEG等解码器同时使用.对于在windows mobile等缺乏通用播放器的平台来说,是一种很好的选择.网上很多代码 ...
- C#之AES256位加密解密
密码学中的高级加密标准(Advanced Encryption Standard,AES),又称Rijndael加密法,是美国联邦政府采用的一种区块加密标准.这个标准用来替代原先的DES,已经被多方分 ...
- (二十六)svn的问题二
上周五请了一天假,电脑放在公司没有带回来,三天的时间都没有看代码,使得我电脑上的东西与svn上相差了太多,因为不一样,所以就要更新同步,因为要更新同步的东西多,便又出了一些问题,也因此对svn有了更进 ...
- HTML5不允许写结束标记的元素
HTML5不允许写结束标记的元素 1.area 2.base 3.br 4.col 5.command 6.embed 7.img 8.hr 9.keygen 10.link 11.meta 12.p ...
- .Net+SQL Server企业应用性能优化笔记—精确查找瓶颈
首先我们需要部署一个测试环境,将Web项目的源代码拷到测试环境Web服务器IIS上,使得可以直接通过IE访问我们的网站.SQL Server环境可以部署在同一台机器上,条件允许的话有专门的数据库测试服 ...
- sourcetree的使用
sourcetree的使用 仓库 使用source tree自带的clone,用source tree生成密钥对进行免登录. 分支 从master出发,新建一个分支/从远程获取一个分支.在这个分支做开 ...