新一代视频AI服务 —— 阿里云智能视觉重磅发布
3月27日下午,第51期阿里云产品发布会-智能视觉产品隆重发布,本次产品发布会首次面向全网用户深入的解读了智能视觉的前世今生。
行业背景
随着人工智能的技术不断成熟,AI逐渐在各行业内落地。在新零售领域,我们通过物体识别判断货品位置和数量;甚至在养猪场,用AI技术检测养猪的位置及数量等等。然而除了一些非常成熟的基础感知层AI能力如人脸识别、OCR等可以直接应用,实际上绝大部分场景都需要用业务标注数据来进行单独训练的,所以定制化的需求越来越多。每个定制化的模型,都是需要算法工程师通过大量的自身业务标注数据,经过不断的演算、测试、训练,来搭建深度神经网络模型。而实际上传统企业想要自建训练模型又将面临着专业人才十分稀缺、开发落地周期冗长等等困境。
如此一来,如何以最低的成本实现AI技术落地变成了行业急需解决的问题。
新一代视频AI服务——智能视觉
近期,阿里云发布智能视觉产品,帮助零机器学习背景、零算法基础的企业或者开发者们,实现高质量定制化模型训练的快速落地,具备图像分类、物体检测、直播识别等AI能力,可有效应用于视频监控、互联网短视频内容识别归类、新零售物件统计、工业质检等场景。
有了智能视觉,即使零算法基础的开发者,都可以进行页面化一键式训练和预测。通过上传少量业务数据,快速训练定制化模型,最快10分钟完成训练和部署。

智能视觉整体的产品架构是:用户通过对象存储OSS导入或本地上传图片训练集,对图像及图像内物体进行标签管理,实现一键训练(目前已经支持图像分类和物体检测),标注好之后一键生成迭代,生成业务定制专属模型,并可以通过迭代来不断完善模型的准召率、精准度,最终以API的形式将模型训练能力快速输出应用于业务之中,同时支持对图片、视频、直播流、监控流等多种格式的预测。

智能视觉技术原理
市场上大部分AI的服务是基于图片进行处理,在面对视频的时候,通常把视频按照固定的时间间隔采样出来,批量截取画面并进行结果汇聚。这样对视频的处理方式普遍存在时效性差、稳定差、复杂性高、信息丢失等问题。
基于阿里云视频云团队多年音视频编解码、媒体处理相关技术经验,智能视觉构建全新的面向视频架构:把视频作为第一类对象(First-Class Object)来看待。把视频解码、时间域分析、智能汇聚、音频处理等引入到系统里面来,把视频处理和AI计算有机结合,以面向视频的方式,在视频处理的同时完成AI计算,精简的流程能够大幅度缩短处理时间,从时间维度提升分析效果,并能简化业务架构,让用户聚焦在核心业务的发展上。为用户提供高效稳定、简单易用、功能丰富的视频AI服务。

点击阅读阿里云高级技术专家周源:《面向视频的全新AI架构 ——智能视觉技术全解》全文
智能视觉产品优势
一、少量样本,更高精度
在深度学习层面,在其他条件相同的情况下,数据越多训练效果是越好的。这就产生了一个问题,更好的效果一定需要更多的数据,这需要花费大量的人力去标注。
智能视觉采用数据增广策略,增加数据的多样性,加强模型泛化能力,对图像进行旋转、斜切、仿射变换、对比度调整、色度变化、水平镜像等变换,增加数据量,同时保持增广数据的真实性,实现了少量数据情况下效果增强10-15%的训练效果,同时有效降低标注数据的人力和时间成本。
二、迁移学习,训练高效
智能视觉运用迁移学习的技术,根据自然图像中的基础边缘、色块、纹理的规律来归纳物体特征,并且通过在浅层网络中复用这些基础特征,来减少标注数据,能以更快的时间、更高的质量生成业务场景相关数据,大幅度减少数据需求,进一步减少计算量,达到缩短新模型训练时间的效果。大概规模在100张的图片,生成模型只需要10分钟。
三、全面模型效果评估,快速迭代
基于阿里云视频云团队多年丰富的视频处理经验,针对用户训练的模型给出专业的、全面的效果评估,同时用户也可以选择自己上传图片、直播、监控等视频流输入进行校验,如果觉得准确率不够高的话,还可以再次上传数据进行再一次训练,实现快速迭代。
四、全界面化操作,降低人力和时间成本
有了智能视觉,就意味着原本需要众多专业AI和算法工程师才能搭建好的AI模型,现在在控制台上通过简单的点击和上传图片,甚至完全不需要代码,就可以完成了,整个过程操作简单,从数据、模型到接口,一站式服务,全界面化管理,可以节省大量的人力成本和时间成本,实现快速落地。
如何接入智能视觉
在发布会中,智能视觉的产品经理袁华良为网友演示了从零开始搭建一个训练模型的整个过程。
第一步,在阿里云官网智能视觉产品详情页快速了解产品信息,申请开通,审批通过后登录控制台,按照指引完成开通。

第二步,首次登陆,点击马上创建模型。

第三步,添加模型,上传图片,在图片中进行标注。为了让训练的数据更接近真实效果,建议一个模型至少有2个分类,每个分类的图片不少于15张。上传完成后,点击一键训练即可。

第四步,训练结果返回后,可以看控制台中看到准确率、召回率、mAP等数据。当训练结果评估或者校验结果不理想的时候,可以将新图片加入训练集,重新进行标注,进行再一次训练与模型迭代。

目前控制台支持本地导入数据,API接口也支持从OSS、直播流、监控流的数据导入,点击查看具体的接入文档详情。
应用场景
智能视觉可应用在视频监控领域,根据监控画面中的内容,判断是否为出现违规现象,如出现车辆,打斗等;同时可以应用在互联网短视频领域,基于图像对内容识别归类,进行精准推送,提升用户的点击率和观看体验;在新零售领域,智能视觉可以检测实体店货架中的货品摆放位置及数量统计,减少巡检工作量。同时,在工业质检、农业养殖、医疗诊断等场景也可以有很好的应用。

目前智能视觉在阿里云官网开放公测,用户可以在线提交信息,进行免费试用的申请。我们欢迎各产业的伙伴们与阿里云共建视频领域的AI应用。
阿里云视频云团队具有多年音视频编解码、媒体处理经验,基于人工智能、深度学习技术,通过视频多模态内容理解、结构化分析处理,推出视频审核、视频DNA、视频智能生产、智能视觉等能力,并且与点播、直播、短视频、CDN内容分发、边缘计算组合形成一站式智能视频服务。欢迎大家登陆官网视网膜了解视频AI产品家族。

本文作者:樰篱
本文为云栖社区原创内容,未经允许不得转载。
新一代视频AI服务 —— 阿里云智能视觉重磅发布的更多相关文章
- 面向视频的全新AI架构 —— 阿里云智能视觉技术全解
我们都知道,AI技术正在以可见的速度被应用于各行各业,然而绝大部分业务场景想应用AI技术,都需要算法工程师根据自身业务的标注数据,来进行单独训练,才能打磨出合适的AI模型.如此一来,如何以最低的门槛和 ...
- 深圳云栖大会人工智能专场:探索视频+AI,玩转智能视频应用
摘要: 在人工智能时代,AI技术是如何在各行业和领域真正的发挥应用和商业价值,带来产业变革才是关键.在3月28日深圳云栖大会的人工智能专场中,阿里云视频服务技术专家邹娟将带领大家探索熟悉的视频场景中, ...
- 本地 vs. 云:大数据厮杀的最终幸存者会是谁?— InfoQ专访阿里云智能通用计算平台负责人关涛
摘要: 本地大数据服务是否进入消失倒计时?云平台大数据服务最终到底会趋向多云.混合云还是单一公有云?集群规模增大,上云成本将难以承受是误区还是事实?InfoQ 将就上述问题对阿里云智能通用计算平台负责 ...
- 阿里云智能推荐AIRec产品介绍
一.智能推荐(AIRec)简介 AIRec背景介绍 智能推荐(简称AIRec)基于阿里巴巴集团领先的大数据和人工智能技术,结合阿里巴巴在电商.内容.新闻.视频直播和社交等多个行业领域的积累,为全球企业 ...
- 阿里云智能数据构建与管理 Dataphin公测,助力企业数据中台建设
阿里云智能数据构建与管理 Dataphin (下简称“Dataphin”)近日重磅上线公共云,开启智能研发版本的公共云公测!在此之前,Dataphin以独立部署方式输出并服务线下客户,已助力多家大型客 ...
- 免费网站监控服务阿里云监控,DNSPod监控,监控宝,360云监控使用对比
网站会因为各种原因而导致宕机,具体表现为服务器没有响应,用户打不开网页,域名解析出错,搜索引擎抓取页面失败,返回各种HTTP错误代码.网站宕机可能带来搜索引擎的惩罚,网站服务器不稳定与百度关系文章中就 ...
- 微信小程序存放视频文件到阿里云用到算法js脚本文件
peterhuang007/weixinFileToaliyun: 微信小程序存放视频文件到阿里云用到算法js脚本文件 https://github.com/peterhuang007/ ...
- 阿里云SaaS生态战略发布:成就亿级营收独角兽
导语:本文中,阿里云智能资深技术专家黄省江从“势”“道”“术”三个方面分享了自己对于SaaS生态的理解,并介绍了SaaS加速器发布以来在产品.技术和商业侧最新的一些进展. 在321北京峰会上,阿里云公 ...
- 阿里云数据管理DMS企业版发布年度重大更新 多项功能全面升级
随着企业规模和人员扩充,您是否遇到这些问题:企业员工还在使用数据库账号直接操作数据库?人员流动导致运维人员频繁维护数据库账号密码?所有数据库变更还在等DBA集中执行,导致研发效率日益低下. 2月27日 ...
随机推荐
- 【DM8168学习笔记4】ezsdk安装过程记录
安装文件 ezsdk_dm816x-evm_5_05_02_00_setuplinux DM8168-EZSDK文件结构如图所示. (图片来自:http://process ...
- 如何收缩Mysql的ibdata1文件
ibdata1是MySQL数据库中一个数据文件了,你会发现它来越大了,下面我来介绍收缩Mysql的ibdata1文件大小方法. 如果你有使用InnoDB来存储你的Mysql表,使用默认设置应该会碰到个 ...
- 两天了。照着SVN的界面画的一个界面。
可以选择显示哪些列. 界面上的东西,都简单,麻烦的是它的下层.下层全部用svn server的服务器自带的svn.exe来支持. 有些位置要启动svn.exe不止一次.所以参数的来回传递,来回组合 ...
- 生成pb模型出错
raise self.ParseError('Expected identifier or number, got %s.' % result)google.protobuf.text_format. ...
- 粗浅看 Tomcat系统架构分析
原文出处: 吴士龙 http://www.importnew.com/21112.html Tomcat的结构很复杂,但是Tomcat也非常的模块化,找到了Tomcat最核心的模块,就抓住了Tomca ...
- vim编辑器操作②
本文主要介绍vim的常用编辑命令: 字符编辑: x:删除光标所在处的字符: #x:删除光标所在处起始的#个字符: 替换命令: r:替换光标所在处的字符: rCHAR; 例如:替换list中的l为大写L ...
- 前端插件--swiper.js
使用swiper.js还要注意引入它的同时也要引入swiper.css样式文件: swiper官方文档:http://www.swiper.com.cn/api/effects/193.html 实例 ...
- 浏览器在IE8 以下时显示提示信息,提示用户升级浏览器
<!--[if lt IE 8]> <div style="background: #eeeeee;border-bottom: 1px solid #cccccc;col ...
- selenium自动化方式爬取豆瓣热门电影
爬取的代码如下: from selenium import webdriver from bs4 import BeautifulSoup import time #发送请求,获取响应 def get ...
- Java 基本数据类型 相互转换
int -> String String s=String.valueOf(12345); String -> int int i=Integer.parseInt("123&q ...