谁说AI看不懂视频?
摘要:人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题,视频分析开启2.0智能时代。
视频数据量激增,数据处理和内容运营成本居高不下
云计算、大数据、物联网、人工智能等信息技术飞速发展及传统产业数字化的转型,一方面媒体数据量呈现几何级增长,据IDC预测,全球数据总量预计2020年达到44ZB,我国数据量将达到8060EB,占全球数据总量的18%;另一方面,媒体的生产、传播和消费形式升级。巨量数据中,70%将会以图片和视频的形式存储和传播。这些数据从生产、传播到用户消费,传统方式运营成本居高不下。人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题。AI助力,视频分析将全面进入智能时代。
视频从生产到消费全流程智能化
视频从生产到消费的全流程升级,如图1所示。

图1 视频生产、编辑、分发和消费流程升级
华为云EI助力视频分析全面进入智能时代。

生产
- 视频采集,从专业设备到移动终端,视频内容采集大众化。华为云EI在采集阶段可提供美颜、个性化等特效处理技术,助力视频采集即处理。
- 内容审核,用户采集内容上传存储前,华为云EI提供视频内容智能审核能力,包括视频质量评估、黄/暴/恐鉴别、重复/相似鉴别及版权指纹分析等,解决重复/疑似不安全内容进入传播流程。

编辑
- 结构化分析,华为云EI针对各种类型的长、短视频,提供智能结构化分析,将视频以镜头、内容片段等结构化形式进行描述,便于后续的内容分析、存储和分发。
- 内容分析,对结构化表示的视频内容,华为云EI从场景识别、主体识别、行为/事件检测、语音/文本分析及内容描述等方面对其进行智能化分析,支持多维护内容查询和检索。
- 智能编辑,基于智能内容分析,初步提供以下智能视频编辑技术:
(1)视频拆条
相比较长视频,短视频更有利于在互联网传播,对传统媒体的节目进行拆条是不可或缺的。华为云EI基于人物、场景、语音、OCR字幕等多模态信息分析技术,快速精确地把长视频分割成不同主题的片段。面向海量多媒体视频,大幅提高视频识别、剪辑、检索等处理的效率,降低人工运营的成本。整体效率相对人工提升10+倍,新闻类视频拆条准确率超过95%,特定场景准确率超过98%。

(2)视频摘要
静态摘要,基于视频镜头变换、内容理解技术,华为云EI针对不同类型的长、短视频提供视频静态摘要服务,能够将1个小时视频压缩成5分钟的摘要内容,可用于运营管理人员的内容快速浏览及用户快速内容播放。
视频浓缩,使用背景建模、主体检测、运动轨迹跟踪、前/背景融合技术,华为云EI提供视频浓缩服务,将极长的视频中的事件提取出来,浓缩到较短的视频片段,便于视频内容中事件的快速观看。
(3)视频封面
基于视频镜头变换、内容理解和分析技术,快速提取内容相关、构图优美的关键帧作为封面吸引用户进一步观看。相比于人工选取封面,智能封面选取速度提高20+倍,大幅降低运营成本;同时精彩的封面能够吸引用户的注意,大幅提高视频点击率。

(4)视频内容标签
视频OCR,视频物体识别,视频人物识别,从多维度对视频内容进行提取,将非结构化的视频文件,转换为结构化的数据,为视频搜索,视频推荐,视频运营等提供了必不可少的信息。

(5)水印处理
用户上传的内容除了新采集的视频,还有很大一部分为已有视频的重新传播。而重复传播的这部分视频极有可能已经打上了不同的水印。为了便于企业内容管理,华为云EI提供水印检测和处理技术,能够智能检测水印位置、重构水印并对水印进行处理。
(6)音视频指纹
视频指纹具有极大的使用场景,包括:(1) 对用户上传的内容进行重复检测;(2) 可对内容进行版权追踪;(3) 支持多维度、多粒度内容存储和检索;
华为云基于音频、视频内容分析技术,提供音、视频指纹生成、存储及检索技术。
(7)自动唱词
在新闻媒体、教育等领域往往只有视频和对应的音频信息,自动唱词技术可以根据视频自动添加字幕,相比人工添加字幕,可以极大提高视频发布的及时性,提高生产效率。
- 分发,基于前述的视频结构化和智能分析,视频内容可按照多维度进行存储,结合用户行为日志分析,支持快速检索和关联推荐,将内容以最快的速度推送到相应的用户。
- 消费,在用户消费视频的过程中,华为云EI提供自动评论及交互播放技术方案,提升终端用户体验。
人工智能正在进入以标准化、自动化、模块化为特点的工业大生产阶段。AI会将人类社会带入智能时代。本文针对视频从生产、编辑、分发到消费的整个过程如何实现智能化,进行了技术分析,希望能为对AI感兴趣的小伙伴们指点迷津,也为一直苦于传统运营模式下的你打开局面。
谁说AI看不懂视频?的更多相关文章
- 不要写很酷但同事看不懂的Java代码
你好呀,我是沉默王二,一个和黄家驹一样身高,和刘德华一样颜值的程序员.为了提高 Java 编程的技艺,我最近在 GitHub 上学习一些高手编写的代码.下面这一行代码(出自大牛之手)据说可以征服你的朋 ...
- 对于挑战书上的很久之前都看不懂的DP看懂的突破
突破一..牢记问题概念 并且牢记dp状态方程 突破二..一直有一个求和dp转化成O1dp递推的式子看不懂.. 看不懂的原因是..没有分清求和符号作用的范围 提醒:以后遇到求和符号一定明确其求和的式子的 ...
- QQ地图api里的 地址解析函数 看不懂 javascript_百度知道
QQ地图api里的 地址解析函数 看不懂 javascript_百度知道 QQ地图api里的 地址解析函数 看不懂 javascript 2011-09-18 12:18 匿名 ...
- 低头看—SQL视频
迷迷糊糊半个月过去了,耿大姐的数据库视频也在一知半解中看完.虽然耿大妈讲的很详细,很细心,但是我还是时不时的犯困(还不如看儿童英语动画片有精神呢)视频看是看完了,但东西不是自己的.这个时候就需要“颗粒 ...
- thinkphp学习笔记10—看不懂的路由规则
原文:thinkphp学习笔记10-看不懂的路由规则 路由这部分貌似在实际工作中没有怎么设计过,只是在用默认的设置,在手册里面看到部分,艰涩难懂. 1.路由定义 要使用路由功能需要支持PATH_INF ...
- Dynamics 365-CRM又报看不懂的错误了
在CRM上执行各种操作,时不时会碰到各种问题,尤其是CRM环境里包含越来越多定制的时候.有的问题在CRM弹出的错误提示框,一目了然:而有的,可能就是简单的提示:SQL Error. 这个时候我们可能都 ...
- 一篇自己都看不懂的Matrix tree总结
Matrix tree定理用于连通图生成树计数,由于博主太菜看不懂定理证明,所以本篇博客不提供\(Matrix\ tree\)定理的证明内容(反正这个东西背结论就可以了是吧) 理解\(Matrix\ ...
- 瞅瞅!!免费看VIP视频的技巧
最近再逛强大的知乎,发现一个免费看VIP视频的方法(腾讯是可能有点不稳定) 以爱奇艺为例: 复制URL到www.a6a6.org 把地址输入到输入框,点击开始 然后会提示你输入提取码 输入:22336 ...
- 让你看不懂的swift语法
一.Swift杂谈 Swift语法出来时间不长,网络上的各种教程已经铺天盖地,可是基本上全部的教程都是来自官方翻译. 从Swift出来到如今.每天都在学习Swift.以下给出个人感受 Swift中的非 ...
- 想以编程为职业,现在正在看毕向东的java基础,接下来应该看什么视频,求前辈们指教。
想以编程为职业,现在正在看毕向东的java基础,接下来应该看什么视频,求前辈们指教. https://zhidao.baidu.com/question/1368482680246425699.htm ...
随机推荐
- MyBatis foreach循环批量修改数据时报错
报错如下 org.springframework.jdbc.BadSqlGrammarException: ### Error updating database. Cause: java.sql.S ...
- python包引用方式总结
本文为博主原创,转载请注明出处: 在Python中,有多种引用包的方式.以下是常见的方式: 1. import语句 import语句是最常见和推荐的引用包的方式.它允许你引入整个包或包中的特定模块/子 ...
- es6(1)
1.var let const var---变量,重复定义不报错,没有块级作用域,不能限制修改 if(12>5){ var a=12; } alert(a); //弹出12 let---变量,重 ...
- Spring @ConfigurationProperties Yaml语法配置List和Map:List<String>、List<Obj>、List<List<Obj>>、Map<String,String>、Map<String,List<String>>、Map<String,Obj>、Map<String,List<Obj>>
yaml语法 数据结构可以用类似大纲的缩排方式呈现,结构通过缩进来表示,连续的项目通过减号"-"来表示,map结构里面的key/value对用冒号":"来分隔. ...
- 以太坊和比特币区块链的异同(一些QA)
1.比特币区块链和以太坊区块链有何区别? 比特币区块链与以太坊在设计和功能上有显著的不同.下面是关于比特币的主要点: 没有智能合约功能(按照以太坊的定义):比特币是为了作为一个去中心化的数字货币而创建 ...
- c#装饰器模式详解
基础介绍: 动态地给一个对象添加一些额外的职责.适用于需要扩展一个类的功能,或给一个类添加多个变化的情况. 装饰器,顾名思义就是在原有基础上添加一些功能. 大家都只知道如果想单纯的给原有类 ...
- Opencv中goodFeaturesToTrack函数(Harris角点、Shi-Tomasi角点检测)算子速度的进一步优化(1920*1080测试图11ms处理完成)。
搜索到某个效果很好的视频去燥的算法,感觉效果比较牛逼,就是速度比较慢,如果能做到实时,那还是很有实用价值的.于是盲目的选择了这个课题,遇到的第一个函数就是角点检测,大概六七年用过C#实现过Harris ...
- 开发一个现代化的.NetCore控制台程序,包含依赖注入/配置/日志等要素
前言 最近需要开发小工具的场景有点多,上次我用 go 语言开发了一个 hive 导出工具,体验还不错,只是 go 语言的语法实在是喜欢不起来,这次继续试试用 C# 来开发小工具. 这次小工具的功能很简 ...
- 《最新出炉》系列初窥篇-Python+Playwright自动化测试-25-处理单选和多选按钮-中篇
1.简介 上一篇中宏哥讲解和介绍的单选框有点多,而且由于时间的关系,宏哥决定今天讲解和分享复选框的相关知识. 2.什么是单选框.复选框? 单选按钮一般叫raido button,就像我们在电子版的单选 ...
- Netty源码学习4——服务端是处理新连接的&netty的reactor模式
系列文章目录和关于我 零丶引入 在前面的源码学习中,梳理了服务端的启动,以及NioEventLoop事件循环的工作流程,并了解了Netty处理网络io重要的Channel ,ChannelHandle ...