谁说AI看不懂视频?
摘要:人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题,视频分析开启2.0智能时代。
视频数据量激增,数据处理和内容运营成本居高不下
云计算、大数据、物联网、人工智能等信息技术飞速发展及传统产业数字化的转型,一方面媒体数据量呈现几何级增长,据IDC预测,全球数据总量预计2020年达到44ZB,我国数据量将达到8060EB,占全球数据总量的18%;另一方面,媒体的生产、传播和消费形式升级。巨量数据中,70%将会以图片和视频的形式存储和传播。这些数据从生产、传播到用户消费,传统方式运营成本居高不下。人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题。AI助力,视频分析将全面进入智能时代。
视频从生产到消费全流程智能化
视频从生产到消费的全流程升级,如图1所示。

图1 视频生产、编辑、分发和消费流程升级
华为云EI助力视频分析全面进入智能时代。

生产
- 视频采集,从专业设备到移动终端,视频内容采集大众化。华为云EI在采集阶段可提供美颜、个性化等特效处理技术,助力视频采集即处理。
- 内容审核,用户采集内容上传存储前,华为云EI提供视频内容智能审核能力,包括视频质量评估、黄/暴/恐鉴别、重复/相似鉴别及版权指纹分析等,解决重复/疑似不安全内容进入传播流程。

编辑
- 结构化分析,华为云EI针对各种类型的长、短视频,提供智能结构化分析,将视频以镜头、内容片段等结构化形式进行描述,便于后续的内容分析、存储和分发。
- 内容分析,对结构化表示的视频内容,华为云EI从场景识别、主体识别、行为/事件检测、语音/文本分析及内容描述等方面对其进行智能化分析,支持多维护内容查询和检索。
- 智能编辑,基于智能内容分析,初步提供以下智能视频编辑技术:
(1)视频拆条
相比较长视频,短视频更有利于在互联网传播,对传统媒体的节目进行拆条是不可或缺的。华为云EI基于人物、场景、语音、OCR字幕等多模态信息分析技术,快速精确地把长视频分割成不同主题的片段。面向海量多媒体视频,大幅提高视频识别、剪辑、检索等处理的效率,降低人工运营的成本。整体效率相对人工提升10+倍,新闻类视频拆条准确率超过95%,特定场景准确率超过98%。

(2)视频摘要
静态摘要,基于视频镜头变换、内容理解技术,华为云EI针对不同类型的长、短视频提供视频静态摘要服务,能够将1个小时视频压缩成5分钟的摘要内容,可用于运营管理人员的内容快速浏览及用户快速内容播放。
视频浓缩,使用背景建模、主体检测、运动轨迹跟踪、前/背景融合技术,华为云EI提供视频浓缩服务,将极长的视频中的事件提取出来,浓缩到较短的视频片段,便于视频内容中事件的快速观看。
(3)视频封面
基于视频镜头变换、内容理解和分析技术,快速提取内容相关、构图优美的关键帧作为封面吸引用户进一步观看。相比于人工选取封面,智能封面选取速度提高20+倍,大幅降低运营成本;同时精彩的封面能够吸引用户的注意,大幅提高视频点击率。

(4)视频内容标签
视频OCR,视频物体识别,视频人物识别,从多维度对视频内容进行提取,将非结构化的视频文件,转换为结构化的数据,为视频搜索,视频推荐,视频运营等提供了必不可少的信息。

(5)水印处理
用户上传的内容除了新采集的视频,还有很大一部分为已有视频的重新传播。而重复传播的这部分视频极有可能已经打上了不同的水印。为了便于企业内容管理,华为云EI提供水印检测和处理技术,能够智能检测水印位置、重构水印并对水印进行处理。
(6)音视频指纹
视频指纹具有极大的使用场景,包括:(1) 对用户上传的内容进行重复检测;(2) 可对内容进行版权追踪;(3) 支持多维度、多粒度内容存储和检索;
华为云基于音频、视频内容分析技术,提供音、视频指纹生成、存储及检索技术。
(7)自动唱词
在新闻媒体、教育等领域往往只有视频和对应的音频信息,自动唱词技术可以根据视频自动添加字幕,相比人工添加字幕,可以极大提高视频发布的及时性,提高生产效率。
- 分发,基于前述的视频结构化和智能分析,视频内容可按照多维度进行存储,结合用户行为日志分析,支持快速检索和关联推荐,将内容以最快的速度推送到相应的用户。
- 消费,在用户消费视频的过程中,华为云EI提供自动评论及交互播放技术方案,提升终端用户体验。
人工智能正在进入以标准化、自动化、模块化为特点的工业大生产阶段。AI会将人类社会带入智能时代。本文针对视频从生产、编辑、分发到消费的整个过程如何实现智能化,进行了技术分析,希望能为对AI感兴趣的小伙伴们指点迷津,也为一直苦于传统运营模式下的你打开局面。
谁说AI看不懂视频?的更多相关文章
- 不要写很酷但同事看不懂的Java代码
你好呀,我是沉默王二,一个和黄家驹一样身高,和刘德华一样颜值的程序员.为了提高 Java 编程的技艺,我最近在 GitHub 上学习一些高手编写的代码.下面这一行代码(出自大牛之手)据说可以征服你的朋 ...
- 对于挑战书上的很久之前都看不懂的DP看懂的突破
突破一..牢记问题概念 并且牢记dp状态方程 突破二..一直有一个求和dp转化成O1dp递推的式子看不懂.. 看不懂的原因是..没有分清求和符号作用的范围 提醒:以后遇到求和符号一定明确其求和的式子的 ...
- QQ地图api里的 地址解析函数 看不懂 javascript_百度知道
QQ地图api里的 地址解析函数 看不懂 javascript_百度知道 QQ地图api里的 地址解析函数 看不懂 javascript 2011-09-18 12:18 匿名 ...
- 低头看—SQL视频
迷迷糊糊半个月过去了,耿大姐的数据库视频也在一知半解中看完.虽然耿大妈讲的很详细,很细心,但是我还是时不时的犯困(还不如看儿童英语动画片有精神呢)视频看是看完了,但东西不是自己的.这个时候就需要“颗粒 ...
- thinkphp学习笔记10—看不懂的路由规则
原文:thinkphp学习笔记10-看不懂的路由规则 路由这部分貌似在实际工作中没有怎么设计过,只是在用默认的设置,在手册里面看到部分,艰涩难懂. 1.路由定义 要使用路由功能需要支持PATH_INF ...
- Dynamics 365-CRM又报看不懂的错误了
在CRM上执行各种操作,时不时会碰到各种问题,尤其是CRM环境里包含越来越多定制的时候.有的问题在CRM弹出的错误提示框,一目了然:而有的,可能就是简单的提示:SQL Error. 这个时候我们可能都 ...
- 一篇自己都看不懂的Matrix tree总结
Matrix tree定理用于连通图生成树计数,由于博主太菜看不懂定理证明,所以本篇博客不提供\(Matrix\ tree\)定理的证明内容(反正这个东西背结论就可以了是吧) 理解\(Matrix\ ...
- 瞅瞅!!免费看VIP视频的技巧
最近再逛强大的知乎,发现一个免费看VIP视频的方法(腾讯是可能有点不稳定) 以爱奇艺为例: 复制URL到www.a6a6.org 把地址输入到输入框,点击开始 然后会提示你输入提取码 输入:22336 ...
- 让你看不懂的swift语法
一.Swift杂谈 Swift语法出来时间不长,网络上的各种教程已经铺天盖地,可是基本上全部的教程都是来自官方翻译. 从Swift出来到如今.每天都在学习Swift.以下给出个人感受 Swift中的非 ...
- 想以编程为职业,现在正在看毕向东的java基础,接下来应该看什么视频,求前辈们指教。
想以编程为职业,现在正在看毕向东的java基础,接下来应该看什么视频,求前辈们指教. https://zhidao.baidu.com/question/1368482680246425699.htm ...
随机推荐
- calico网络异常,不健康
解决calico/node is not ready: BIRD is not ready: BGP not established withxxx calico有一个没有ready,查了一下是没有发 ...
- ansible平台
1.ansible概念: 1)ansible和saltstck是目前互联网IT运维人员使用最多的自动化运维管理工具,主要用于对批量(并行)Linux服务器:安装.部署.配置.指令操作.任务计划.参数调 ...
- Jenkins相关概念
1,Jenkins相关工具概念: 要熟练掌握Jenkins持续集成的配置.使用和管理,需要了解相关的概念.例如代码开发.编译.打包.构建等名称,常见的代码相关概念包括:JDK.JAVA.MAKE.AN ...
- 博弈论(Nim游戏 , 有向图游戏)
博弈论专题 Nim游戏 内容: 有 n 堆石子,每堆石子的石子数给出,甲乙两人回合制取石子,每次可以取任意一堆石子的任意多个(可以直接取完,但不能不取),每个人都按照最优策略来取(抽象),问先手必胜或 ...
- AtCoder Beginner Contest 321(ABC321)
A. 321-like Checker 直接模拟. Code B. Cutoff 直接暴力枚举 \([0\sim100]\),每次把第 \(n\) 个数当作当前枚举的 \(i\),然后看看条件是否满足 ...
- 【爬虫实战】用Python采集任意小红书笔记下的评论,爬了10000多条,含二级评论!
目录 一.爬取目标 二.爬虫代码讲解 2.1 分析过程 2.2 爬虫代码 三.演示视频 一.爬取目标 您好!我是@马哥python说 ,一名10年程序猿. 我们继续分享Python爬虫的案例,今天爬取 ...
- Kafka基本原理、生产问题总结及性能优化实践
Kafka是最初由Linkedin公司开发,是一个分布式.支持分区的(partition).多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量 ...
- [ABP] PostgreSQL在.NET 6.0使用DateTime类型抛出异常:timestamp with time zone
今晚操起久违的 ABP 框架搭了个新项目: .NET 运行时版本:6.0.3 ABP 版本:v5.2.0-rc.2 版本. 数据库:PostgreSQL v10.x 一顿操作猛如虎,直接用 dotne ...
- Java——设计模式
一.概述 设计模式是历代程序员总结出的经验 二.分类 创建型模式:简单工厂模式 工厂方法模式 单例模式:饿汉式(开发) 懒汉式(面试) 行为型模式 结构型模式 三.简单工厂模式 一个工厂中可以创建很多 ...
- GUI界面实现小学生口算题卡功能(一)| 简要了解GUI
上课没认真听,下课不好好写. 关于GUI,首先了解了一下什么是GUI: GUI(Graphical User Interface),图形用户界面.采用图形方式显示的计算机操作用户接口.与早期计算机使用 ...