谁说AI看不懂视频?
摘要:人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题,视频分析开启2.0智能时代。
视频数据量激增,数据处理和内容运营成本居高不下
云计算、大数据、物联网、人工智能等信息技术飞速发展及传统产业数字化的转型,一方面媒体数据量呈现几何级增长,据IDC预测,全球数据总量预计2020年达到44ZB,我国数据量将达到8060EB,占全球数据总量的18%;另一方面,媒体的生产、传播和消费形式升级。巨量数据中,70%将会以图片和视频的形式存储和传播。这些数据从生产、传播到用户消费,传统方式运营成本居高不下。人工智能在视觉领域发展趋于成熟,基于人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题。AI助力,视频分析将全面进入智能时代。
视频从生产到消费全流程智能化
视频从生产到消费的全流程升级,如图1所示。

图1 视频生产、编辑、分发和消费流程升级
华为云EI助力视频分析全面进入智能时代。

生产
- 视频采集,从专业设备到移动终端,视频内容采集大众化。华为云EI在采集阶段可提供美颜、个性化等特效处理技术,助力视频采集即处理。
- 内容审核,用户采集内容上传存储前,华为云EI提供视频内容智能审核能力,包括视频质量评估、黄/暴/恐鉴别、重复/相似鉴别及版权指纹分析等,解决重复/疑似不安全内容进入传播流程。

编辑
- 结构化分析,华为云EI针对各种类型的长、短视频,提供智能结构化分析,将视频以镜头、内容片段等结构化形式进行描述,便于后续的内容分析、存储和分发。
- 内容分析,对结构化表示的视频内容,华为云EI从场景识别、主体识别、行为/事件检测、语音/文本分析及内容描述等方面对其进行智能化分析,支持多维护内容查询和检索。
- 智能编辑,基于智能内容分析,初步提供以下智能视频编辑技术:
(1)视频拆条
相比较长视频,短视频更有利于在互联网传播,对传统媒体的节目进行拆条是不可或缺的。华为云EI基于人物、场景、语音、OCR字幕等多模态信息分析技术,快速精确地把长视频分割成不同主题的片段。面向海量多媒体视频,大幅提高视频识别、剪辑、检索等处理的效率,降低人工运营的成本。整体效率相对人工提升10+倍,新闻类视频拆条准确率超过95%,特定场景准确率超过98%。

(2)视频摘要
静态摘要,基于视频镜头变换、内容理解技术,华为云EI针对不同类型的长、短视频提供视频静态摘要服务,能够将1个小时视频压缩成5分钟的摘要内容,可用于运营管理人员的内容快速浏览及用户快速内容播放。
视频浓缩,使用背景建模、主体检测、运动轨迹跟踪、前/背景融合技术,华为云EI提供视频浓缩服务,将极长的视频中的事件提取出来,浓缩到较短的视频片段,便于视频内容中事件的快速观看。
(3)视频封面
基于视频镜头变换、内容理解和分析技术,快速提取内容相关、构图优美的关键帧作为封面吸引用户进一步观看。相比于人工选取封面,智能封面选取速度提高20+倍,大幅降低运营成本;同时精彩的封面能够吸引用户的注意,大幅提高视频点击率。

(4)视频内容标签
视频OCR,视频物体识别,视频人物识别,从多维度对视频内容进行提取,将非结构化的视频文件,转换为结构化的数据,为视频搜索,视频推荐,视频运营等提供了必不可少的信息。

(5)水印处理
用户上传的内容除了新采集的视频,还有很大一部分为已有视频的重新传播。而重复传播的这部分视频极有可能已经打上了不同的水印。为了便于企业内容管理,华为云EI提供水印检测和处理技术,能够智能检测水印位置、重构水印并对水印进行处理。
(6)音视频指纹
视频指纹具有极大的使用场景,包括:(1) 对用户上传的内容进行重复检测;(2) 可对内容进行版权追踪;(3) 支持多维度、多粒度内容存储和检索;
华为云基于音频、视频内容分析技术,提供音、视频指纹生成、存储及检索技术。
(7)自动唱词
在新闻媒体、教育等领域往往只有视频和对应的音频信息,自动唱词技术可以根据视频自动添加字幕,相比人工添加字幕,可以极大提高视频发布的及时性,提高生产效率。
- 分发,基于前述的视频结构化和智能分析,视频内容可按照多维度进行存储,结合用户行为日志分析,支持快速检索和关联推荐,将内容以最快的速度推送到相应的用户。
- 消费,在用户消费视频的过程中,华为云EI提供自动评论及交互播放技术方案,提升终端用户体验。
人工智能正在进入以标准化、自动化、模块化为特点的工业大生产阶段。AI会将人类社会带入智能时代。本文针对视频从生产、编辑、分发到消费的整个过程如何实现智能化,进行了技术分析,希望能为对AI感兴趣的小伙伴们指点迷津,也为一直苦于传统运营模式下的你打开局面。
谁说AI看不懂视频?的更多相关文章
- 不要写很酷但同事看不懂的Java代码
你好呀,我是沉默王二,一个和黄家驹一样身高,和刘德华一样颜值的程序员.为了提高 Java 编程的技艺,我最近在 GitHub 上学习一些高手编写的代码.下面这一行代码(出自大牛之手)据说可以征服你的朋 ...
- 对于挑战书上的很久之前都看不懂的DP看懂的突破
突破一..牢记问题概念 并且牢记dp状态方程 突破二..一直有一个求和dp转化成O1dp递推的式子看不懂.. 看不懂的原因是..没有分清求和符号作用的范围 提醒:以后遇到求和符号一定明确其求和的式子的 ...
- QQ地图api里的 地址解析函数 看不懂 javascript_百度知道
QQ地图api里的 地址解析函数 看不懂 javascript_百度知道 QQ地图api里的 地址解析函数 看不懂 javascript 2011-09-18 12:18 匿名 ...
- 低头看—SQL视频
迷迷糊糊半个月过去了,耿大姐的数据库视频也在一知半解中看完.虽然耿大妈讲的很详细,很细心,但是我还是时不时的犯困(还不如看儿童英语动画片有精神呢)视频看是看完了,但东西不是自己的.这个时候就需要“颗粒 ...
- thinkphp学习笔记10—看不懂的路由规则
原文:thinkphp学习笔记10-看不懂的路由规则 路由这部分貌似在实际工作中没有怎么设计过,只是在用默认的设置,在手册里面看到部分,艰涩难懂. 1.路由定义 要使用路由功能需要支持PATH_INF ...
- Dynamics 365-CRM又报看不懂的错误了
在CRM上执行各种操作,时不时会碰到各种问题,尤其是CRM环境里包含越来越多定制的时候.有的问题在CRM弹出的错误提示框,一目了然:而有的,可能就是简单的提示:SQL Error. 这个时候我们可能都 ...
- 一篇自己都看不懂的Matrix tree总结
Matrix tree定理用于连通图生成树计数,由于博主太菜看不懂定理证明,所以本篇博客不提供\(Matrix\ tree\)定理的证明内容(反正这个东西背结论就可以了是吧) 理解\(Matrix\ ...
- 瞅瞅!!免费看VIP视频的技巧
最近再逛强大的知乎,发现一个免费看VIP视频的方法(腾讯是可能有点不稳定) 以爱奇艺为例: 复制URL到www.a6a6.org 把地址输入到输入框,点击开始 然后会提示你输入提取码 输入:22336 ...
- 让你看不懂的swift语法
一.Swift杂谈 Swift语法出来时间不长,网络上的各种教程已经铺天盖地,可是基本上全部的教程都是来自官方翻译. 从Swift出来到如今.每天都在学习Swift.以下给出个人感受 Swift中的非 ...
- 想以编程为职业,现在正在看毕向东的java基础,接下来应该看什么视频,求前辈们指教。
想以编程为职业,现在正在看毕向东的java基础,接下来应该看什么视频,求前辈们指教. https://zhidao.baidu.com/question/1368482680246425699.htm ...
随机推荐
- Perceptual Losses 风格迁移论文复现小记
看了一篇李飞飞组的论文 Perceptual Losses for Real-Time Style Transfer and Super-Resolution. 论文地址为:https://arxiv ...
- 彻底搞懂Docker容器与Kraft模式kafka集群关于消息大小相关参数设置
Docker部署的设置 部署背景: 在DockerHub拉取的bitnami/kafka:3.4.1 镜像,如果要部署在Docker-Swarm集群或者单Docker部署,对于消息大小设置需要添加参数 ...
- dig 简明教程
哈喽大家好,我是咸鱼 不知道大家在日常学习或者工作当中用 dig 命令多不多 dig 是 Domain Information Groper 的缩写,对于网络管理员和在域名系统(DNS)领域工作的小伙 ...
- [Python急救站课程]日期和时间的输出
日期和时间的输出 from datetime import datetime # 引用datetime 库 now = datetime.now() # 获得当前日期和时间信息 print(now) ...
- Error running 'TestAlterNickname.test': Command line is too long. Shorten command line for TestAlterNickname.test or also for JUnit default configuration
问题描述 如图IDEA报错问题,发生在我用JUnit进行测试时. 解决方法 1. 直接点击 default 2. Modify options -> Shorten command line 3 ...
- STM32CUBEIDE 如何将变量定义到指定内存地址
使用场景如下: 我需要将bootloader/APP的版本号和一些字段信息定义到指定FLASH地址. 在STM32CubeIDE中的方法: 截止当前STM32CubeIDE还没有提供图形化的针对FLA ...
- Pipeline模式应用
本文记录Pipeline设计模式在业务流程编排中的应用 前言 Pipeline模式意为管道模式,又称为流水线模式.旨在通过预先设定好的一系列阶段来处理输入的数据,每个阶段的输出即是下一阶段的输入. 本 ...
- [Python急救站]文件管理工具
对于一个程序员,有时候文件太多,忘记放哪里了,那有没有一个可以帮你定位到文件的文件管理工具呢,抱着这样的想法,我做了以下这个代码,可以快速定位找到文件所在位置. import os import tk ...
- C# 获取系统DPI缩放比例以及分辨率大小
一般方法 System.Windows.Forms.Screen类 // 获取当前主屏幕分辨率 int screenWidth = Screen.PrimaryScreen.Bounds.Width; ...
- PWA 离线方案研究报告
本文并不是介绍如何将一个网页配置成离线应用并支持安装下载的.研究PWA的目的仅仅是为了保证用户的资源可以直接从本地加载,来忽略全国或者全球网络质量对页面加载速度造成影响.当然,如果页面上所需的资源,除 ...