上一篇文章中介绍了实验的准备工作, HDTV(1920x1080)码率和视频质量关系的研究 1 (前期准备) 本文介绍一下实验的结果. 首先来看一下主观评价的试验结果: 从实验结果来看,可以得出以下结论: 1.观看距离比较近(3H)的主观质量要差于观看距离比较远(4H)的主观质量 2.随着码率的下降,视频的质量逐渐下降 3.同等码率下1080i/25的主观质量要低于1080p/50(这个结果是比较惊人的,造成这种结果可能有多种原因:显示器,编码器等等) 4.1080i/25随着码率的下降,主观质…
Hans Hoffmann等人在论文<Studies on the Bit Rate Requirements for a HDTV Format With 1920 x 1080 pixel Resolution, Progressive Scanning at 50 Hz Frame Rate Targeting Large Flat Panel Displays>中,研究了HDTV的码率和视频质量之间的关系.在此记录一下论文的内容. 注:论文题目翻译过来意思是<基于大型平板显示器的…
作者:杨洋,阿里云技术专家,从事直播相关媒体处理引擎开发 背景 图像质量的衡量是个老问题,对此人们提出过很多简单可行的解决方案.例如均方误差(Mean-squared-error,MSE).峰值信噪比(Peak-signal-to-noise-ratio,PSNR)以及结构相似性指数(Structural Similarity Index,SSIM),这些指标最初都是被用于衡量图像质量的,随后被扩展到视频领域. 这些指标通常会用在循环用在编码内部,可用于对编码决策进行优化并估算最终编码后视频的质…
ITU-R BT.1788建议书 对多媒体应用中视频质量的主观评估方法 (ITU‑R 102/6号研究课题) (2007年) 范围 数字广播系统允许提供多媒体和数据广播应用,包括视频.音频.静态图像.文本和图表.本建议书规定评估多媒体应用视频质量的非交互式主观评估方法. 国际电联无线电通信全会, 考虑到 a)        许多国家正在引入数字广播系统: b)        利用数字广播系统,已经引入或计划引入包括视频.音频.静态图像.文本.图表等的多媒体和数据广播服务: c)        多…
阿里云视频云直播转码每天都会处理大量的不同场景.不同编码格式的直播流.为了保证高画质,团队借助VMAF标准来对每路转码的效果做质量评估,然后进行反馈.调优.迭代.这么做的原因在于,像动作片.纪录片.动画片.体育赛事这些场景,影响画质的因素各不相同,基于VMAF的视频质量反馈机制,可以在保证画质的前提下,对不同的场景做针对性优化,达到画质最优.成本最低的效果.本文由阿里云视频云高级开发工程师杨洋撰写,旨在分享VMAF的核心模块与技术实践. 背景 图像质量的衡量是个老问题,对此人们提出过很多简单可行…
本文记录一种无参考视频质量评价算法.这是我们自己实验室前两年一个师姐做的,算法还是比较准确的,在此记录一下. 注意本算法前提是高清视频.而且是H.264编码方式. 该方法主要使用两个码流里面的参数进行质量评价:量化因子(QP)和跳过宏块数(skip_num). 使用了四个序列作为测试序列:spray,running,dunk,flower. 下图显示了QP和MOS(主观评价平均意见分)之间的关系.可见因为内容不同,不同序列同等QP下的MOS值不尽相同.但是趋势是差不多的:随着QP的升高,MOS降…
转载处:http://blog.csdn.NET/leixiaohua1020/article/details/11694369 最常用的全参考视频质量评价方法有以下2种: PSNR(峰值信噪比):用得最多,但是其值不能很好地反映人眼主观感受.一般取值范围:20-40.值越大,视频质量越好. SSIM(结构相似性):计算稍复杂,其值可以较好地反映人眼主观感受.一般取值范围:0-1.值越大,视频质量越好. PSNR,SSIM计算有如下工具可选: MSU Video Quality Measurem…
术语"编解码器 Coder/Decoder"是压缩器/解压缩器或编码器/解码器一词的缩写.顾名思义,编码可使视频文件变小以进行存储,然后在需要再次使用时将压缩后的数据转换成可用的图像. 视频质量评价(VQA)是以人眼的主观质量评估结果为依据,使用算法模型对失真视频进行评估. 传 统的评估方法难以做到主观评价结果与客观评价结果相一致.基于深度学习的视频质量评价方法无需加入 手工特征,通过模型自主学习即可进行评估,对视频质量的监控和评价有重要意义 计算机视觉的数据集开源下载 https:/…
想知道MP3的频率.比特率.码率与音质的关系,是不是频率越高,码率越高,音质就越好.好像MP3大多数的频率都是44100HZ的.码率有128,192等等. 这里所说的频率是採样率,一般都是44100KHz的,由于这是音乐CD的标准.每一首歌,都是从CD抓轨.转成WAV文件.再用Lame等软件转为MP3的.所以肯定都是44100KHz的採样率.除非你的不是歌,而是自己录音成为WAV文件,并且录音时选了其它的採样率.影响MP3音质的主要是码率.如今最好的是320K的CBR(固定码率)和VBR(可变码…
用Python和FFmpeg查找大码率的视频文件 本文使用Python2.7, 这个工作分两步 遍历目录下的视频文件 用ffprobe获取是视频文件的码率信息 用ffprobe 获取json格式的视频信息 用ffprobe.exe是FFmpeg自带的查看视频信息的工具.其获取json格式的信息命令例如以下 ffprobe -v quiet -print_format json -show_format -show_streams -i filename 这个命令会输出 带有 streams和fo…
目录 1. ABSTRACT 2. INTRODUCTION 3. RELATED WORKS 3.1. Quality Enhancement 3.2. Multi-frame Super-resolution 3. 压缩视频的质量波动 4. MF-CNN 4.1. Framework 4.2. SVM-based PQF detector 4.3. MC-subnet Architecture Training strategy 4.4. QE-subnet Architecture Tra…
如何确定一个视频质量的好坏一直以来都是个棘手的问题.目前常用的方法就是通过人眼来直接观看,但是由于人眼的主观性及观看人员的单体差异性,对于同样的视频质量,不同的人的感受是不一样的.为此多个研究机构提出了视频质量客观测试方法,即利用机器或程序来评价视频质量的方法.本文正是要介绍一下其中的一种方法:VQM,并且总结了一些有关VQM视频质量评价方法的资料.VQM方法给出的客观分数比较符合主观感受,属于比较好的一种质量评价算法. 各种视频质量评价方法对比: 目前最常见的客观测试标准是PSNR(峰值信噪比…
一.PTZ云台运动检测是通过配合云台运动的功能检测云台运动是否正常. 二.原理 取云台运动前N帧图像,进行背景建模,得到运动前背景A. 设备发送云台运动指令,让云台进行运动,改变场景. 取云台运动后N帧图像,进行背景建模,得到运动后背景B. 对比A,B颜色直方图的相似度,大于K时认为PTZ云台运动有故障. 三.结果演示 视频质量诊断算法库Demo演示下载地址:链接:https://pan.baidu.com/s/1Qrm_peAltkxMjYtNnJq_AA 提取码:hbxx 视频质量诊断系统下…
基于SURF特征的图像与视频拼接技术的研究和实现(一)      一直有计划研究实时图像拼接,但是直到最近拜读西电2013年张亚娟的<基于SURF特征的图像与视频拼接技术的研究和实现>,条理清晰.内容完整.实现的技术具有市场价值.因此定下决心以这篇论文为基础脉络,结合实际情况,进行“基于SURF特征的图像与视频拼接技术的研究和实现”.       一.基于opencv的surf实现       3.0以后,surf被分到了"opencv_contrib-master"中去,…
原文:关于Android中图片大小.内存占用与drawable文件夹关系的研究与分析 相关: Android drawable微技巧,你所不知道的drawable的那些细节 经常会有朋友问我这个问题:“能不能一个App只提供一套切图适应所有的分辨率呢?”我觉得有必要写一篇文章来研究一下这个问题,所以就有了这篇文章. 研究内容 研究方法 测试环境 研究过程 结果分析 结论 另外一个难以解释的问题 研究内容 本篇内容主要探讨以下场景:同一张图片,放置在不同的drawable文件夹,在同一设备上运行,…
视频外同步信号研究---fvh 一个时钟周期有两个edge,分别称为:(1)Leading edge=前一个边沿=第一个边沿,对于开始电压是1,那么就是1变成0的时候:对于开始电压是0,那么就是0变成1的时候.(2)Trailing edge=后一个边沿=第二个边沿,对于开始电压是1,那么就是0变成1的时候:对于开始电压是0,那么就是1变成0的时候.…
目录 1. 亮点 2. 网络 3. Mask 及其融合 4. 结论 论文:Enhancing HEVC Compressed Videos with a Partition-Masked Convolutional Neural Network He, Xiaoyi, et al. "Enhancing HEVC compressed videos with a partition-masked convolutional neural network." 2018 25th IEEE…
需求说明(bug出处): 简单说:下载youtube的视频,嵌入翻译好的中文字幕. 详细说(可略过): 阿里的海外服务器需要布一个Web Service---用以接收国内(本地服务器)的请求, 然后用youtube-dl下载需要的视频(此bug出处),上传国内阿里服务器OSS,然后做音频抽取,语音识别,翻译,嵌入字幕. Django views中下载视频核心代码: 以下是:自动选择下载最高质量视频的参数 bestvideo[ext=mp4]+bestaudio[ext=m4a]/best[ext…
VMAF 方法: 基本想法: 面对不同特征的源内容.失真类型,以及扭曲程度,每个基本指标各有优劣.通过使用机器学习算法(支持向量机(Support Vector Machine,SVM)回归因子)将基本指标“融合”为一个最终指标,可以为每个基本指标分配一定的权重,这样最终得到的指标就可以保留每个基本指标的所有优势,借此可得出更精确的最终分数.我们还使用主观实验中获得的意见分数对这个机器学习模型进行训练和测试. VMAF可在支持向量机(SVM)回归因子中使用下列基本指标进行融合: 1.视觉信息保真…
版权声明:我极少创造新知识,大部分情况下是个知识的二道贩子 https://blog.csdn.net/stereohomology/article/details/24478825 应该非常一目了然了吧.  假设是Mathematica,能够用这种代码模拟曲线部分: With[{yslice1 = .5, yslice2 = -.8}, GraphicsGrid[{{Plot[{ArcTan[-x], 1.5, -1.2}, {x, -5, 5}, Axes -> False, Frame -…
浅谈视频会议中H.264编码标准的技术发展 浅谈视频会议中H.264编码标准的技术发展 数字视频技术广泛应用于通信.计算机.广播电视等领域,带来了会议电视.可视电话及数字电视.媒体存储等一系列应用,促使了许多视频编码标准的产生.ITU-T 与ISO/IEC 是制定视频编码标准的两大组织,ITU-T 的标准包括H.261.H.262.H.263.H.264,主要应用于实时视频通信领域,如会议电视:MPEG 系列标准是由ISO/IEC制定的,主要应用于视频存储(DVD).广播电视.因特网或无线网上的…
本文为 QoS 弱网优化系列的第二篇 作者|安基程.田伟峰 审校| 泰一 视频编码中的变分辨率问题及解决 变分辨率在弱网场景的实际应用中非常常见,网络状况不好的时候降低分辨率可以降低码率,减少块效应,网络好的时候增加分辨率可以提升清晰度及主观体验. 目前主流的视频编码标准,比如 H.264.H.265,在编码过程中如果要进行分辨率切换,则必须要先编码一个 I 帧,而 I 帧只能使用帧内预测,编码效率低下.这在弱网变分辨率的时候就容易造成卡顿.下图中展示了每秒钟切换分辨率的码率波动效果,高低两个分…
本文主要介绍VP9(我们翻译和整理的,译者:weizhenwei,校验:blacker),最早发表在[编风网] 支持原创,转载必须注明出处,欢迎关注我的微信公众号blacker(微信ID:blackerteam 或 webrtcorgcn). VP8和VP9是由Google开发和推动的视频编解码器.直到最近,这促使我和周围客户产生一系列有趣的对话:是否采用VP9?何时采用VP9?是否应该用H.264代替VP9? 这个VP8对VP9的话题往往导致误解,因此先让我把事情排序. 首要的事情放前边: 1…
今天需要设置Flex中的Camera组件的一些属性,后来发现清晰度不是很高,于是捣鼓了上午半天,设置了很多的参数,竟然发现手册上就是有现成的一些设置方法,郁闷!不过我还是专门设置了几个有用和必要的属性,为自己的程序中应用,其实很简单! 以此为例: Camera.setMode(320,240,15); 就是要设置一个宽320.高240.播放速率是15fps,他的带宽消耗: (320*240*15)/1000000 = 1.2(Mbps) = 1152000(Bps)//1000000是1024*…
基于Live555实现RtspServer及高清高码率视频传输优化 最近做了一些pc和嵌入式平台的RTSP服务器项目,大多数的要求是简单但是功能全面,并且性能还要强劲.综合考虑后,基本都是在基于live555的基础上进行开发,在进行Live555本身的优化以及程序内部视频数据传输的优化后,不仅实现了需求而且性能还超出预期,实现了10Mbps高码率的1080p以上高分辨率高清视频的流畅直播.这里将一些优化点分享一下: 为什么基于Live555开发 其实之前我就已经开发过一个RTSP Server程…
Unity3d 播放高质量视频解决方案~ 最近在折腾一个视频游戏.真的是一个视频游戏,游戏主背景是个大视频.可能切换三四个视频,而且需要无缝切换. 平台是安卓,蕊片是rockclip.找了各式各样的插件. movietexture,只能播放OGG和OVG,而且质量比较低.如果要转成高质量的视频,文件尺寸比较大. 放弃,继续找. easymovietexture, 某些机子上黑滴-兼容性不好,继续找. avipro 额,是这个名字么,最后发现只能在IOS上使用.继续找. Vuforia video…
DxPackNet 对视频的压缩和解压也提供了很好的支持,且系统不需要装第三方解码器哦~ 主要用到了 IxVideoEncoder 视频编码器  和 IxVideoDecoder 两个接口 这里只做简单的组件功能使用介绍,实际应用中可能涉及到 UDP分包,包顺序控制, 音视频传输协议制定, P2P,这就不在本文的讨论范围 private void Form1_Load(object sender, EventArgs e) { server = new Socket(AddressFamily.…
MSU Video Quality Measurement Tool(msu vqmt)是莫斯科国立大学(Moscow State University)的Graphics and Media Lab制作的一款客观视频质量评价程序.它提供了多种全参考视频质量评价方法(对比两个视频)和无参考视频质量评价方法(分析一个视频). 软件地址:http://www.compression.ru/video/quality_measure/video_measurement_tool_en.html 软件工…
分层条件关系网络在视频问答VideoQA中的应用:CVPR2020论文解析 Hierarchical Conditional Relation Networks for Video Question Answering 论文链接:https://arxiv.org/pdf/2002.10698.pdf 摘要 视频问答(VideoQA)具有挑战性,因为它需要建模能力来提取动态视觉伪影和远距离关系,并将它们与语言概念相关联.本文介绍了一种通用的可重复使用的神经单元,称为条件关系网络(CRN),它作为…
编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间.尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析.应用开发.释放 license收费等等.最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了.所以豆丁上看不出所以然,从 wiki上查.中文的wiki信息量有限,很短,而wiki的英文内容内多,…