LTR 弱网对抗由于需要解码器的反馈,因此用硬件解码器实现时需要做一些特殊处理。另外,一些硬件解码器对 LTR 的实现不是特别完善,会导致出现解码错误。本文为 QoS 弱网优化系列的第三篇,将为您详解阿里云 RTC QoS 策略中的 LTR 抗弱网原理与实现硬解 LTR 时遇到的坑及其相应解法。

作者|安基程、陶森柏、田伟峰

审校|泰一

Long Term Reference (LTR) 抗弱网原理

参考帧丢失的 I 帧恢复

在 RTC 场景下一般的编码参考策略是向前一帧参考(在不考虑 temporal svc 的情况下),因为一般情况下参考距离越近,相似性越好,则压缩效果越好,出于实时的考虑编码只有 I 帧和 P 帧,没有 B 帧。在有 P 帧丢失的场景下,接收端需要重新请求 I 帧才能继续正确的解码和播放。

如上图所示,正常的 I P P P 帧编码,如果发生弱网导致中间的某个 P 帧(️ 标记)丢失,无法恢复,则接收端会请求发送端重新编码 I 帧,然而 I 帧只能使用帧内预测,所以编码效率低下。

参考帧丢失的 LTR 恢复

长期参考帧是一种可跨帧的参考帧选择策略,这种策略打破了传统的向前一帧的限制,可以更加灵活地选择参考帧。长期参考帧策略的目的是在有 P 帧丢失的场景下,接收端不需要重新请求 I 帧也能继续正确的解码和播放,其相对于 I 帧可以明显提升编码效率,节省带宽。该技术可以绕过丢失的帧,利用丢失帧之前的一个已经接收的长期参考帧作为参考进行编码 / 解码显示,从而提升弱网场景下的视频流畅性。

上图所示是引入 LTR 技术后的丢帧恢复策略,未发生弱网时仍然是正常的 I P P P 帧编码,只是会将其中的某些 P 帧标记为 LTR 帧(如图中的绿色 P 帧,以下称为 LTR 标记帧)。如果发生弱网中间的某个 P 帧(️ 标记)丢失,无法恢复,则接收端会请求发送端(编码器)利用 LTR 恢复,此时编码器会利用之前的已经确认收到的 LTR 标记帧做为参考编出一个 P 帧(图中红色 P 帧,以下被称为 LTR 恢复帧)。

由于之前的 LTR 标记帧已经被解码器确认收到,所以解码器参考帧 buffer 中必然存有此帧,所以利用此帧做参考的红色 P 帧必然可以被解码器正确解码。LTR 恢复帧由于是有参考的 P 帧,所以比 I 帧的编码效率显著提升。

根据上述 LTR 技术的特点和目的,可见 LTR 技术是一种网络模块和编码器共同配合完成的参考帧选择技术。实现 LTR 技术需要有接收端侧反馈信息,即编码器发出的 LTR 标记帧(图中的绿色 P 帧),如果被解码器成功收到,需要解码器

通知编码器其收到了这一帧,这样编码器在收到 LTR 恢复请求的时候,才可以 “放心的” 使用此帧做参考。

关于 LTR,前两篇文章中也有做部分介绍,感兴趣的读者可以参考:

1.《阿里云 RTC QoS 屏幕共享弱网优化之若干编码器相关优化》

2.《阿里云 RTC QoS 弱网对抗之变分辨率编码》

硬件解码支持 LTR

硬件解码的优势

硬件解码相对于软件解码而言,具有低功耗的天然优势,所以,在有条件使用硬件解码且不影响视频观看体验的情况下,应首选硬件解码。

获取码流中的 LTR 相关信息

对于软件解码器而言,开发者可以直接在解码器中实现接口以从码流中读取 LTR 相关信息,比如此帧是否为 LTR 标记帧,及其 frame number 等信息。如果此帧是 LTR 标记帧,则将其 frame number 反馈给编码器以表示其已收到此帧。

然而对于硬件解码器,其接口软件开发者是无法修改的,一般硬件解码器也没有接口可以读取 LTR 的相关信息。那怎样才能读取到 LTR 的相关信息呢?

本文使用的方法是,在硬件解码器之外的 RTC level 再进行一次码流解析,读取 LTR 相关信息,反馈给编码器。由于该信息都在码流的 high level syntax 中,如 slice header 等,所以额外解析该部分码流并没有太大开销。

某些硬解不支持 LTR 及解决思路

由于 LTR 的上述功能并不是 codec 中特别常用的功能,所以一些硬解厂商并没有将 LTR 功能实现的很好,在本文的实测过程中,就发现了一些问题。

上图中如果红框中的普通 P 帧没有被丢失的话,则 LTR 恢复帧即红色 P 帧都可以被本文所测试的硬件解码器正确解码。但是如果红框中的 P 帧丢失了,则有一部分硬件解码器无法正确解码出后面红色的 LTR 恢复帧。本文实测了一些手机,发现使用苹果,高通,三星芯片的手机可以正确的解码,然而使用华为(海思)、联发科某些芯片的手机则不能正确解码此时的 LTR 恢复帧,会返回解码错误或输出花屏。

由于实际发生弱网的时候,肯定会伴随着丢帧,即红框中的 P 帧肯定会有所丢失,所以若此时 LTR 恢复帧不可解码,则就等同于 LTR 技术对于这些硬解不可用了。这应该是某些硬件解码器自身实现的问题,即没有完全按照标准去实现所致。但是要如何规避这种问题呢?

进一步测试发现,解码错误的原因是由于中间红框里面的 P 帧丢失导致 frame number 不连续,如果将后面帧的 frame number 改为连续的,则仍然可以正确的解码!所以,本文的解法是:对于一帧码流,在送给某些硬件解码器之前,如果发现其 frame number 和之前的是不连续的,则直接改写码流将其改为连续的,再送给硬解,这样,就可以很好的规避某些硬解无法解码 LTR 恢复帧的问题,从而兼顾功耗和弱网视频体验。

「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。

阿里云 RTC QoS 弱网对抗之 LTR 及其硬件解码支持的更多相关文章

  1. 阿里云 RTC QoS 弱网对抗之变分辨率编码

    本文为 QoS 弱网优化系列的第二篇 作者|安基程.田伟峰 审校| 泰一 视频编码中的变分辨率问题及解决 变分辨率在弱网场景的实际应用中非常常见,网络状况不好的时候降低分辨率可以降低码率,减少块效应, ...

  2. 阿里云 RTC QoS 屏幕共享弱网优化之若干编码器相关优化

    屏幕共享是视频会议中使用频率最高的功能之一,但在实际场景中用户所处网络环境复杂,常遇到丢包或者拥塞的情况,所以如何优化弱网环境下的用户体验也成为了音视频通信中重要的一环.本文主要分享阿里云 RTC Q ...

  3. 网络QoS的平衡之道——音视频弱网对抗策略介绍

    作者:网易智企云信资深音视频引擎开发工程师 王兴鹤 随着AI和5G的到来,音视频应用将变得越来越广泛,人们对音视频的品质需求也越来越高,视频分辨率已经从高清发展为超高清.VR,视频帧率也已出现60fp ...

  4. 【阿里云服务器】外网无法访问tomcat下部署的项目

    问题提出:在ESC实例上部署了jdk和tomcat(略,上云了,上云了),启动tomct后,内网可以访问8080端口,外网无法访问8080. 系统环境:winsdow 2008 企业版 解决方案: 在 ...

  5. 阿里云apache服务器外网无法访问(配置安全组,添加80服务)

    CentOS的系统 ,已经安装好了 apache php mysql 常规排错过程(ps:没耐心的童鞋请直接看最后一步,学习在阿里云控制台配置 安全组,允许 http服务) 第一步:检查apache ...

  6. 阿里云HBase推出普惠性高可用服务,独家支持用户的自建、混合云环境集群

    HBase可以支持百TB数据规模.数百万QPS压力下的毫秒响应,适用于大数据背景下的风控和推荐等在线场景.阿里云HBase服务了多家金融.广告.媒体类业务中的风控和推荐,持续的在高可用.低延迟.低成本 ...

  7. 通过rinetd实现端口转发,同时访问阿里云RDS的内外网

    配置方法如下: 1 wget http://www.boutell.com/rinetd/http/rinetd.tar.gz&&tar -xvf rinetd.tar.gz& ...

  8. Navicat通过云主机内网连接阿里云RDS

    背景 公司为了安全起见,RDS设置只允许阿里云主机的内网端可以访问.这就意味,如果要操作RDS就需要连接到云主机上之后通过mysql shell操作.操作起来很复杂麻烦,今天看同事用Navicat f ...

  9. 阿里云内网和公网NTP服务器和其他互联网基础服务时间同步服务器

    阿里云为云服务器ECS提供了内网NTP服务器,对于阿里云以外的设备,阿里云同时提供了 公网NTP服务器,供互联网上的设备使用. 内网和公网NTP服务器 以下为阿里云提供的内网和公网NTP服务器列表. ...

随机推荐

  1. oracle ora-01114 IO error writing block to file 207 (block # )

    oracle ORA-01114 IO error writing block to file 207 (block # ) Reference: https://stackoverflow.com/ ...

  2. Same Origin Policy 浏览器同源策略详解

    同源策略 Same Origin Policy 日常开发中最常与网络打交道,那关于浏览器的同源策略和跨域相关的知识是该整理一下了. 首先需要明确的是,同源策略是浏览器的安全策略,由于存在这个策略,我们 ...

  3. openwrt编译加载龙尚U9300模组上网

    硬件平台:MT7628A openwrt版本:MTK_SDK 1.添加模组信息 /build_dir/target-mipsel_24kc_musl/linux-ramips_mt76x8/linux ...

  4. EFCodeFirst Migrations数据库迁移

    EFCodeFirst Migrations数据库迁移 数据库迁移 1.生成数据库 修改类文件PortalContext.cs的静态构造函数,取消当数据库模型发生改变时删除当前数据库重建新数据库的设置 ...

  5. 【转载】UML类图中箭头和线条的含义和用法

    文章转载自 http://blog.csdn.net/hewei0241/article/details/7674450 https://blog.csdn.net/iamherego/article ...

  6. 普通的一天,说一个普通的XML

    什么是XML XML全称是Extensible Markup Language,译为"可扩展标记语言",常用来存储和传输信息. XML的结构 我们经常看到的XML文件是这个样子的: ...

  7. windows10 缺失 msvcp140.dll 解决办法

    1.问题描述 我更新完windows10 驱动后,出现计算机缺失msvcp140.dll文件,虚机和QQ都无法启动 2.解决办法 查找大量文章,最终发现通过重新安装 Visual Studio 201 ...

  8. Vue 插槽之插槽内容学习总结

    插槽内容使用方法介绍 父组件中引用支持插槽内容的子组件,形如以下(假设子组件为NavigationLink.vue) <navigation-link url="/profile&qu ...

  9. malloc和free解析

    malloc和free都是库函数,调用系统函数sbrk()来分配内存.除了分配可使用的内存以外,还分配了"控制"信息,这有点像内存池常用的手段.并且,分配的内存是连续的. 1. m ...

  10. Eric Python IDE 论文数据图片生成

    Python编写,基于跨平台的Qt GUI工具包,集成了高度灵活的Scintilla编辑器控件. 大括号匹配,错误突出显示和可配置语法突出显示. 拼写检查库的集成 内置Python调试器,包括支持调试 ...