webrtc笔记(2): 1对1实时视频/语音通讯原理概述

开始正文之前，先思考1个问题：2个处于不同网络环境的(具备摄像头/麦克风多媒体设备的)浏览器，要实现点对点的实时视频/语音通讯，难点在哪？

至少得先搞定下面2个问题：

1、彼此要了解对方支持的媒体格式、支持的最大分辨率等媒体信息

比如：peerA端可支持MPEG-1/2、H264多种编码格式，而peerB端支持MPEG-4、H264，要保证二端都正确的编解码，最简单的办法就是取它们的交集H264

就象2个不同国家的人交流，1个只会讲英文、中文，另1个只会讲德语、英文，他俩肯定要能相互正常沟通，肯定会用双方都懂的英文来交流一样。

注：有一个专门的协议，称为Session Description Protocol (SDP)，可用于描述上述这类信息，在webrtc中，参与视频通讯的双方必须先交换SDP信息，这样双方才能知根知底，而交换SDP的过程，也称为"媒体协商"。

2、彼此要了解对方的网络情况，这样才有可能找到一条相互通讯的链路

类似的道理，在复杂的网络环境中，要建立二个端的连接，得有一条双方都能访问的链路。

如上图，peerA端具体有公网ip以及网段的内网环境，而peerB没有公网，只有、198二个内网地址，从图中可知，它俩可以使用公用的192网段来通讯。webrtc通讯过程中，这些网络相关的信息，也得相互交换，找出共同的交集，这个过程也称为“网络协商”。

顺着这个思路再琢磨一下，刚开始前，这2个端还没建立连接，既然连都没连上，又如何交换“媒体信息”、“网络信息”?

这时候就该所谓的信令服务器signal server出场了：

如上图，2个浏览器端的上层，可以抽象出一层信令服务器（可以是1台或多台，看实际应用的情况，如果2端的浏览器都能访问某个公共的网络环境，比如公网，可以让它们都连到这台公用的信令服务器上；如果没有公共的网络环境，可以在2端各搭一组服务器，即signal serverA、signal serverB，但是这二组信令服务器之间要能互通），借助信令服务器，就可以实现上面提到的SDP信息及网络信息交换。

交换SDP的过程，大致如上图：

1、Amy(1个假想的人名)，把自身的SDP信息，通过setLocalDescription方法保存起来，然后通过offer方法，发给信令服务器。

2、信息服务器把Amy的SDP向前传递到另1端的Bob(另1个假想的人名)，Bob会先调用setRemoteDescripition把Amy的SDP保存下来。

3、然后Bob调用setLocalDescription方法保存自己的SDP，然后再通过answer方法，把自己的SDP通过信令服务器发给Amy

4、Amy收到Bob的SDP后，调用setRemoteDescription保存起来，这样双方就完成了SDP交换，然后找出其中的交集，如果能达成一致，就可以建立p2p连接，开始通讯了。

但是现实往往是残酷的，在中国的网络环境中，据一些统计数据显示，至少1半的网络是无法直接穿透打通的(我个人认为根本原因是：IP4地址资源在互联网发展早期绝大多数都被国外占用了，轮到中国这些发展中国家使用时IP地址严重不足，所以大多数电脑都不具备公网ip，只能通过路由器、交换机做NAT转换，而相当一部分NAT是对称型的，基本上没法空透），这种情况下只能借助上一节讲到的turn服务器中转。

另外，在视频对话框中，通常会有房间(或群）的概念，用于做一些业务上的隔离，这部分逻辑也是在signal server中实现的，综合考虑peer端、信令服务器、stun/turn服务器后，整个1对1实时视频通讯的时序图如下：

主要过程如下：

1、双方先调用getUserMedia打开本机摄像头

2、向信令服务器发送加入房间apply_join请求

3、信令服务器通知本人加入成功(joined)，同时向其它人广播加入消息(other_joined)

4、二端开始创建peerConnection连接

5、peerB端创建offer，同时将SDP保存到本机(setLocalDescription)，并通过信令服务器传递到peerA

6、peerB在setLocalDescription后，会异步触发“候选网络链路”收集，大致是通过Stun确定自己所有的NAT映射出口，如果Stun返回NAT是“对称型”的，基本上就没法穿透了，会再通过Turn拿到中继reply地址，并通过信令服务器，将网络候选链路信息发到peerA(即：开始网络协商）

7、peerA收到的peerB的SDP后，开始回应(createAnswer)，仍然通过信令服务器，将SDP发送到peerB

8、同时peerA也会开始网络候选链路的收集，并将自己的网络信息，通过信令服务器，发到peerB(即：网络协商)

这样peerA，peerB就相互交换了媒体信息及网络信息，如果能达到一致(即：找到交集)，就可以开始通讯了

基于以上原理，做了一个demo示例程序，见：https://github.com/yjmyzz/webrtc-samples

参考资料：

https://rtcdeveloper.com/t/topic/13742

https://www.html5rocks.com/en/tutorials/webrtc/basics/

https://hpbn.co/webrtc/#standards-and-development-of-webrtc

https://blog.csdn.net/momo0853/article/details/85157775

https://developer.mozilla.org/en-US/docs/Web/API/WebRTC_API/Connectivity

https://developer.mozilla.org/en-US/docs/Web/API/RTCPeerConnection/setLocalDescription

https://www.cnblogs.com/lingyunhu/category/626157.html

webrtc笔记(2): 1对1实时视频/语音通讯原理概述的更多相关文章

webrtc笔记(3): 多人视频通讯常用架构Mesh/MCU/SFU
问题:为什么要搞这么多架构? webrtc虽然是一项主要使用p2p的实时通讯技术,本应该是无中心化节点的,但是在一些大型多人通讯场景,如果都使用端对端直连,端上会遇到很带宽和性能的问题,所以就有了下图 ...
并发编程学习笔记(6)----公平锁和ReentrantReadWriteLock使用及原理
(一)公平锁 1.什么是公平锁? 公平锁指的是在某个线程释放锁之后,等待的线程获取锁的策略是以请求获取锁的时间为标准的,即使先请求获取锁的线程先拿到锁. 2.在java中的实现? 在java的并发包中 ...
【React Native】集成声网Agora语音通讯
前言: 公司的产品是一款基于社交的内容聊天软件,需要集成语音通讯功能,在写iOS原生项目时,用到的就是Agora SDK,现在写React Native也直接采用了Agora的库. 集成iOS.And ...
【第1篇】人工智能（AI）语音测试原理和实践---宣传
前言本文主要介绍作者关于人工智能(AI)语音测试的各方面知识点和实战技术. 本书共分为9章,第1.2章详细介绍人工智能(AI)语音测试各种知识点和人工智能(AI)语音交互原理:第3.4章介绍人工智 ...
webrtc笔记(1): 基于coturn项目的stun/turn服务器搭建
webrtc是google推出的基于浏览器的实时语音-视频通讯架构.其典型的应用场景为:浏览器之间端到端(p2p)实时视频对话,但由于网络环境的复杂性(比如:路由器/交换机/防火墙等),浏览器与浏览器 ...
WebRTC笔记（一）
来源<WebRTC权威指南> 1 WebRTC特点对等连接(Peer Connection):浏览器与浏览器(万维网上的任意两个通信终端)之间的连接(P2P) 信令服务器:在浏览器和对等 ...
webrtc笔记(4): kurento 部署
kurento是一个开源的webrtc mcu服务器,按官方的文档,建议在ubtntu上安装,过程如下: 注:建议先切换到root身份,如果不是root身份登录的,下列命令,请自行加上sudo . 另 ...
webrtc笔记(5): 基于kurento media server的多人视频聊天示例
这是kurento tutorial中的一个例子(groupCall),用于多人音视频通话,效果如下: 登录界面: 聊天界面: 运行方法: 1.本地用docker把kurento server跑起来 ...
Android IOS WebRTC 音视频开发总结（十三）-- ice原理
以前在做一个视频监控项目的时候,刚开始客户没提到要支持P2P,因为服务端是我们自己写的,为了便于处理一些逻辑,全部采用转发的方式,后来客户要求支持P2P,没办法了,后来自己部署了一个STUN服务器(不 ...

随机推荐

spring cloud 2.x版本 Gateway自定义过滤器教程
前言本文采用Spring cloud本文为2.1.8RELEASE,version=Greenwich.SR3 本文基于前两篇文章eureka-server.eureka-client.eureka ...
大话设计模式Python实现-命令模式
命令模式(Command Pattern):将请求封装成对象,从而使可用不同的请求对客户进行参数化:对请求排队或记录请求日志,以及支持可撤消的操作. 下面是一个命令模式的demo: #!/usr/bi ...
video调用直播接口：防止缓存方案
有时候我们需要调用解析过直播接口,使用video播放,但是在暂停又开始后,直播视频不会自动刷新,而是继续从暂停之前的时间点开始播放. 下面是我的解决方案代码,弟弟们请看我的下面: <!DOCTY ...
百度开源的分布式唯一ID生成器UidGenerator，解决了时钟回拨问题
UidGenerator是百度开源的Java语言实现,基于Snowflake算法的唯一ID生成器.而且,它非常适合虚拟环境,比如:Docker.另外,它通过消费未来时间克服了雪花算法的并发限制.Uid ...
利用内存锁定技术防止CE修改
利用内存锁定技术防止CE修改通过这种在R3环利用的技术,我们可以来达到保护内存的目的,像VirtualProtect等函数来修改页属性根本无法修改. 而CE修改器推测应该使用VirtualProte ...
Django之Django快速体验
Django快速体验前语: 这一节内容是直接快速上手,后面的内容是对内容进行按步解释,如果不想看解析的,可以直接只看这一节的内容. 1.新建项目应用新建项目test1新建应用booktest 2.注 ...
python库的tkinter带你进入GUI世界(计算器简单功能)
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 一个处女座的程序猿 PS:如有需要Python学习资料的小伙伴可以加 ...
Netty与RPC
一.Netty原理 Netty是一个高性能.异步事件驱动的NIO框架,基于Java NIO提供的API实现.它提供了对TCP.UDP和文件传输的支持,作为一个异步NIO框架,Netty的所有IO操作都 ...
linux下编译安装MariaDB 10.4.7，解决错误：cannot access ‘/auth_pam_tool_dir’: No such file or directory
编译安装MariaDB 10.4.7,前面的步骤我就不复述了,一切正常没什么问题. 当执行到:scripts/mysql_install_db --basedir=/usr/local/mysql - ...
js监听屏幕方向如何第一次默认不监听
this.supportOrientation = typeof window.orientation === 'number'; // 检查屏幕方向 checkScreenOrientation() ...

webrtc笔记(2): 1对1实时视频/语音通讯原理概述

webrtc笔记(2): 1对1实时视频/语音通讯原理概述的更多相关文章

随机推荐

热门专题