京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 5739|回复: 0

视频会议传输延时应该如何“低”?

[复制链接]

16

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-5-25 18:23:48 | 显示全部楼层 |阅读模式 来自 中国
万物互联的时代,音视频实时通讯的应用场景已随处可见,从“吃鸡”的语音对讲、直播连麦,到企业日常远程视频会议、与合作伙伴的远程会商,再到医院的远程会诊、智能银行VTM的远程视频开户等。对于解决方案服务商来讲,除了关注如何能快速实现不同应用场景的音视频通讯,另一个更需要关注的可能就是“低延时”。但是,到底实时音视频传输延时应该如何“低”,才能满足你的应用场景呢?小南将看到的专家剖析截取部分分享给大家。, L, T* T7 q; X3 y  I& K
在音视频传输过程中,在不同阶段都会产生延时。总体可以分为三类:
8 N7 P- J5 \5 R; m/ `+ L9 d' a6 O: ^
' k/ H; Y1 T0 \) ]

4 X9 U' a0 M* F3 C6 g4 P- x& F
8 J% L" E0 q3 d6 x3 A9 vT1:设备端上的延时
9 E" U, }/ `1 j9 a! S4 ~音视频数据在设备端上产生延时还可以细分。设备端上的延时主要与硬件性能、采用的编解码算法、音视频数据量相关,设备端上的延时可达到 30~200ms,甚至更高。如上表所示,音频与视频分别在采集端或播放端产生延时的过程基本相同,但产生延时的原因不同。- U! t0 T8 v* M4 x
——音频在设备端上的延时:. V" l0 X3 e' w& T
音频采集延时:采集后的音频首先会经过声卡进行信号转换,声卡本身会产生延时,比如 M-Audio 声卡设备延迟 1ms,艾肯声卡设备延迟约为 37ms;
& Y$ S5 q# b1 p- r' @( ]. P编解码延时:随后音频进入前处理、编码的阶段,如果采用 OPUS 标准编码,最低算法延时大约需要 2.5~60ms;6 f  L* b+ Q3 v, h
音频播放延时:这部分延时与播放端硬件性能相关。: S1 Z+ H% y, ^3 h9 v
音频处理延时:前后处理,包括 AEC,ANS,AGC 等前后处理算法都会带来算法延时,通常这里的延时就是滤波器阶数。在 10ms 以内。) h% p. p3 i0 w' a, B* T( @
端网络延时:这部分延时主要出现在解码之前的 jitter buffer 内,如果在抗丢包处理中,增加了重传算法和前向纠错算法,这里的延时一般在 20ms 到 200ms 左右。但是受到 jitter buffer 影响,可能会更高。0 S2 v- N8 U1 P/ _1 p2 d
——视频在设备端上的延时:
% N7 a6 S+ S3 T0 U采集延时:采集时会遇到成像延迟,主要由 CCD 相关硬件产生,市面上较好的 CCD 一秒可达 50 帧,成像延时约为 20ms,如果是一秒 20~25 帧的 CCD,会产生 40~50ms 的延时;
5 A5 H, ~) E3 D0 k编解码延时:以 H.264 为例,它包含 I、P、B 三种帧(下文会详细分析),如果是每秒 30 帧相连帧,且不包括 B 帧(由于 B 帧的解码依赖前后视频帧会增加延迟),采集的一帧数据可能直接进入编码器,没有 B 帧时,编码的帧延时可以忽略不计,但如果有 B 帧,会带来算法延时。
% z6 [$ I0 ]; U' O视频渲染延时:一般情况下渲染延时非常小,但是它也会受到系统性能、音画同步的影响而增大。( e& i* K! r9 Y# Z5 S
端网络延时:与音频一样,视频也会遇到端网络延时。
6 d" D2 V! o  }1 x; s% s另外,在设备端,CPU、缓存通常会同时处理来自多个应用、外接设备的请求,如果某个问题设备的请求占用了 CPU,会导致音视频的处理请求出现延时。以音频为例,当出现该状况时,CPU 可能无法及时填充音频缓冲区,音频会出现卡顿。所以设备整体的性能,也会影响音视频采集、编解码与播放的延时。
) c; {! E* C' rT2:端与服务器间的延时
0 ~6 S/ J% r% W) v9 {1 V+ l$ d( A影响采集端与服务器、服务器与播放端的延时的有以下主几个因素:客户端同服务间的物理距离、客户端和服务器的网络运营商、终端网络的网速、负载和网络类型等。如果服务器就近部署在服务区域、服务器与客户端的网络运营商一致时,影响上下行网络延时的主要因素就是终端网络的负载和网络类型。一般来说,无线网络环境下的传输延时波动较大,传输延时通常在 10~100ms 不定。而有线宽带网络下,同城的传输延时能较稳定的低至 5ms~10ms。但是在国内有很多中小运营商,以及一些交叉的网络环境、跨国传输,那么延时会更高。
, E$ n- F& |. p6 ~0 S7 F4 cT3:服务器间的延时
- {6 _% X$ E) L! j在此我们要要考虑两种情况,第一种,两端都连接着同一个边缘节点,那么作为最优路径,数据直接通过边缘节点进行转发至播放端;第二种,采集端与播放端并不在同一个边缘节点覆盖范围内,那么数据会经由“靠近”采集端的边缘节点传输至主干网络,然后再发送至“靠近”播放端的边缘节点,但这时服务器之间的传输、排队还会产生延时。仅以骨干网络来讲,数据传输从黑龙江到广州大约需要 30ms,从上海到洛杉矶大约需要 110ms~130ms。5 r6 u  H* V" G/ j# x
在实际情况下,我们为了解决网络不佳、网络抖动,会在采集设备端、服务器、播放端增设缓冲策略。一旦触发缓冲策略就会产生延时。如果卡顿情况多,延时会慢慢积累。要解决卡顿、积累延时,就需要优化整个网络状况。9 n3 c5 A, p. C0 O3 p* E* v
综上所述,由于音视频在采集与播放端上的延时取决于硬件性能、编解码内核的优化,不同设备,表现不同。所以通常市面上常见的“端到端延时”指的是 T2+T3。
9 A* v- H$ [" s; O' c延时低≠通话质量可靠" L  D1 q. B% u4 E' @1 j
不论是教育、社交、金融,还是其它场景下,大家在开发产品时可能会认为“低延时”一定就是最好的选择。但有时,这种“追求极致”也是陷入误区的表现,低延时不一定意味着通讯质量可靠。由于音频与视频本质上的差异,我们需要分别来讲实时音频、视频的通讯质量与延时之间的关系。$ |" M6 D8 A2 H4 o
——音频质量与延时1 X) ?* u  s+ Y' _
1 C+ N5 ^* M, v

9 ~0 e' Q0 m/ o3 J$ z5 _( f: X! w" {( U6 ?: L$ ?2 I) I9 P
音频采样示意图
# g0 s" c7 ?! ?# o. w8 [影响实时音频通讯质量的因素包括:音频采样率、码率、延时。音频信息其实就是一段以时间为横轴的正弦波,它是一段连续的信号(如上图)。
5 X" q4 [( r6 T码率:它描述了单位时间长度的媒体内容需要空间。码率越高,意味着每个采样的信息量就越大,对这个采样的描述就越精确,音质越好。$ l7 ?" K8 P$ T* L
假设网络状态稳定不变,那么采样率越高、码率越高,音质就越好,但是相应单个采样信息量就越大,那么传输时间可能会相对更长。' |2 h& v, o  e$ t% |: i
对照我们之前的公式,如果想要达到低延时,那么可以提高网络传输效率,比如提高带宽、网络速度,这在实验室环境下可以轻易实现。但放到生活环境中,弱网、中小运营商等不可控的问题必定会影响网络传输效率,最后结果就是通讯质量没有保障。还有一种方法,就是降低码率,那么会损失音质。
# \' w. B& h$ c9 x- x6 j——视频质量与延时
9 M/ `) Y$ Y8 v( a/ M0 A3 L影响实时视频质量的因素包括:码率、帧率、分辨率、延时。其中视频的码率与音频码率相似,是指单位时间传输的数据位数。码率越大,画面细节信息越丰富,视频文件体积越大。. f# l3 F  `  e8 ^4 T1 R) ^
, M# W/ U0 w0 ~3 P. E' ]" s& J8 }2 m
" K% D6 a0 F; F7 d  l; ]2 A' g
& G3 C7 V9 C( k" K6 H0 K( H  q1 s
帧:正如大家所知,视频由一帧帧图像组成,如上图所示为 H.264 标准下的视频帧。它以 I 帧、P 帧、B 帧组成的 GOP 分组来表示图像画面(如下图):I 帧是关键帧,带有图像全部信息;P 帧是预测编码帧,表示与当前与前一帧(I 或 P 帧)之间的差别;B 帧是双向预测编码帧,记录本帧与前后帧的差别。
) i6 p1 x) m/ a4 H& Q$ R帧率:它是指每秒钟刷新的图像帧数。它直接影响视频的流畅度,帧率越大,视频越流畅。由于人类眼睛与大脑处理图像信息非常快,当帧率高于 24fps 时,画面看起来是连贯的,但这只是一个起步值。在游戏场景下,帧率小于 30fps 就会让人感到画面不流畅,当提升到 60fps 时会带来更实时的交互感,但超过 75fps 后一般很难让人感到有什么区别了。& L- r; m: ?% i+ e2 j
分辨率:是指单位英寸中所包含的像素点数,直接影响图像的清晰度。如果将一张 640 x 480 与 1024 x 768 的视频在同一设备上全屏播放,你会感到清晰度明显不同。+ ?- s! z, H$ f( J. E( [. }4 ?0 B
在分辨率一定的情况下,码率与清晰度成正比关系,码率越高,图像越清晰;码率越低,图像越不清晰。
- g; f+ p( ]9 x7 O% J' M在实时视频通话情况下,会出现多种质量问题,比如:与编解码相关的画面糊、不清晰、画面跳跃等现象,因网络传输问题带来的延时、卡顿等。所以解决了低延时,只是解决了实时音频通讯的一小部分问题而已。" O' C: t6 Z5 k" X# U4 Q6 r/ T
综上来看,如果在网络传输稳定的情况下,想获得越低的延时,就需要在流畅度、视频清晰度、音频质量等方面进行权衡。  n5 h0 y( |7 [) Z, [4 @! e; Y/ S2 E

  ]- r" W. l/ Z5 \  Z2 r- M: [
+ u/ Y+ `9 t9 W$ G$ Z, l
8 {4 i! p+ ]# L7 p# O  }: Y* i来源:http://mp.weixin.qq.com/s?src=11&timestamp=1558778404&ver=1628&signature=rcNx1By1kwoTdFu2BVJ-F2NXmoBaZS4mAcYEbkxsc1hQBIzgL0Gm0uKPCJk96Nix*C2*bNnsK*KuDMKpETPY078ikxZGC2wwocvSqFr5bKr1pqvXQXH3Bnd1vHXEKNSa&new=1! ^) g& ~& M% L# |/ N3 O. L
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-4-20 21:22 , Processed in 0.080128 second(s), 27 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表