从 ffmpeg 通过 Janus 流式传输的 H264 WebRTC 视频在播放时非常不稳定

Ale*_*kov 9 video-streaming h.264 webrtc janus-gateway

尝试通过以下链流式传输视频:本地实例存储 (AWS) 上的 h264/mp​​4 文件->ffmpeg->rtp->同一实例上的 Janus->WebRTC 播放 (Chrome/mac)。即使没有任何资源似乎超载(所涉及的任何系统上的 CPU/内存/网络带宽),生成的视频也是断断续续的。我也使用 Coturn TURN 服务器,它也根本没有加载并且带宽充足。

尝试切换编解码器,除了 vp8 没有帮助,虽然它可以工作(有点 - 波动仍然存在,但非常罕见和可接受),导致如此高的 CPU 消耗,实际上这是不可接受的。

ffmpeg -re -stream_loop -1 -i ./short.mp4 -s 426x240 -c:v libx264 -profile:v baseline -b:v 1M -r 24 -g 60 -an -f rtp rtp://127.0.0.1:5004

结果 SDP 是:

o=- 0 0 IN IP4 127.0.0.1
s=No Name
c=IN IP4 127.0.0.1
t=0 0
a=tool:libavformat 58.20.100
m=video 5004 RTP/AVP 96
b=AS:1000
a=rtpmap:96 H264/90000
a=fmtp:96 packetization-mode=1
Run Code Online (Sandbox Code Playgroud)

流使用 Janus API 设置为

            "janus" : "message",
            "transaction" : 'Transaction',
        "body": {
                "request" : "create",
                "type" : "rtp",
                "id" : newId,
                "name": streamId+newId,
                "audio": false,
                "video": true,
                "description" : streamId+newId,
                "videoport" : 5000+newId*4,
                "videopt" : 96,
                "videortpmap": "H264/90000",
                "secret" : "adminpwd"
            }
        }
Run Code Online (Sandbox Code Playgroud)

尝试了 bw 的各种选项,根本没有帮助。将 -g(GOP 大小)更改为较低的值可以使波动的持续时间更短但更频繁。在 -g 3 或 4 时,它是可以接受的,但可预见的质量的比特率变得疯狂。

预期结果:视频播放没有断断续续。

我的理论是它可能是以下之一:

  • 要么 ffmpeg 以缓冲区太小的方式提供数据,所以有时 Janus 需要在它尚未准备好时发送下一个数据包,使缓冲区耗尽并导致中断 - 所以也许有一种方法可以使 ffmpeg 编码成某种短(半秒左右?缓冲调节流量)。如何?

  • 或者 H264 在 UDP 上的效果太差了,我无能为力。然后我必须切换到 TCP,但到目前为止尝试这样做一直没有成功。

Ale*_*kov 9

事实证明,该解决方案是显而易见的。ffmpeg 将流作为 RTP 发送给 Janus,Janus 将其进一步发送给观众,显然,作为 SRTP,因为这是 WebRTC,并且它始终是加密的。其中向每个数据包添加了一堆字节作为加密开销。在某些情况下,这意味着数据包通过 MTU 并被丢弃 - 每次发生时,视频中都会出现明显的抖动。

简单添加 ?pkt_size=1300 以输出 ffmpeg 的 RTP URL 消除了该问题。

感谢 Meetecho 的 Lorenzo Miniero 解决了这个问题。


use*_*208 5

ffmpeg 针对以块的形式输出帧进行了优化,而不是针对输出单独的编码帧进行了优化。复用器(在您的例子中是 rtp 复用器)通常会在刷新到输出之前缓冲数据。因此 ffmpeg 并未针对需要或多或少逐帧输出的实时流进行优化。然而,WebRTC 确实需要实时到达的帧,因此如果成批发送帧,它可能会丢弃“迟到”的帧,从而导致不稳定。

然而,ffmpeg 中有一个选项,可以将 muxer 的缓冲区大小设置为 0,效果很好。这是:

-最大延迟0

另外,对于 WebRTC,您希望禁用 b 帧并将 SPS-PPS 附加到每个关键帧:

-bf 0 +global_header -bsf:v "dump_extra=freq=关键帧"