RTP 中用于 AMR 和 G729 等编解码器的语音样本的标记位

Nit*_*inG 1 rtp

我想知道语音数据包 RTP 中标记位的重要性,这里是否有任何 RFC 可以说明这一点。

我知道视频数据包标记位意味着同一图像的最后一个数据包,因此,它是具有与图像相对应的 PTS 时间戳的最后一个数据包,但对于编解码器的语音数据包来说,例如 AMR-NB 或 G711 alaw 或 G729,每个 RTP 数据包中的标记位通常为假。

那么,在这种情况下的RTP数据包中,标记位的含义是否发生变化?

问候尼丁

Man*_*mar 5

在音频编解码器中,如果您要分析任何编解码器的wireshark跟踪。假设 AMR,您将得到以下观察结果

对于语音数据包,标记位指示谈话尖峰的开始。谈话的开始是调整接收器播放延迟的好机会,以补偿发送器和接收器时钟速率之间的差异以及网络延迟抖动的变化。突然讲话期间的数据包需要连续播放,而听众通常对暂停持续时间的细微变化不敏感。标记位是一个提示;假设时间戳时钟速率已知,也可以通过比较两个数据包之间的时间戳和序列号的差异来计算谈话尖峰的开始。

数据包可能会乱序到达,因此带有标记位的数据包是在通话突发中的第二个数据包之后接收到的。只要播放延迟比此重新排序长,接收器仍然可以执行延迟自适应。如果没有,那就只能等待下一次的谈话了。

资料来源:http ://www.cs.columbia.edu/~hgs/rtp/faq.html#marker

同样的事情也可以在这里读到。 http://msdn.microsoft.com/en-us/library/dd944715(v=office.12).aspx