-b:v 5000k-maxrate 10000k-bufsize 10000k-b:v 5000k-maxrate 7500k-bufsize 7500k-b:v 5000k-maxrate 5500k-bufsize 5500k
图2用200%受限VBR编码的测试文件
图2显示了用200%受限VBR编码的测试文件的码率配置。在交替的慢动作短距离语音视频和高速芭蕾之间,数据波动明显。即使平均比特率与CBR相似(分别为5041kbps和4938kbps),最大比特率也有显著提高(分别为11137kbps和6013kbps)。50%受限VBR视频具有相似的平均比特率(5036kbps)和20%降低的峰值比特率(9090kbps)。
从传输速率的角度来看,VBR显然更具挑战性,但这只会发生在受限连接接近视频流比特率的情况下。如果你正在以50 mbps或更高的网速向美国、欧洲和斯堪的纳维亚半岛的观众传输5000kbps和1080p的视频,你可能不会有任何传输问题。但是,如果8K视频以40mbps的速度传输给同一地区的观众,那么使用200%受限VBR就有点吓人了。当然,如果是3G连接上500kbps 200%受限VBR,那么用CBR(或者110%受限VBR)听起来要好得多。
所有这些对质量有什么影响?
表1显示了现实世界足球视频剪辑中使用的四种模式的得分。平均比特率非常相似,峰值比特率明显不同。整体VMAF评分非常接近。CBR和最高VBR之间的差异小于0.7。
表1速率控制技术的质量影响
最大的区别在于低帧分数(审稿人注:VMAF分数是基于帧粒度的最低单帧VMAF分数),这是瞬态质量问题的指标,其中CBR比200%受限VBR低5.5分左右。意味着有些观众可能会注意到瞬间出现的问题。有趣的是,200%限制的VBR和150%限制的VBR的低框VMAF只有一分之差,150%限制的VBR和110%限制的VBR只有两分之差。
为了进一步探索,我在莫斯科州立大学的视频质量测量工具中比较了CBR和200%受限VBR文件(图3)。
上图显示了整个视频文件播放期间,CBR和200%受限VBR文件的VMAF评分,其中CBR为红色,200%受限VBR为绿色。
下图是上图中高亮区域的放大图(大概2100帧到3400帧)。以红色钟乳石为代表的画面CBR质量明显低于VBR。
图3用200%受限VBR编码的测试文件
在图中,您可以看到右下角的“显示帧”按钮。在这个视频中,使用了相当保守的编码参数,CBR帧和VBR帧的差别几乎可以忽略不计,因为最明显的差别只有1~2帧。
在其他视频剪辑中,如果使用较低的码率,瞬变问题会更加明显。因此,大多数VOD制造商选择使用VBR(而不是CBR)来避免这些问题,尤其是在向高带宽观众分发1080p视频时。
有意思的是,苹果支持200%受限VBR in _ HLS授权规范_,解释如下:“1.30。对于VOD内容,峰值比特率不得超过平均比特率的200%。”但200%受限VBR是否适合高帧率的8K内容(可能需要40mbps才能达到可接受的质量)还有待观察。
现在总结一下,CBR在成本和可移植性上胜出,VBR在整体质量上扳回一局。然而,由CBR引起的短暂质量问题的风险是真实的。
CRF:恒定码率系数
在使用CBR和VBR时,您需要选择一个目标比特率,编码器将调整视频质量来实现这一目标。这种方法的问题是,如果对所有视频剪辑使用相同的码率阶梯,会在易于编码的视频(如短程语音视频)上浪费大量不必要的带宽。
图4示出了使用200%受限VBR编码的近距离角色的语音视频,并且目标比特率是5mbps(与足球视频相同)。平均比特率和峰值比特率与上述足球视频一致,但VMAF得分为97.61。
研究表明,一旦VMAF值超过93,观众就无法感知。这也是我建议厂商把VMAF目标值设为95作为上限的原因。如下图所示,有了这个视频,你至少可以降低60%的码率,但仍然可以达到VMAF 95的目标。
图4中VBR编码的问题是,即使视频的数据速率和质量水平太高,它也会达到目标比特率。
因此,当使用CBR和VBR编码时,编码器将调整所需的视频质量以达到目标比特率。相比之下,使用CRF(恒定速率因子编码),您选择一个目标质量,编码器将通过调整码率来达到该质量水平。CRF值从0到51分布,值越低,质量越高。使用CRF和FFmpeg的编码如下:
ffmpeg -i输入文件-crf 23输出文件
CRF适用于归档或生成需要上传和转码的夹层文件。但是,从可传输性的角度来看,它并不是最理想的方法:因为在对文件进行编码之前,你并不知道将会产生的数据速率。