
FFmpeg 开发者以通过手动优化汇编代码实现显著性能提升而闻名,尤其在该开源多媒体库的各类功能中对 Intel/AMD AVX-512 指令集的优化成果突出。本周并入的更新大幅增强了 Bwdif 反交错视频滤镜的性能——当启用 AVX-512 时,其速度比基础 C 语言实现路径提升 23~28 倍。
Niklas Haas 为支持高级向量扩展 512(AVX-512)指令集的新款 Intel 和 AMD 处理器提交了 “vf_bwdif”(Bob Weaver 反交错视频滤镜) 的 AVX-512 实现。
相较于未优化的基础C语言版本,bwdif8_avx512 的速度提升达 23.28 倍,bwdif10_avx512 则达到 28.27 倍;而相比现有的 AVX-2 实现,其性能也提升近 两倍。
该优化适用于支持 AVX-512 指令集的 Intel/AMD 处理器,但设置了限制条件以避免在 Skylake 处理器上使用——该系列处理器因实现 AVX-512 时存在严重过热/功耗问题导致 CPU 降频而饱受诟病。
新的 AVX-512 实现在几周后 FFmpeg 8.0 发布之前合并。
Linuxeden开源社区