‌FFmpeg 8.0 集成 OpenAI Whisper 过滤器用于自动语音识别‌-Linuxeden开源社区

即将发布的 FFmpeg 8.0 多媒体库版本几乎每天都在变得更加令人兴奋。这个下一个版本中即将加入的新功能是 Whisper 音频过滤器，用于利用 OpenAI 的 Whisper 模型提供自动语音识别/转录功能。

对于不了解的人，Whisper 是一个经过大量数据集训练的自动语音识别模型，并且已经被证明非常强大。当系统中存在 Whisper.cpp 库时，FFmpeg 8.0 可以通过使用 “–enable-whisper” 库来构建以支持 OpenAI Whisper 模型。可以使用可选的 GPU 加速和各种可调参数，然后使用 FFmpeg 进行自动转录并将文本输出到 SRT 文件中，或将输出以 JSON 格式发送到 HTTP Web 服务，以及其他功能。

‌FFmpeg 8.0 集成 OpenAI Whisper 过滤器用于自动语音识别‌

那些对本周末合并到 FFmpeg 中的这个 OpenAI Whisper 音频滤镜支持感兴趣的用户，可以在这个 Git 提交中找到。

FFmpeg 8.0 应该在几周内发布，并且还将包含一系列 Vulkan 加速增强、新的 CPU 性能优化以及这个广泛使用的开源多媒体库的其他多种改进。

转自 FFmpeg 8.0 Merges OpenAI Whisper Filter For Automatic Speech Recognition – Phoronix

相关推荐