Opus 1.6 音频编解码器新增机器学习功能-Linuxeden开源社区

libopus 1.6 版本现已发布，作为开源 Opus 音频编解码器的库。Opus 1.6 带来了基于机器学习的”ML”新功能，是在 Opus 1.5 最初添加的机器学习功能基础上构建的。

Opus 1.6 的更改包括：

– 新增一种宽频带到全频带的带宽扩展（BWE）模块
– 支持 96 kHz 音频，使用 Opus HD
– 对深度冗余（DRED）的重大改进
– 新的 24 位编码器/解码器 API
– 固定点改进

语音带宽扩展”BWE”是 Opus 1.6 中的一个实验性功能，其基于一个经过训练的神经网络，用于生成宽带语音的高频语音内容。演示页面进一步解释：

“Opus 1.6 引入了一个实验性的宽频带到全频带语音增强器，该增强器在 WASPAA 2025 上展示。它是 Opus 语音编码增强算法家族的一部分，相关算法由 IETF 草案涵盖。新的带宽扩展（BWE）模型基于一个神经网络，该网络经过训练，可以从宽频带语音（0-8 kHz）中生成高频语音内容（8-20 kHz），而无需任何辅助信息。因此，它可以用于增强任何先前版本 Opus 的语音，并且随着模型在未来不断改进，不会破坏兼容性。从宽频带语音中生成高频频段内容是可能的，因为所有语音信息都已经包含在较低频段范围内。这与窄带（电话）到宽频带扩展的问题不同，后者很难实现且往往不可靠（这也是我们在此不尝试的原因）。”

该模型可以用于可选地将宽带语音解码为以 48 kHz 采样的全带语音，如下面所示。它还可以与 Opus 1.5 中引入的宽带增强方法结合使用。然而，它并不打算取代混合模式中编码的高频内容，也不会在超宽带或全带音频中激活。

96Hz 音频的实验性“Opus HD”支持也很有趣，值得特别指出。

Opus 1.6 音频编解码器新增机器学习功能

通过 Opus-Codec.org 获取下载和更多关于 Opus 1.6 发布的详细信息。

转自 Opus 1.6 Audio Codec Adds New Machine Learning Functionality – Phoronix

相关推荐