皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

Opus 1.6 音频编解码器新增机器学习功能

libopus 1.6 版本现已发布,作为开源 Opus 音频编解码器的库。Opus 1.6 带来了基于机器学习的”ML”新功能,是在 Opus 1.5 最初添加的机器学习功能基础上构建的。

Opus 1.6 的更改包括:

– 新增一种宽频带到全频带的带宽扩展(BWE)模块
– 支持 96 kHz 音频,使用 Opus HD
– 对深度冗余(DRED)的重大改进
– 新的 24 位编码器/解码器 API
– 固定点改进

语音带宽扩展”BWE”是 Opus 1.6 中的一个实验性功能,其基于一个经过训练的神经网络,用于生成宽带语音的高频语音内容。演示页面进一步解释:

“Opus 1.6 引入了一个实验性的宽频带到全频带语音增强器,该增强器在 WASPAA 2025 上展示。它是 Opus 语音编码增强算法家族的一部分,相关算法由 IETF 草案涵盖。新的带宽扩展(BWE)模型基于一个神经网络,该网络经过训练,可以从宽频带语音(0-8 kHz)中生成高频语音内容(8-20 kHz),而无需任何辅助信息。因此,它可以用于增强任何先前版本 Opus 的语音,并且随着模型在未来不断改进,不会破坏兼容性。从宽频带语音中生成高频频段内容是可能的,因为所有语音信息都已经包含在较低频段范围内。这与窄带(电话)到宽频带扩展的问题不同,后者很难实现且往往不可靠(这也是我们在此不尝试的原因)。”

该模型可以用于可选地将宽带语音解码为以 48 kHz 采样的全带语音,如下面所示。它还可以与 Opus 1.5 中引入的宽带增强方法结合使用。然而,它并不打算取代混合模式中编码的高频内容,也不会在超宽带或全带音频中激活。

96Hz 音频的实验性“Opus HD”支持也很有趣,值得特别指出。

Opus 1.6 音频编解码器新增机器学习功能

通过 Opus-Codec.org 获取下载和更多关于 Opus 1.6 发布的详细信息。

转自 Opus 1.6 Audio Codec Adds New Machine Learning Functionality – Phoronix