对于寻找快速 Basic Linear Algebra Subprograms “BLAS” 库的用户,OpenBLAS 0.3.31 现在可用的这个优化开源实现。
OpenBLAS 0.3.31 带来了 BFloat16 扩展用于 BGEMM 和 BGEMV,其他新的 BLAS 扩展,不同内核的多线程问题大小阈值,改进的 Fortran 编译器自动检测,以及针对从 Windows 到 FreeBSD 的不同平台的 CMake 构建系统修复。
OpenBLAS 0.3.31 和他们的大多数发布一样,也包含了一系列针对特定 CPU 的性能优化。OpenBLAS 中针对 ZVL128B 和 ZVL256B 目标有多种新的 RISC-V 性能优化,以及更好的 RISC-V RVV 1.0 检测。ARM64 也看到了许多多线程性能改进和其他新的性能优化。现在还可以在 Linux 上自动检测 Apple M SoC,以及 AmpereOne 处理器。

OpenBLAS 0.3.31 对于 x86_64 版本带来了对 Intel Core Ultra 200V “Lunar Lake” 处理器的 CPU 自动检测支持,以及各种修复。
通过 GitHub 和 OpenBLAS.net 获取 OpenBLAS 0.3.31 的下载和更多详细信息。
转自 OpenBLAS 0.3.31 Released With New Extensions, RISC-V & ARM64 Optimizations – Phoronix
Linuxeden开源社区