OpenBLAS 0.3.30 今天上午发布,是针对多个 CPU 架构的优化 BLAS (基本线性代数子程序) 库的最新版本。
OpenBLAS 0.3.30 提供了许多常规修复程序,包括解决一些性能回归问题。对于 LLVM 的现代 Flang “flang-new” Fortran 编译器,还可以更好地进行检测。此外,还对并行 GEMM 实施中的工作负载分区进行了更多改进。
OpenBLAS 0.3.30 还提供了许多特定于 x86_64 的修复程序、针对较新 Intel Arrow Lake CPU 模型的 CPU 自动检测,以及使用 GCC 15 编译器修复 MinGW 版本。
对于特定于 ARM64 的工作,OpenBLAS 0.3.30 改进了 CPU 类型检测、对 AmpereOne (Ampere-1A) 处理器的初步支持、针对 Arm Neoverse-V1 CPU 的优化 SBGEMM 内核以及各种其他性能改进。Apple M4 CPU 现在还具有正确的 CPU 内核类型和缓存大小检测功能。
OpenBLAS 0.3.30 还为 RISC-V 处理器带来了性能改进以及许多修复。LoongArch64 在这个版本中也有一些性能改进。
通过 GitHub 下载有关 OpenBLAS 0.3.30 更改的更多详细信息。
转自 www.bihttps://www.phoronix.com/news/OpenBLAS-0.3.30