皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

OpenBLAS 0.3.30 发布,性能改进和修复

OpenBLAS 0.3.30 今天上午发布,是针对多个 CPU 架构的优化 BLAS (基本线性代数子程序) 库的最新版本。

OpenBLAS 0.3.30 提供了许多常规修复程序,包括解决一些性能回归问题。对于 LLVM 的现代 Flang “flang-new” Fortran 编译器,还可以更好地进行检测。此外,还对并行 GEMM 实施中的工作负载分区进行了更多改进。

OpenBLAS 0.3.30 还提供了许多特定于 x86_64 的修复程序、针对较新 Intel Arrow Lake CPU 模型的 CPU 自动检测,以及使用 GCC 15 编译器修复 MinGW 版本。

OpenBLAS 0.3.30 发布,性能改进和修复

对于特定于 ARM64 的工作,OpenBLAS 0.3.30 改进了 CPU 类型检测、对 AmpereOne (Ampere-1A) 处理器的初步支持、针对 Arm Neoverse-V1 CPU 的优化 SBGEMM 内核以及各种其他性能改进。Apple M4 CPU 现在还具有正确的 CPU 内核类型和缓存大小检测功能。

转自 www.bihttps://www.phoronix.com/news/OpenBLAS-0.3.30