皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

NVIDIA CUDA 13.0 U2 带来 DGX Spark 性能提升

CUDA 13.0 更新 2 现在是 NVIDIA 计算堆栈的最新增量改进。

在 8 月的 CUDA 13.0 发布和 9 月的 CUDA 13.0 更新 1 之后,今天发布的 CUDA 13.0 更新 2 为这个 Windows 和 Linux 计算堆栈带来了一些改进。

CUDA 13.0 更新 2 仍然与 NVIDIA 580 系列 Linux 驱动程序搭配使用,现在版本为 580.95.05。CUDA 13.0 更新 2 为新的 NVIDIA DGX Spark 硬件带来了一些性能改进。值得注意的是,通过 cuBLAS 库提升了 DGX Spark 在 FP16/BF16 和 FP8 GEMM 上的性能。

CUDA 13.0 更新 2 的 cuBLAS 现在还支持可选的固定点模拟,用于提升 FP64 MATMUL 的性能和能效。这种模拟遵循 Ozaki-1 方案,并使用自动动态精度框架以实现 FP64 级别的精度。

此次更新还为 cuBLAS 增加了 BF16x9 FP32 模拟的支持。

NVIDIA CUDA 13.0 U2 带来 DGX Spark 性能提升

有关 CUDA 13.0 更新 2 的下载和更多详细信息,请访问 NVIDIA.com

转自  NVIDIA CUDA 13.0 U2 Brings DGX Spark Performance Improvements – Phoronix