皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

英伟达™(NVIDIA®)GH200 Grace CPU 显示 64K 内核页大小对高性能计算的性能优势

默认情况下,Ubuntu 和其他 Linux 发行版上的 AArch64 内核倾向于默认使用标准的 4K 页面大小,但对于较新的 AArch64 硬件,尤其是服务器/高性能计算领域的硬件,使用 64K 页面大小会有很大的好处。由于距离我上次运行 64 位 ARM 4K 与 64K 内核页面大小基准测试已经有一段时间了,在远程访问英伟达 GH200 时,我进行了一次新的比较,看看切换到 64K 页面大小内核的性能优势。这些新的 64K 内核数据与最近的 AMD EPYC 和 Intel Xeon CPU 参考基准测试结果一起显示,以了解 4K 与 64K 页面大小对整个计算环境的影响。

Ubuntu、Red Hat Enterprise Linux 和其他支持 AArch64 的发行版倾向于默认使用 4K 内核,但也有一些发行版提供 64K 内核页面大小的内核构建。Ubuntu 和他们的 Ubuntu Mainline Kernel PPA 都在迎合当今大型 AArch64 服务器的需求。英伟达™(NVIDIA®)GH200 Grace CPU 显示 64K 内核页大小对高性能计算的性能优势

64K 页面大小通常有利于处理大量内存的高性能计算(HPC)工作负载。从 4K 到 64K 的页面大小可以提高 TLB 命中率,减少页面故障,全面提高内存效率。英伟达™(NVIDIA®)支持在其 Grace Hopper 超级芯片中使用 64K 页面大小的内核,这在 AArch64 领域也越来越常见,同时,越来越多的 Linux 驱动程序改进了对 64K 页面大小的兼容性,解决了文件系统差异问题,其他内核代码也采用了典型的 4K 页面大小假设。使用 64K 页面大小也会导致更高的内存使用率,尽管在服务器领域问题不大。

本文主要围绕现代内核上的 AArch64 64K 与 4K 页面大小性能提供一些新的参考数据,同时在 GPTshop.ai GH200 AI 工作站上的各种 CPU 工作负载中进行测试。这些基准测试以最近的英伟达 GH200 与英特尔至强/AMD EPYC CPU 基准测试为基础。 本文中的新数据是 “GPTshop.ai GH200 + Linux 6.8″,即使用 Linux 6.8 Git 内核而非 Ubuntu 23.10 默认的 Linux 6.5 内核运行 GH200。由于 Ubuntu 24.04 LTS 的目标是搭载 Linux 6.8,我运行了这一运行结果作为参考,以了解从 Ubuntu 23.10 的 Linux 6.5 升级到 6.8 的性能优势。这些基准测试结果中的第二个新运行是 “GPTshop.ai GH200 + Linux 6.8 64k”,用于 64K 页面大小的内核构建。这两个 Linux 6.8 AArch64 内核构建都是从 Ubuntu Mainline Kernel PPA 获取的,以便于重现。

转自 https://www.phoronix.com/review/aarch64-64k-kernel-perf