作为他们 Project Battlematrix 项目的一部分,英特尔一直在努力增强其 Linux 图形驱动程序对多设备使用场景的支持,希望每个系统支持多达八张英特尔 Arc Pro 图形卡,以帮助处理 AI LLMs 和其他更大的用例。英特尔工程师发布的最新代码是他们多设备共享虚拟内存(SVM)支持的初始实现。
为了处理多设备 GPU 计算等,本周末发布了初始补丁,开始为多设备 SVM 处理奠定基础。这紧随英特尔 Xe 内核驱动程序为多 GPU 的多设备固定设备内存所做的准备,以及最近几个月英特尔的多设备 GPU 驱动程序补丁。

这个初始的多设备 SVM 支持建立在 PCI Express 点对点(P2P)功能之上。英特尔工程师托马斯·赫尔斯特罗姆在周六的 15 个补丁系列中解释说:
“本系列旨在提供多设备 SVM 的初始实现,其中与对等体的通信(迁移和直接执行对等体内存中的操作)使用某种形式的快速互连。在本系列中,我们使用 pcie p2p。
在多设备环境中,设备专用内存的 struct pages(dev_pagemap)可能占用相当大的系统内存。因此,我们希望提供一种撤销/删除未使用的 dev_pagemap 的方法。特别是当设备离线时,我们希望阻止数据迁移到设备内存,并将已存在于设备内存中的数据迁移到系统。此时,dev_pagemap 就变得不再使用,可以被删除。
移除和设置大型 dev_pagemap 也很耗时,因此只有在系统内存压力下才会移除未使用的 dev_pagemap。”
代码现已可供审查。英特尔计划在第四季度完成 Project Battlematrix 软件大部分功能的封装。
转自 Intel Sends Out Initial Graphics Driver Patches For Multi-Device SVM – Phoronix
Linuxeden开源社区