皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

ISA 差异随着新的 AMD GFX1170 “RDNA 4m”浮出水面

本月早些时候,我们在 AMDGPU LLVM 后端中发现了新增的 GFX1170 GPU 目标。使这个 GFX1170 目标引人注目的是,它被标记为 APU/SoC 组件,并带有”RDNA 4m”标识,同时属于 GFX11 系列。GFX11 系列对应 RDNA3,GFX115x 对应 RDNA 3.5,GFX12 对应 RDNA4。现在,更多的 ISA 变更已提交到 AMDGPU LLVM 后端,使得一些指令差异与 RDNA4 更好地对齐。

LLVM AMDGPU 代码中的 GFX1170 目标最初与现有的 GFX3 目标只有少数功能差异,最值得注意的是增加了 FP8/BF8 转换支持。自最初的活动以来,在最新的 LLVM Git 代码中现在指示了更多的差异。

ISA 差异随着新的 AMD GFX1170 "RDNA 4m"浮出水面

今天合并了适用于 GFX1170 硬件的新 WMMA 和 SWMMAC 指令。新增的代码为 GFX1170 和 GFX12 添加了新的 WMMA128bInsts,并将 WMMA 和 SWMMAC 指令与现有的 GFX11 WMMA 指令(不适用于 GFX1170 系列)的 WMMA256bInsts 更好地分离。波浪矩阵乘累加(WMMA)ISA 的改进应有助于 AI/ML 和其他 GPU 计算工作负载。

今天还合并了从 GFX1170 系列中移除 V_DOT2ACC_F32_F16。V_DOT2ACC_F32_F16 用于对打包的 FP16 值进行点积计算,并累加到目标中。RDNA4 移除了 V_DOT2ACC_F32_F16,而 GFX1170 也正在移除此指令。

另一个几小时前开启的公开合并请求从 GFX1170 系列中移除了 DX10_CLAMP 和 IEEE 位。”amdgpu-ieee”模式用于指定函数是否期望模式寄存器中的 IEEE 字段在进入时被设置。”amdgpu-dx10-clamp”用于指定模式寄存器中的 DX10_CLAMP 字段是否在进入时被设置,以匹配向量 ALU 中关于”NaN”的 DirectX 10 行为。RDNA4 已经移除了 DX10_CLAMP,而 GFX1170 现在也开始转向。

有趣的是,看到更多针对 GFX1170 的 ISA 变化,使其更接近 RDNA4 而不是 RDNA3,并使其作为”RDNA 4m”更有意义,而不仅仅是营销术语。但我们仍然不知道最终哪些 APUs/SoCs 会使用这种 RDNA 4m 图形 IP。

转自  More ISA Differences Come To Light With The New AMD GFX1170 “RDNA 4m” – Phoronix