AMD MI300X FlashAttention 支持 | AI生成和翻译

Home 2026.06

问题:AMD MI300X 能否使用 FlashAttention 1 或 2?

答案:可以。AMD Instinct MI300X 通过 AMD 的 ROCm 生态系统同时支持 FlashAttention-1 和 FlashAttention-2。但对于你的 FP8/BF16 训练负载,应明确选择 FlashAttention-2

支持概览


你的运行实现细节

由于你通过 nanochat 运行训练,可以通过官方仓库安装和配置 FlashAttention-2。

1. 安装

你可以在环境内直接构建与 ROCm 兼容的 FlashAttention-2 版本:

pip install ninja packaging
git clone --recursive https://github.com/dao-ailab/flash-attention.git
cd flash-attention
# 在 ROCm 上构建将自动检测你的 MI300X 目标
pip install .

2. 切换后端

根据你的框架设置,你可以通过切换环境变量来实验哪个后端在 MI300X 上能实现最高的模型 FLOPs 利用率 (MFU):

export FLASH_ATTENTION_TRITON_AMD_ENABLE="FALSE"

export FLASH_ATTENTION_TRITON_AMD_ENABLE="TRUE"

参考文献:


Back Donate