Flash-Attn单架构编译 | AI生成和翻译

Home 2026.06

状态更新:

MAX_JOBS=32 在这里帮不上忙 — flash-attn 的构建系统一次只编译一个 .cu 文件。瓶颈在于单个文件的 CUDA 编译。使用单架构时,每个文件应只需1-3分钟,而不是5-12分钟。估计剩余总共约30-40分钟。


Back Donate