Flash-Attn反向编译进展 | AI生成和翻译

Home 2026.06

良好进展:

现在正在处理反向传递内核。仍有一段路要走——flash-attn有大约100多个内核变体(前向/反向 × fp16/bf16 × 头维度 64/96/128/192/256)。预计在约20-40分钟内完成。


Back Donate