反向编译几乎完成 | AI生成和翻译

Home 2026.06

进展顺利:

已编译的反向内核:

flash_api.o
反向 hdim128:bf16-causal、bf16、fp16-causal、fp16  ✓
反向 hdim192:bf16-causal、bf16、fp16-causal、fp16  ✓
反向 hdim256:bf16-causal、bf16、fp16-causal、fp16  ✓
反向 hdim32: bf16-causal、bf16  ✓、fp16-causal(编译中)、fp16(待处理)

每个 .o 文件约需 1 分钟,单架构构建。正向阶段约有 16 个内核,预计剩余时间约 15-20 分钟。


Back Donate