MI300X 760M模型训练预估 | AI生成和翻译

Home 2026.06

760M 模型在 14.6B tokens 上的预估训练时间,单张 MI300X:约 24–35 小时

具体分解如下:

总 FLOPs:     6.66 × 10^19
MI300X 峰值:    1,307 TFLOPS (bf16)
实际 MFU:      40–60%(单 GPU,无通信开销)

在 40% MFU 下:约 35 小时
在 50% MFU 下:约 28 小时  ← 最可能情况
在 60% MFU 下:约 24 小时

与 Karpathy 的 nanochat 交叉验证:

与你在 RTX 4070 上的 124M 模型对比:

底线: 单张 MI300X 上约 1–1.5 天。对于 760M 模型处理 14.6B tokens 来说还不错。你可以在 tmux 中启动,第二天回来查看结果。


Back Donate