训练运行状态与时间估计 | AI生成和翻译

Home 2026.06

训练正在运行。当前状态如下:

第 450 / 445,000 步 (0.1%)
损失值:11.1 → 6.35(持续下降,趋势良好)
每步耗时:~450ms(稳定,编译已预热)
吞吐量:~71,500 tok/s

预计剩余时间:~56 小时(约 2.3 天)

剩余步数:444,550
每步耗时:450ms
剩余时间:444,550 × 0.45 = 199,647 秒 = 55.5 小时

此前 8-10 小时的预估有误——那是基于烟雾测试(batch=4,未编译)的结果。实际使用 batch=32 并启用编译后,每步耗时约为 450ms,而非 81ms。

当前损失曲线走势健康:

第 0 步:11.12  (随机初始化)
第 50 步:8.61
第 150 步:7.22
第 300 步:6.62
第 450 步:6.35

可保持运行状态。明晚再查看——届时应已推进至约第 200K-250K 步。


Back Donate