训练进度与预计完成时间 | AI生成和翻译
训练状态良好,进展顺利。
当前状态(第7轮):
- 迭代次数 ~12,120 / 19,073(≈ 64% 完成)
- 最新检查点步骤 12000:训练损失 3.1166,验证损失 3.0866
- 每步用时:~11.11秒/迭代,MFU ~12.85%
损失曲线(检查点处的验证损失):
- 10000 → 3.1121
- 10500 → 3.1356
- 11000 → 3.1043
- 11500 → 3.0830
- 12000 → 3.0866
验证损失缓慢下降(约 3.08–3.14 区间),训练稳定。
剩余时间估算:
- 剩余约 6,953 次迭代 × 11.11 秒 = 约 77,300 秒 ≈ 21.5 小时
- 加上约 14 次额外的评估/检查点暂停(每次约 18 秒)→ 增加约 4 分钟
- 预计剩余时间:从现在起约 21–22 小时