训练进度与时间估计 | AI生成和翻译
当前状态(香港时间 16:23):
- 迭代 1,260 / 19,073 — 完成约 6.6%
- loss 从 11.0 降至 3.75(第 1000 次迭代时验证集 loss 为 4.04)
- 单步时间稳定在 ~11.1 秒/迭代,MFU 约 12.7%
- 已保存 2 个检查点(第 500、1000 次迭代);无报错,无内存溢出
剩余时间(从当前时刻起算):
| 停止位置 | 剩余迭代数 | 从当前算起的挂钟时间 | 预期 loss |
|---|---|---|---|
| 5,000 | ~3,740 | ~11.5 小时(明早完成) | ~3.5–3.8 |
| 10,000 | ~8,740 | ~27 小时(周三晚完成) | ~3.2–3.4 |
| 19,073(完整) | ~17,813 | ~55 小时 ≈ 2.3 天(周四深夜完成) | ~2.9–3.1 |
运行节奏与最初估算一致——已耗时约 4 小时,距完整运行还需约 55 小时。步速和 loss 趋势均表现良好;你可在任意 500 次迭代的边界终止,不会丢失最新检查点。