训练可见,输出缓冲 | AI生成和翻译

Home 2026.06

IMPORTANT: 翻译 markdown 内容时,请确保格式正确:

TRANSLATION RULES:

找到了。训练确实在运行——检查点文件(1.49GB,更新于22:41)证明了这一点。但日志卡住了,原因是 Python stdout buffering

当 Python 的 stdout 通过 tee 管道输出时,它不再是 TTY,因此 Python 会完全缓冲输出而不是行缓冲。train.py 中的 print() 调用停留在管道缓冲区中,从未刷新到 /tmp/train.log

日志文件的最后修改时间是 21:16(只有初始警告)。该进程正在通过管道输出(fd/1 -> pipe),确认了缓冲问题。

训练正常,只是输出不可见。 要解决未来运行的问题,可以:

检查点 out-github-code-124m/ckpt.pt(1.49GB)刚刚保存,因此训练正在进行。你只是在损失/指标上盲目飞行。要我终止并重新启用无缓冲输出,还是让它完成并检查检查点统计信息?


Back Donate