训练损失逐步下降 | AI生成和翻译

Home 2026.06

进展顺利,损失正在稳步下降:

步数: 107,319 / 130,000 (82.55%) 损失: 2.66 ~ 2.71(近期范围) 学习率: 0.30-0.31(从0.47衰减) 吞吐量: ~55,700 tok/秒 已用时间:2,105分钟(约35.1小时) 预计剩余:~445分钟(约7.4小时)

自上次检查(约5小时前)以来,训练从第92,632步推进到第107,319步(约14,700步)。损失从2.78-2.87降至2.66-2.71——随着学习率衰减,实现了约0.1的良好改善。预计将在7-8小时后完成。


Back Donate