幂律损失曲线预测 | AI生成和翻译

Home 2026.05

将幂律拟合到迄今为止的验证损失曲线。使用11个数据点(迭代1000→6000),在两种合理的 L_∞ 选择下,L(n) = L_∞ + A · n^(-α) 拟合结果一致:

拟合A: L(n) = 2.7 + 42.4 / n^0.5     (残差~0.05)
拟合B: L(n) = 2.5 + 24.4 / n^0.4     (残差~0.05)

两者在预测范围内的差异约为0.02,因此预测对选择不敏感。预测结果:

迭代 拟合A 拟合B 预测值 与迭代6000的差值(3.247)
7,500 3.19 3.20 ~3.19 -0.06
10,000 3.12 3.11 ~3.11 -0.14
12,500 3.08 3.05 ~3.06 -0.19
15,000 3.05 3.01 ~3.03 -0.22
19,073 3.01 2.96 ~2.98 -0.27

合理性检查:与最近一次评估间差值(4500→6000平均约0.025/500次迭代)对比,从迭代6000起积分隐含的1/√n减速,到19,073时总下降约0.27——与两个拟合均匹配。

要点:

注意事项:


Back Donate