赫尔墨斯迭代预算解释

赫尔墨斯迭代预算解释 | AI生成和翻译

首页 2026.05

以下是Hermes中迭代预算的工作方式：

核心类是 agent/iteration_budget.py — 一个线程安全的消费/退还计数器（约62行）。每个 AIAgent 实例（父代理或子代理）持有一个。

默认值：

循环位于 agent/conversation_loop.py 第796行：

while (api_call_count < agent.max_iterations
       and agent.iteration_budget.remaining > 0) \
      or agent._budget_grace_call:

每次迭代 = 一次API调用（该轮中可能包含多次工具调用）。

每次迭代的预算流程：

检查中断 — 如果用户发送了 /stop 或新消息，立即跳出循环
检查宽限调用 — 如果设置了 _budget_grace_call，则消耗该标志并允许最后一次迭代运行（随后无论结果如何都将退出）
consume() — 尝试从剩余次数中减去1。如果已为0，则打印你看到的⚠️警告并跳出循环
执行API调用 — 模型响应，工具执行
在特定条件下退还：
- execute_code 迭代会被退还（第3403、3883行） — 程序化工具调用不消耗预算
- 上下文压缩重试会被退还（第3403行） — 使用压缩上下文重试不计入次数
- Ollama上下文过小错误会被退还（第1100行）

当预算完全耗尽时（第4332-4349行）：

你看到的消息：

⚠ 迭代预算已用尽（60/60）— 响应可能不完整

这意味着代理达到了 max_iterations=60（要么在 config.yaml 中配置，要么由调用者设置）。该响应是预算耗尽后模型的总结尝试。

关键设计决策：

返回捐助