大语言模型的代码推理与工具调用

大语言模型的代码推理与工具调用 | AI生成和翻译

Home 2025.06

很好的问题！你实际上是在问类似 Anthropic的Claude（及其他大型语言模型） 内部如何处理：

让我详细拆解说明。

Claude（及其他前沿LLM）并不会在模型内部直接执行代码——它们通过预测代码或逻辑步骤的标记来模拟代码推理。

在普通文本模式下，Claude可以通过延续模式来“编写”代码，但不会在内部运行它。
当与后端系统（如Anthropic的Workbench或OpenAI的代码解释器） 配合使用时，系统可以捕获这些代码片段，然后在沙箱环境中实际运行它们。
运行结果可以反馈给模型作为上下文，从而实现链式推理： → 生成代码 → 外部执行 → 接收输出 → 决定下一步。

因此智能体现在这个循环中：LLM生成 → 外部运行器执行 → LLM解析结果。

许多API（Claude、OpenAI等）现在支持结构化输出模式，允许附加JSON模式。其内部工作原理如下：

这确保了输出是语法和语义都正确的JSON，对于工具使用自动化至关重要。

工具使用通过路由层在LLM和工具执行环境之间进行处理：

例如：

{
  "tool": "web_search",
  "query": "latest research on quantum error correction"
}

→ 路由器识别"tool": "web_search"，验证模式，执行网络搜索，将结果放回模型上下文，模型继续推理。

Anthropic的Claude、OpenAI的GPT、LangChain等都支持这种模式。

👉 是否需要我绘制流程图展示这个流程（LLM ↔ 工具路由器 ↔ 模式验证器 ↔ 执行引擎）以便更直观地理解？

Back Donate