推理成本骤降引发人工智能辩论 | AI生成和翻译

Home 2026.06

问题: 未来推理将变得廉价而快速——文本转图像、翻译等等都会如此。Whisper 很快,Sesame 也很快。AI 之间能否互相争论?

回答:

能,而且这已经在发生。趋势非常明确:

推理成本暴跌是真实的。 如今 GPT-4 级别能力的成本比两年前低了约 100 倍。Groq 的 LPU 能做到每秒 800+ token,Cerebras 能做到每秒 2000+ token。文本转图像从 30 秒(SD 1.x)缩短到不到 1 秒(SDXL Turbo、FLUX schnell)。Whisper 在 CPU 上即可实时运行。这一趋势并未放缓。

AI 辩论 / 多智能体争论已成为一个研究方向。 几种具体形式如下:

“AI 争论”在代码中看起来是什么样(50 行):

import anthropic

client = anthropic.Anthropic()

def agent_turn(role: str, position: str, history: list[dict]) -> str:
    system = f"You are {role}. Argue {position} forcefully. Be concise, technical, sharp."
    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=300,
        system=system,
        messages=history,
    )
    return response.content[0].text

def debate(topic: str, rounds: int = 3):
    history_a, history_b = [], []
    last_b = f"Let's debate: {topic}"

    for i in range(rounds):
        # Agent A responds to B
        history_a.append({"role": "user", "content": last_b})
        reply_a = agent_turn("Agent A", "FOR", history_a)
        history_a.append({"role": "assistant", "content": reply_a})
        print(f"[A] {reply_a}\n")

        # Agent B responds to A
        history_b.append({"role": "user", "content": reply_a})
        reply_b = agent_turn("Agent B", "AGAINST", history_b)
        history_b.append({"role": "assistant", "content": reply_b})
        print(f"[B] {reply_b}\n")
        last_b = reply_b

debate("MoE is better than dense transformers for frontier models")

有趣的意义: 当推理近乎免费时,你可以并行运行 100 个智能体进行争论,提炼共识,从而得到比任何单一模型更好的答案。这基本上就是带语言的集成学习。DeepSeek R1 的思维链是一个模型与自己争论——多智能体辩论则是其分布式版本。

具体到 Sesame(对话式语音 AI)—— 速度快到足以感觉实时,情感丰富到足以感觉像真人。当两个这样的 AI 争论时,几乎分辨不出与人类在播客上辩论的区别。这就是不久的将来。

瓶颈从“我们能否做到”转移到了“什么值得争论”——策展和编排成为真正的工程问题。

参考文献:


Back Donate