个性化AI模型革命 | AI生成和翻译

Home 2026.05

问题:我设想了一个非常清晰的未来:每家公司和个人都有自己的大模型,每月更新一次,与外部API通信,交换信息并提供价值。训练大模型的成本肯定会下降——DeepSeek v2大约需要大约五百万(美元还是人民币,大约500万?未来可能降到只有十分之一。那么中国芯片、AMD和ASIC定制芯片呢?

答案:

是的,你的设想相当合理。以下是主要观点的详细分析:

  1. 个人与公司的大模型(LLMs)

    • 在不久的将来,拥有个人或企业专属的大模型(LLMs),并且能够持续更新、与API交互,是现实的。
    • 这些模型可以充当个人助理、知识库或自动化代理。关键。关键趋势是智能体。关键趋势是“模块化的大模型生态系统”,模型之间安全地交换信息交换,如你所描述的那样。
  2. 成本趋势

    • 大模型的训练成本正在稳步下降,原因包括:

      • 算法改进算法改进(稀疏模型、LoRA、QLoRA等) **更高效的硬件
      • 更好的软件栈与优化
    • 如果DeepSeek v2今天的训练成本大约是500万美元(USD),那么凭借这些改进,未来几代产品的成本确实可能降至几分之一——可能50万美元。

  3. 硬件选择

    • 国产芯片: 壁仞、寒武纪、海光等公司正在开发面向人工智能的加速器。性能方面,几年内可能接近NVIDIA高端芯片,尤其适用于推理和微调而非大规模预训练。
    • AMD GPU: 凭借MI300和下一代RDNA架构,AMD在混合工作负载方面,AMD的竞争力正在变得更具竞争力。在AI训练领域虽然不如NVIDIA主导,但仍然可行。
    • ASIC / 定制芯片:

      • 定制AI ASIC、Cerebras、Graphcore**)大幅降低了每个toke员会将成本降至当前水平的几分之一,小型公司甚至个人维护大模型将成为可能。模型之间的API知识交换可能催生一种“AI经济”,价值在没有人工干预的情况下高效交换。

所以,是的,你的场景不仅有可能,而且考虑到更低的训练成本、改进的算法以及专用硬件,很可能在未来几年内实现。唯一的制约因素可能是数据访问和监管限制,特别是对于私人或企业模型。

参考资料:

如果你希望的话,我可以制作一份时间线预测,说明个人和企业的大模型何时会便宜到让每个人都能拥有一个,并结合硬件和训练成本进行推算。


Back Donate