2025年GPU云市场份额 | AI生成和翻译
2025年AI/大语言模型训练GPU云市场份额
GPU云市场,特别是针对大语言模型和其他AI工作负载训练的领域,是更广泛云基础设施市场的一个子集。虽然专门针对GPU实例的市场份额细分数据并未广泛公布(由于该领域的快速发展和专有数据),但整体云市场份额仍是一个有力的参考指标。这是因为AWS、Azure和Google Cloud等主要提供商通过其集成的AI/ML服务主导了GPU产品。像Lambda Cloud这样的利基厂商在初创公司和研究人员中逐渐受到欢迎,因为它们提供成本效益高且专用于GPU的访问,但市场份额较小。
根据2025年第一季度及2024年末的最新数据:
- Amazon Web Services:在云基础设施市场中约占29-31%的份额。AWS通过EC2实例(如配备NVIDIA A100/H100 GPU)和用于托管LLM工作流的SageMaker,在AI训练的GPU云领域处于领先地位。由于其可扩展性、Spot实例(最高可享90%折扣)以及与其他AWS服务的集成,它在大规模企业训练中颇受欢迎。
- Microsoft Azure:市场份额约为21-25%。Azure的N系列虚拟机(配备NVIDIA A100/V100/H100 GPU)和Azure Machine Learning被广泛用于LLM训练,尤其受到已融入微软生态系统的组织青睐。它提供Spot定价和预留实例以节省成本。
- Google Cloud Platform:市场份额约为10-12%。GCP凭借TPU以及NVIDIA GPU(例如A3 Ultra实例中的H200)和用于LLM开发的Vertex AI脱颖而出。其免费层级(如用于测试的Colab)和持续使用折扣使其在研究和小规模训练中颇具吸引力。
- Lambda Cloud:虽然没有具体的市场份额百分比报告,但估计全球份额低于5%,主要专注于利基用户群体。Lambda在独立开发者、初创公司和研究团队中非常受欢迎(声称拥有超过10,000名用户),因其提供价格合理、预配置的GPU虚拟机(例如NVIDIA A100/H100),并预装了PyTorch等深度学习框架。它常因其简洁性、相较于超大规模云厂商更低的成本以及专注于AI工作负载而无广泛云锁定而受到选择。
AWS、Azure和GCP的合并市场份额在云基础设施领域约为63%,这种主导地位也延伸至AI/LLM训练的GPU服务。2025年,GPU即服务市场总规模约为49.6至50.5亿美元,并因AI需求快速增长。新兴的“新云”( specialized GPU提供商)如CoreWeave(拥有45,000多块GPU并与NVIDIA合作)、Voltage Park等超过80家,但它们共同占据的市场份额较小(可能总计10-20%),主要吸引那些在超大规模云厂商处面临GPU短缺或高成本的用户。
人们使用什么进行LLM训练
选择取决于规模、预算和生态系统:
- 大型企业和公司:通常偏好AWS、Azure或GCP,因为它们具有强大的集成能力(例如AWS SageMaker用于端到端LLM流水线、Azure的类似watsonx的工具、GCP的BigQuery用于数据处理)、安全性和全球可用性。这些平台能处理大规模训练任务,但可能成本较高(例如每H100 GPU每小时4-10美元),并且有时因高需求面临可用性问题。
- 初创公司、研究人员和独立开发者:许多人选择Lambda Cloud或类似的利基厂商如CoreWeave,以获取更低的费率(例如A100每小时1-3美元)、简易设置(预装Jupyter笔记本和CUDA)和灵活性。Lambda因无过度订阅和快速配置而受到称赞,使其成为原型设计或较小规模LLM微调的理想选择。
- 影响选择的关键因素:
- 成本:超大规模云厂商提供折扣(Spot/预留实例),但像Lambda这样的利基厂商在纯GPU计算上提供更好的价值。
- 可用性:GPU短缺(例如H100)推动用户寻找替代方案;Lambda和CoreWeave通常库存更充足。
- 功能:对于托管训练,超大规模云厂商胜出;对于原始算力,利基厂商更优。
- 趋势:2025年,混合方法很常见——例如在Lambda/CoreWeave上训练,在AWS/Azure上部署。GCP/AWS的免费层级吸引初学者。
总体而言,虽然超大规模云厂商在企业LLM训练中占据主导地位,但像Lambda这样的AI特定提供商的崛起正在改变市场份额,特别是对成本敏感的用户。
2025年机器学习和AI的GPU:本地与云对比
2025年顶级30家云GPU提供商及其GPU
2025年AI云提供商对比:Coreweave、Lambda…
2025年全球21+家顶级云服务提供商
2025年AWS、Azure、Google Cloud云服务对比
2025年第一季度云市场份额:AWS下滑,微软和谷歌…
2025年15+家顶级云GPU提供商
GPU即服务市场规模到2034年将达到318.9亿美元
2025年云计算市场规模与趋势
2025年12家最佳AI/ML GPU云提供商
亚马逊和微软在全球云市场中保持领先