AMD开发者云GPU Droplet指南

AMD开发者云GPU Droplet指南 | AI生成和翻译

首页 2026.05

问题：什么是基于Ubuntu 24.04和ROCm 7.2的AMD开发者云GPU Droplet？使用它需要了解什么？

答案：

AMD开发者云 — GPU Droplet概述

您的Droplet（7.2-gpu-mi300x1-192gb-devcloud-atl1）是一个单块AMD Instinct MI300X GPU实例，托管在ATL1（亚特兰大）区域，由AMD开发者云提供支持。以下是您需要了解的所有信息：

这是什么

AMD开发者云可通过 devcloud.amd.com 访问，并依赖DigitalOcean提供云环境，最终部署GPU Droplet。您可以创建单块GPU AMD Instinct MI300X或8×GPU Instinct MI300X实例。

您的具体Droplet规格：

GPU： 1× AMD Instinct MI300X
显存： 192 GB
操作系统： Ubuntu 24.04 LTS
软件栈： ROCm 7.2
区域： ATL1（亚特兰大）

ROCm 7.2 — 它的能力

ROCm 7相较于前代带来了突破性的性能提升——训练工作负载相比ROCm 6基准测试平均提升高达3倍，推理性能平均提升4.6倍。这些提升得益于GPU利用率优化、对低精度数据类型的支持以及优化的数据传输。

AMD ROCm是一个开放的软件栈，包括驱动程序、开发工具和API，支持从底层内核到最终用户应用的GPU编程。ROCm针对生成式AI和HPC应用进行了优化，并且可以轻松将现有代码迁移到ROCm软件中。

Droplet就绪后的第一步

1. 应用安全更新（按仪表板提示操作）

通过SSH登录您的Droplet并运行：

sudo apt update && sudo apt upgrade -y
sudo reboot

2. 通过SSH连接

ssh root@<your-droplet-ip>

3. 验证GPU是否被检测到

rocm-smi

这是AMD版本的 nvidia-smi。您将看到GPU利用率、显存使用情况和温度。

4. 进入预构建的Docker容器（如果使用快速启动镜像）

docker exec -it rocm /bin/bash

运行模型（例如，使用vLLM）

您可以在容器内启动vLLM API服务器，如下所示：

python -m vllm.entrypoints.openai.api_server \
  --model Qwen/Qwen2.5-1.5B-Instruct \
  --host 0.0.0.0 \
  --port 8000 \
  --dtype float16 \
  > /tmp/vllm.log 2>&1 &

该模型从HuggingFace免费下载，无需认证，在MI300X的192 GB显存中几秒内加载完成，并原生支持OpenAI聊天格式。

重要：计费提醒

即使Droplet已关机，您仍会被计费。要完全停止计费，您必须从仪表板销毁Droplet，而不仅仅是关机。

您当前状态显示 “正在关机 / 活动” —— 这意味着在完全销毁或您有意停止使用之前，它仍在产生费用。

定价参考

单块MI300X实例的标准定价为每小时1.99美元，8×MI300X实例为每小时15.92美元。

开箱即用的可用框架

除了开箱即用地支持ROCm部署外，还提供了针对JAX、Megatron、PyTorch、SGLang和vLLM的快速启动包。

免费额度

AMD AI开发者计划为成员提供100美元的免费AMD开发者云额度，足以支持约50小时的初始使用。展示有用应用并公开分享项目的成员还可以申请额外额度。

参考资料：

返回捐助