AMD开发者云GPU Droplet指南 | AI生成和翻译

Home 2026.05

问题:什么是基于Ubuntu 24.04和ROCm 7.2的AMD开发者云GPU Droplet?使用它需要了解什么?

答案:

AMD开发者云 — GPU Droplet概述

您的Droplet(7.2-gpu-mi300x1-192gb-devcloud-atl1)是一个单块AMD Instinct MI300X GPU实例,托管在ATL1(亚特兰大)区域,由AMD开发者云提供支持。以下是您需要了解的所有信息:


这是什么

AMD开发者云可通过 devcloud.amd.com 访问,并依赖DigitalOcean提供云环境,最终部署GPU Droplet。您可以创建单块GPU AMD Instinct MI300X或8×GPU Instinct MI300X实例。

您的具体Droplet规格:


ROCm 7.2 — 它的能力

ROCm 7相较于前代带来了突破性的性能提升——训练工作负载相比ROCm 6基准测试平均提升高达3倍,推理性能平均提升4.6倍。这些提升得益于GPU利用率优化、对低精度数据类型的支持以及优化的数据传输。

AMD ROCm是一个开放的软件栈,包括驱动程序、开发工具和API,支持从底层内核到最终用户应用的GPU编程。ROCm针对生成式AI和HPC应用进行了优化,并且可以轻松将现有代码迁移到ROCm软件中。


Droplet就绪后的第一步

1. 应用安全更新(按仪表板提示操作)

通过SSH登录您的Droplet并运行:

sudo apt update && sudo apt upgrade -y
sudo reboot

2. 通过SSH连接

ssh root@<your-droplet-ip>

3. 验证GPU是否被检测到

rocm-smi

这是AMD版本的 nvidia-smi。您将看到GPU利用率、显存使用情况和温度。

4. 进入预构建的Docker容器(如果使用快速启动镜像)

docker exec -it rocm /bin/bash

运行模型(例如,使用vLLM)

您可以在容器内启动vLLM API服务器,如下所示:

python -m vllm.entrypoints.openai.api_server \
  --model Qwen/Qwen2.5-1.5B-Instruct \
  --host 0.0.0.0 \
  --port 8000 \
  --dtype float16 \
  > /tmp/vllm.log 2>&1 &

该模型从HuggingFace免费下载,无需认证,在MI300X的192 GB显存中几秒内加载完成,并原生支持OpenAI聊天格式。


重要:计费提醒

即使Droplet已关机,您仍会被计费。要完全停止计费,您必须从仪表板销毁Droplet,而不仅仅是关机。

您当前状态显示 “正在关机 / 活动” —— 这意味着在完全销毁或您有意停止使用之前,它仍在产生费用。


定价参考

单块MI300X实例的标准定价为每小时1.99美元,8×MI300X实例为每小时15.92美元


开箱即用的可用框架

除了开箱即用地支持ROCm部署外,还提供了针对JAX、Megatron、PyTorch、SGLang和vLLM的快速启动包。


免费额度

AMD AI开发者计划为成员提供100美元的免费AMD开发者云额度,足以支持约50小时的初始使用。展示有用应用并公开分享项目的成员还可以申请额外额度。

参考资料:


Back Donate