在AMD MI300X上设置NanoGPT

在AMD MI300X上设置NanoGPT | AI生成和翻译

首页 2026.06

以下是操作步骤：

通过 SSH 登录到 root@129.212.187.36（AMD MI300X，Ubuntu）
安装 HF CLI
- pip3 install -U --break-system-packages 'huggingface_hub[cli]'
- huggingface_hub 1.17.0
从 HuggingFace 下载 lzwjava/zz
- hf download lzwjava/zz --local-dir /root/zz
- 37 个文件，424K（非 git 下载）
为 GitHub 生成 SSH 密钥
- ed25519，标签 lzwjava-amd-devcloud
- 已添加至 GitHub
克隆包含完整历史记录的 nanoGPT
- git clone git@github.com:lzwjava/nanoGPT.git
- 255 次提交，位于 /root/nanoGPT
从 HF 重新克隆 zz 作为正规 git 仓库
- 删除了非 git 的 hf download 版本
- git clone https://huggingface.co/lzwjava/zz
- 设置远程仓库：origin → GitHub（已归档），hf → HuggingFace（活跃）
- 18 次提交，完整历史
通过 zed ssh://root@129.212.187.36//root/zz 打开 Zed
冒烟测试下载脚本
- plan_and_download_fineweb_gpt3_amd.py — 运行正常，267 MB/s
用户在 tmux 中运行完整下载
- 18 个分片，39 GB，约 10.4B 个 FineWeb-Edu token
- 完成
安装分词依赖
- tiktoken, numpy, pyarrow, tqdm
冒烟测试分词脚本
- tokenize_fineweb_gpt3.py — 运行正常，约 30-50M tok/s
- 输出：uint16, GPT-2 BPE, EOT 前缀 ✓

当前状态： /root/nanoGPT — nanoGPT 仓库（255 次提交） /root/zz — 数据集仓库（18 次提交，39 GB parquet 数据）下一步： — 分词为 .npy 分片，然后训练

返回捐助