HuggingFace 中国下载指南 | AI生成和翻译

Home 2026.05

两个环境变量完成所有工作:

变量 作用
HF_ENDPOINT=https://hf-mirror.com 将所有 HF Hub 流量路由至国内镜像。无需代理,不影响你的 DMIT VPS。
HF_HUB_ENABLE_HF_TRANSFER=1 使用 Rust hf_transfer 客户端实现并行多块下载(快 5–10 倍)。需先执行 pip install hf_transfer

一次性命令

HF_ENDPOINT=https://hf-mirror.com HF_HUB_ENABLE_HF_TRANSFER=1 \
  python3.11 sample.py --init_from=gpt2-medium --start="Hello" --num_samples=1

永久生效(推荐)

添加到 ~/.bashrc 中,以免忘记:

export HF_ENDPOINT=https://hf-mirror.com
export HF_HUB_ENABLE_HF_TRANSFER=1

然后执行 source ~/.bashrc。所有使用 transformers / datasets / huggingface_hub 的 Python 脚本都会自动加载这些设置。

预下载(避免训练中途下载)

huggingface-cli download gpt2-medium                              # 模型
huggingface-cli download HuggingFaceFW/fineweb --repo-type=dataset --include="sample/10BT/*"  # 数据集

文件会保存到 ~/.cache/huggingface/hub/ 中,后续每次调用 from_pretrained() 都会复用这些文件。

适用范围

注意事项

验证是否生效

HF_ENDPOINT=https://hf-mirror.com huggingface-cli download gpt2 --quiet
echo $?   # 0 表示成功

或者观察进度条中的 URL — 应显示 hf-mirror.com,而非 huggingface.co


Back Donate