Fineweb GPT-3训练设置 | AI生成和翻译

Home 2026.05

加载器正常工作 — 1407 个训练分片 + 1 个验证分片,uint16,第一个 token 为 50256 (EOT),与预期一致。

4) 操作步骤 — 要运行的命令

cd /mnt/data/nanoGPT
source venv/bin/activate

#(可选)确认 GPU 空闲
nvidia-smi

# 试运行:小批次运行 5 次迭代(iters),确保一切正常再正式运行
python train.py config/train_fineweb_gpt3.py \
    --compile=False --batch_size=2 --gradient_accumulation_steps=1 \
    --max_iters=5 --eval_interval=10 --log_interval=1

# 正式运行(单块 4070,12GB)。使用 tmux/screen 会话 — 这将耗时数小时。
tmux new -s nano
python train.py config/train_fineweb_gpt3.py 2>&1 | tee out-fineweb-gpt3/train.log
# 分离:Ctrl-b d   |   重新连接:tmux attach -t nano

后续可调整的注意事项/参数


Back Donate