Nanochat RTX 4070 训练运行更新

Nanochat RTX 4070 训练运行更新 | AI生成和翻译

首页 2026.06

Nanochat 正在 RTX 4070 上运行：

GPU： RTX 4070 — 2.7 GB / 12 GB VRAM 已使用，利用率 99% 模型： depth=8（约 4000 万参数），bf16 吞吐量：约 103K tok/秒损失： 7.73 → 6.22（步骤 81/5000）预计剩余时间：预训练约 26 分钟，然后 SFT（约 8 分钟），总计约 35-40 分钟

在工作站的 tmux 会话 nanochat 中运行。日志位于 /mnt/data/nanochat/run_rtx4070.log。

注意：仅使用了 2.7 GB VRAM — 你可以轻松增加到 --depth=12 或 --depth=16 以获得更大的模型。d8 只是一个快速演示运行。你是想让它完成，还是用更大的模型重新启动？

返回捐助