PyCharm NanoGPT 设置与调试

PyCharm NanoGPT 设置与调试 | AI生成和翻译

首页 2026.06

以下是在 PyCharm 中配置的方法：

打开项目：File → Open → ~/projects/nanoGPT
设置 Python 解释器：PyCharm → Settings → Project → Python Interpreter → Add → Existing → /opt/homebrew/bin/python3.14
为 sample.py 创建运行配置：
- Run → Edit Configurations → + → Python
- 名称：sample-gpt2
- 脚本路径：sample.py
- 参数：
```
--init_from=gpt2 --device=mps --dtype=float32 --num_samples=1 --max_new_tokens=150 --start="Hello world"
```
- 工作目录：/Users/lzwjava/projects/nanoGPT

为 Shakespeare 模型创建另一个配置：

参数：

--out_dir=out-shakespeare-char --device=mps --dtype=float32 --num_samples=1 --max_new_tokens=200 --start="ROMEO:"

设置断点 — 好的起始位置：
- model.py 约第175行：在 CausalSelfAttention 的 forward() 内部 — 观察 q、k、v 的形状
- model.py 约第210行：在 MLP 的 forward() 内部 — 观察 4 倍扩展
- sample.py 第87行：model.generate() 调用 — 单步进入以查看自回归循环
- model.py 约第245行：GPT.generate() — 观察 token 如何逐个被追加
调试：点击调试图标（Shift+F9）而不是运行。使用：
- F7：Step Into（进入函数内部）
- F8：Step Over（单步跳过）
- F9：Resume（运行到下一个断点）
- Alt+单击变量：求值表达式

对于 train.py，创建如下配置：

就是这样。PyCharm 的调试器配合 MPS 张量可以正常工作 — 你可以在 Variables 面板中检查形状、数值和梯度。

返回捐助