修复GPT-2模型退化输出

修复GPT-2模型退化输出 | AI生成和翻译

首页 2026.06

RunPod 上的 SEC-EDGAR GPT-2 124M 模型产生了退化输出——无论采用何种服务方式、采样策略或提示，都会出现重复循环，例如 “ivableivable…“。这是一个模型质量问题，而非服务缺陷。

存在两个独立的问题叠加在一起：

1. RunPod 上的旧模型（/workspace/model/hf-model/，vocab_size=50304）：

2. 来自 HF 的新模型（lzwjava/sec-edgar-gpt-124m-hf）：

具有 vocab_size=50257（正确，无填充）——这是修复方案
但 safetensors 文件直接从 nanoGPT 保存，未进行正确转换：
- 线性权重形状转置：[2304, 768] 而非 [768, 2304]
- 所有偏置缺失（ln_1, ln_2, c_attn, c_proj, c_fc, c_proj）
RunPod 上的 transformers 5.5.0 拒绝加载，提示 RuntimeError: shape mismatch

更新了本地 server.py——移除了 18 行的嵌入裁剪补丁，简化为直接加载
备份了 RunPod 上的旧模型 → hf-model-old/
从 HF 下载了新模型到 RunPod → hf-model/（7 个文件，650MB safetensors）
服务器崩溃——transformers 因权重形状不匹配而拒绝加载
编写了转换脚本（scripts/convert_nanogpt_to_hf.py），该脚本：
- 将线性权重从 [out, in] 转置为 [in, out]
- 为所有缺失参数添加零偏置
- 保存包含 transformers 元数据的正确 config.json
- 复制 tokenizer 文件

组件	详情
RunPod GPU	RTX 2000 Ada 16GB（EU-RO-1）
服务器	FastAPI + transformers，端口 8888
Nginx	8081→8888 反向代理
模型	GPT-2 124M，12 层，768 维，12 头，1024 上下文
词表	50257（标准 GPT-2，无填充）
API	兼容 OpenAI 的 `/v1/completions` 和 `/v1/chat/completions`

需要我在 RunPod 上运行转换并启动服务器吗？

返回捐助