模型修复与部署

模型修复与部署 | AI生成和翻译

首页 2026.06

完成。以下是具体情况：

根本原因：RunPod上的旧模型产生退化输出，因为它来自原始的nanoGPT检查点（相同权重循环）。新的HF模型（lzwjava/sec-edgar-gpt-124m-hf）具有不同的、经过正确训练的权重，但以原始的nanoGPT布局保存（转置权重，无偏置）。

所做工作：

本地 server.py — 删除了18行的嵌入修剪hack
RunPod — 从HF下载新模型，并进行了转换：
- 将线性权重转置 [out, in] → [in, out]（GPT2Conv1D布局）
- 添加了零偏置（原始训练使用了 bias=False）
- 词汇表保持50257（无填充）
服务器重启 在端口8888，生成真正的SEC-EDGAR财务文本

RunPod上的文件（/workspace/model/）：

模型在长输出时会重复（124M的典型情况），但不再出现’ivableivable’这样的垃圾内容。

返回捐助