基于SEC申报文件训练GPT-2

基于SEC申报文件训练GPT-2 | AI生成和翻译

首页 2026.06

以下是完整说明：

== 数据集 == SEC-EDGAR — 来自SEC的EDGAR申报系统中的所有10-K年度报告。

== 模型 == GPT-2 124M（标准nanoGPT架构）

== 训练 ==

== 时间 ==

== 预期结果 ==

损失从约10.98（随机初始化）开始，第20步时已降至8.85
对于金融文本，验证损失应收敛到约3.0-3.5范围（参考：github-code达到了3.466，但那个数据集噪声较大； SEC-EDGAR更干净，结构化的金融散文）
模型将学习SEC申报语言：财务表格、风险披露、MD&A部分、会计术语
训练后你会得到：out-sec-edgar-124m/ckpt.pt（最新检查点）

== 用途 == 这是一个面向金融/SEC申报的领域特定语言模型。适用于：

局限性：124M参数规模较小——别指望达到GPT-4级别的连贯性。它能生成听起来合理的SEC文本，但在复杂推理或长程一致性方面会表现不佳。

返回捐助