微调管道构建与调试 | AI生成和翻译

Home 2026.06

我们所做的工作 — 完整总结

1. 构建了微调流水线 (/mnt/data/zz/finetune/)

数据集提取 (build_dataset.py):

训练脚本 (train.py):

辅助脚本:

2. 模型下载风波

尝试了 4 个模型后才找到可用的:

模型 大小 结果
unsloth/Qwen3-8B (4-bit) 7.5GB 下载太慢 (300KB/s),已终止
Qwen/Qwen3.5-9B (缓存) 18GB VL 模型,类型错误
Qwen/Qwen3-4B-FP8 (缓存) 4.9GB Unsloth 加载时卡住
unsloth/Qwen3-4B-unsloth-bnb-4bit 3.4GB 通过 curl 下载,可用

huggingface.co 以约 37MB/s 下载(速度从之前的 300KB/s 恢复)。由于 hf CLI / hf-mirror.com 没有该模型,通过符号链接手动设置了 HF 缓存结构。

3. 从 Unsloth 转向纯 Transformers

Unsloth 的 Triton 内核在此设置上持续段错误:

修复:完全放弃 Unsloth,改用:

4. TRL 0.24 API 修复

安装的 TRL 0.24.0 与文档中的 API 有变化:

5. Git 提交

8292db9  add finetune pipeline for lzwjava notes SFT
9aaa8f3  fix train.py: use pure transformers+peft, fix TRL 0.24 API

推送到 github.com:lzwjava/zz.git。JSONL 文件已被 gitignore。

6. 准备运行

cd /mnt/data/zz/finetune && python3.11 train.py

Back Donate