使用Unsloth的双语SFT | AI生成和翻译

Home 2026.06

完成。以下是 /mnt/data/zz/finetune/ 中的内容:

finetune/
├── README.md              # 完整使用指南
├── requirements.txt       # pip 依赖
├── build_dataset.py       # 提取中英文帖子 → JSONL
├── train.py               # 使用 Unsloth 进行 QLoRA SFT
├── eval.py                # 对比微调后与基础模型
├── export_gguf.py         # 导出 GGUF 供 ollama 使用
├── notes_sft.jsonl        # 21,434 条样本 (86MB)
├── notes_sft_train.jsonl  # 21,234 条训练样本 (85MB)
└── notes_sft_eval.jsonl   # 200 条评估样本 (820KB)

数据集统计:

在 RTX 4070 上训练:

cd /mnt/data/zz/finetune
pip install unsloth          # 或者: pip install -r requirements.txt
python train.py              # Qwen3-8B QLoRA 4-bit,约 2-4 小时
python train.py --model unsloth/Qwen3-4B   # 更小、更快

Back Donate