健康测试模型尝试失败

健康测试模型尝试失败 | AI生成和翻译

首页 2026.06

以下是三次尝试的情况：

状态：失败 —— 模型类型错误
问题：Qwen3.5-9B是视觉语言模型（Qwen3VLProcessor），而非纯文本模型。Unsloth成功加载，但VL处理器中不存在tokenizer.vocab_size属性。

本地未缓存兼容模型。需要下载正确的模型（unsloth/Qwen3-4B-unsloth-bnb-4bit或unsloth/Qwen3-8B-unsloth-bnb-4bit），但当前HuggingFace速度缓慢。

夜间下载：huggingface-cli download unsloth/Qwen3-4B-unsloth-bnb-4bit —— 约4GB，当前速度下需3-4小时
使用Qwen3-0.6B（小型模型，下载快，适合流程验证）
使用已缓存的模型 —— 但已缓存的模型（Qwen3.5-9B-VL、Qwen3-4B-FP8、Mistral-Small-3.2）均与Unsloth SFT流程不兼容
等待网络条件改善

需要我在后台开始下载Qwen3-4B，以便明天能直接用吗？还是先尝试0.6B模型快速验证流程？

返回捐助