Gemma四比特部署成功 | AI生成和翻译

Home 2026.04

✅ Gemma 4 26B 运行稳定!

结果:

有效配置:

-m ./models/gemma-4-26B-A4B-it-UD-IQ3_S.gguf
-ngl 25
-c 2048
--host 0.0.0.0
--port 8081

关键是将 -ngl 从 31 减少到 25 —— 这为计算缓冲区留出了约 2GB 的显存裕量,正是该问题导致了之前的 OOM 崩溃。


Back Donate