更新Llama服务配置 | AI生成和翻译

Home 2026.04

以下是我们所做工作的总结:

服务设置

配置变更

  变更前 变更后
模型 DeepSeek-R1-0528-Qwen3-8B-Q4_K_M gemma-4-E4B-it-Q5_K_M
端口 11435 8081
GPU 层数 99 43
上下文长度 8192 65536
Flash 注意力 关闭

注意事项


Back Donate