更新Llama服务配置 | AI生成和翻译

Home 2026.04

以下是我们所做工作的总结:

服务设置

配置变更 | | 变更前 | 变更后 | |—|—|—| | 模型 | DeepSeek-R1-0528-Qwen3-8B-Q4_K_M | gemma-4-E4B-it-Q5_K_M | | 端口 | 11435 | 8081 | | GPU 层数 | 99 | 43 | | 上下文长度 | 8192 | 65536 | | Flash 注意力 | — | 关闭 |

注意事项


Back Donate