sglang 在 RTX 4070 上服务于 Qwen2.5-1.5B | AI生成和翻译

Home 2026.06

完成。sglang已在RTX 4070上成功运行并提供Qwen2.5-1.5B-Instruct服务。

以下是摘要:

已搭建内容: 新虚拟环境:~/sglang-env torch: 2.7.1+cu126 (CUDA 12.6 运行时) triton: 3.3.1(非段错误的3.5/3.6版本) sglang: 0.4.10.post2 sgl-kernel: 0.2.8 flashinfer: 0.2.9rc2

关键细节:

启动脚本:/tmp/start-sglang.sh 设置代理(127.0.0.1:7890)和PATH,然后在端口30000运行sglang

后续重启命令: ssh lzw@192.168.1.36 “nohup /tmp/start-sglang.sh > /tmp/sglang-server.log 2>&1 &”


Back Donate