Ollama 内存使用详解 | AI生成和翻译

Home 2026.03

您看到的 159 MB 数字并不是模型的实际内存使用量——它很可能只是主 Ollama 服务器进程本身的驻留内存 (RES),或者是从 Activity Monitor / top / htop 等工具中获取的误导性部分读数,这些工具没有考虑到现代 LLM 运行器如何处理内存。

在 Apple Silicon Macs (M2/M3) 上,Ollama 非常高效地使用 memory-mapped filesunified memory。这意味着:

qwen3.5:9b 在 Mac M2/M3 上的典型真实内存使用量 (2026 年 3 月)

为什么最初看起来这么小

简而言之:159 MB 对于空闲服务器进程是正常的。模型在活动时实际使用数 GB——这是 Apple Silicon 上预期的且高效的。如果您看到性能差或错误,请检查总系统内存压力,而不是仅看进程大小。

References:

问题:为什么 ollama run qwen3.5:9b 只显示 159 MB 内存使用量,这看起来很小?

答案:


Back Donate