NVIDIA GPU SM 解析

NVIDIA GPU SM 解析 | AI生成和翻译

首页 2026.06

Question: 在NVIDIA GPU中，“SM”代表什么？

Answer:

SM = Streaming Multiprocessor（流式多处理器）。

它是NVIDIA GPU的基本计算单元。一个GPU本质上由多个SM组成（例如，H100有132个SM，RTX 4070有46个SM）。每个SM包含：

执行模型直接映射到这一层次结构：当你启动一个CUDA内核时，线程块被分配到SM上。线程块在其生命周期内驻留在单个SM上，SM以32线程的线程束为单位执行线程。占用率——你在性能分析中会频繁看到的数值——是活跃线程束与SM最大线程束数的比值，受寄存器和共享内存压力的限制。

因此实际中：更多的SM + 更高频率 + 每个SM更优的张量核心 = 更高的吞吐量。当你调优内核（分块大小、共享内存使用量、寄存器数量）时，实际上是在调优每个SM内的工作打包效率。

参考资料：

返回捐助