Whisper模型重新下载期间的下载速度

Whisper模型重新下载期间的下载速度 | AI生成和翻译

首页 2026.05

问题：如何理解在RTX 4070上Whisper large-v3模型重新下载进度中显示的速度？

答案：

你看到的是并非GPU转录速度——而是模型文件重新下载。原因如下：

UserWarning: /home/lzw/.cache/whisper/large-v3.pt exists,
but the SHA256 checksum does not match; re-downloading the file

之前缓存的 large-v3.pt 文件损坏或不完整，因此Whisper正在从互联网重新下载它。6.42 MiB/s 是你的互联网下载速度，而非GPU速度。

38%|████████████████                     | 1.09G/2.88G [01:45<04:57, 6.42MiB/s]

large-v3 模型文件大小为2.88 GB——这是完整的模型权重检查点。

下载完成后，Whisper将在你的RTX 4070上开始实际转录，这款GPU非常适合该任务。基准测试表明，在同类GPU中，RTX 4070在Whisper转录方面拥有最佳性价比。

使用 large 模型在RTX 4070上，你可以预期大约15–30倍的实时速度（例如，一个60分钟的音频文件在2–4分钟内完成转录）。

校验和不匹配通常意味着之前的下载中断。为避免重新下载：

# 下载后检查文件是否完整
ls -lh ~/.cache/whisper/large-v3.pt
# 应该约为2.88 GB

如果你希望在RTX 4070上获得显著更快的转录速度，可以考虑切换到 faster-whisper：

pip install faster-whisper

Faster-whisper 使用CTranslate2，在加载时可按大小自动从Hugging Face Hub下载模型，并支持 float16 量化以实现更好的GPU性能。

参考：

返回捐助