多线程Word2Vec 2倍加速 | AI生成和翻译

Home 2026.06

完成。已推送至 origin/main

变更内容:

在 M2 Air 上的性能表现(text8,词汇量 71k,维度=200):

Config Words/s Time (5 epochs)
-threads 1 344k ~240s
-threads 8 740k ~127s

约 2 倍加速。受限于内存带宽——所有线程读写相同的 71k×200 权重矩阵。瓶颈在于共享缓存争用,而非计算能力。

使用方法:

cargo run --release -- word2vec train -input corpus.txt -output vec.bin -threads 8

Back Donate