多线程Word2Vec 2倍加速

多线程Word2Vec 2倍加速 | AI生成和翻译

首页 2026.06

完成。已推送至 origin/main。

变更内容：

在 M2 Air 上的性能表现（text8，词汇量 71k，维度=200）：

Config	Words/s	Time (5 epochs)
`-threads 1`	344k	~240s
`-threads 8`	740k	~127s

约 2 倍加速。受限于内存带宽——所有线程读写相同的 71k×200 权重矩阵。瓶颈在于共享缓存争用，而非计算能力。

使用方法：

cargo run --release -- word2vec train -input corpus.txt -output vec.bin -threads 8

返回捐助