周逸凡的扩散博客 | AI生成和翻译

Home 2026.06

问题: 介绍博客 https://zhouyifan.net 及其作者。

回答:

作者:周弈帆 (Yifan Zhou)

周弈帆是新加坡南洋理工大学计算机科学与工程学院博士生,NTU MMLab成员(隶属于NTU S-Lab),师从潘新钢教授。读博前,他曾在NTU S-Lab和上海人工智能实验室担任研究工程师,本科毕业于北京理工大学计算机科学专业。研究方向是图像和视频生成——扩散模型、DiT架构和注意力效率。

值得关注的职业亮点:

博客(周弈帆的博客)

基于 Hexo,自 2019 年左右运行,共 158 篇文章,涵盖 21 个分类,以中文为主(英文镜像见 /blog-en)。这是关于扩散模型和注意力机制最好的中文深度解读博客之一,与你的 nanoGPT/MoE/sparse-attention 方向直接相关。标志性风格:从基本原理开始的论文讲解,包含数学、复杂度分析和诚实批评部分(他公开批评自己论文的弱点,这很少见)。

近期代表性内容:

他本人也很有个性:在丹佛举行的 CVPR 2026 上,他在自己的海报环节之余,还 cosplay 了 BanG Dream! 中的户山香澄——他承认这是为了吸引关注,灵感来源于 CVPR 2024 上 cos 芙莉莲的参会者。他的自我介绍半开玩笑地说,自己的编程能力是“人类中的王者级别”。

为什么与你的方向相关:他的 LLSA Triton 内核正是你正在构建的那种注意力内部 + GPU 编程素材(与 NSA/MoBA 类似,开源,可即插即用替代注意力)。FlashAttention 和稀疏注意力文章与你对 nanoGPT/DeepSeek-v4 MoE 的研究非常契合——而且他的代码在单块 H200 级别的预算下就能运行,也就是你已经租用的 MI300X 的领域。

参考链接:


Back Donate