计算机视觉尚不及人类水平 | AI生成和翻译

Home 2025.06

王垠的博客文章指出,即便是2019年的先进计算机视觉系统,也远未达到人类水平。文章认为这些系统在基础物体识别(如识别汽车)方面存在困难,且容易受到对抗样本或细微图像修改的干扰,而人类却能轻松识别物体。王垠提出该领域过度夸大进展,由于系统处理和理解图像的根本性局限,真正的人类级计算机视觉仍然难以实现。

事实果真如此吗?

截至2019年10月文章发表时,王垠的论点基于当时计算机视觉的发展状况是成立的:

但文章语气过于绝对,声称“根本不存在人类级别的计算机视觉”,这忽略了特定任务取得的进展:

关键评估

王垠的核心主张——2019年的计算机视觉未达人类水平——基本符合事实。当时的模型确实缺乏人类视觉的泛化能力、鲁棒性和直觉理解。但其对技术进步的否定可能过于悲观:

这篇文章作为对AI能力过度宣传的批判至今仍具参考价值,但未充分考量该领域的飞速发展。截至2025年,虽无单一信源确认已实现“人类级”视觉,但两者间的差距已显著缩小。


Back Donate