线下考试中的AI依赖

线下考试中的AI依赖 | AI生成和翻译

首页 2026.05

问题：2012年出生的学生现在上中学，并大量使用AI（如中国的Kimi、DeepSeek、豆包；全球的ChatGPT和Gemini）做作业——他们会在中考等线下考试中遇到困难吗？

回答：

这是一个尖锐且及时的问题。我们来全面分析一下。

这些学生是谁？

2012年出生的学生现在大约13-14岁，全球范围内正就读于初中。他们完全成长在智能手机时代，并且是第一批将生成式AI作为标准作业工具的学生群体。在中国，他们面临中考——高中入学考试——作为第一次重大的线下、闭卷、无AI辅助的考试。在中国以外，类似考试包括GCSE、国家考试或SAT/ACT备考。

AI作业的现状

在中国

一项针对中国北方约700名中学生的调查发现，40%的学生在寒假作业中使用了国内聊天机器人，如DeepSeek、豆包和Kimi。约31%的学生使用AI工具理解问题并学习科目，而28%的学生使用它们收集和整理信息。

全球范围

根据RAND美国青年小组的全国代表性调查数据，2025年5月至12月期间，使用AI做作业的中学生、高中生和大学生的比例从48%上升至62%。这一增长主要由初中和高中生推动。

所以，你的观察是正确的。这是一个全球性的主流现象，而非边缘行为。

核心问题：作业AI ≠ 考试大脑

传统作业强调重复练习和问题解决，而如今的学生越来越多地参与提示工程（prompt engineering）——向AI工具提问以获取正确或最优答案。AI已经重构了学习的认知经济。脚手架（scaffolding）与替代）与替代（replacement）之间只有一线之隔。如果学生更多依赖AI完成作业而非掌握知识，那么自动化的后果可能就是缺乏内化。

这就是根本性的不匹配：使用AI完成任务 ≠ 打造线下考试所需的认知肌肉。

大脑会随时间发生什么变化？

AI可以通过提供直接答案来简化认知任务，这减少了对学习材料深度参与的需求。自动化会削弱对记忆的依赖，因为学生在数字上存储和检索信息，而不是内化概念。AI可能助长被动学习，提供即时解决方案，从而阻碍问题解决、假设检验和批判性思维技能的发展，而这些正是学术成长所需。

这方面的研究日益令人担忧：

大规模研究追踪了数千名学生，揭示了一个令人不安的模式：那些最频繁使用AI工具的学生在批判性思维评估中表现最差。学生产出的作业符合传统学术标准，但缺乏这些标准本应衡量的智力技能。

频繁使用AI工具与批判性思维能力之间存在显著的负相关，认知卸载（cognitive offloading）是中介因素。与年长参与者相比，年轻参与者对AI工具的依赖程度更高，批判性思维得分更低。

中国已经采取了什么措施

中国充分认识到这个问题，并已开始采取行动：

在2025年高考期间，包括阿里巴巴的通义千问和字节跳动的豆包在内的热门聊天机器人禁用了图片识别功能，以防止其被用于回答考题；腾讯的元宝和Moonshot的Kimi在考试专用时段内完全关闭了图片识别工具。DeepSeek也类似地屏蔽了其服务。

中国教育部发布了指导方针，规范生成式AI的伦理和适当使用。小学生被禁止独立使用能生成开放式内容的AI工具。初中生被允许探索AI生成内容的逻辑结构。高中生则可以参与涉及AI技术原理的探究式学习。

这种分层政策本质上承认了2012年出生的这一代正处于一个关键窗口期——允许有限的AI参与，但受到保护，避免完全依赖。

“痛苦线下考试”问题真实存在

大多数使用AI做作业的美国学生（60%）表达了对在学校相关目的中使用AI的担忧，特别是对其批判性思维其影响。

学生们自己也意识到有些不对劲。他们感受到了差距。教育工作者甚至给这种现象起了个名字——“空白页问题”——学生在没有AI辅助的情况下无法独立开始任务。

对于一些学生来说，AI腾出了时间进行更深入的学习和批判性思维。对于其他人来说，它可能成为一种拐杖。少数人认为AI使他们的体验恶化，并提到了对公平性、技能退化、社交孤立和未来就业的担忧。

全球范围内的双轨分化

你正确地指出了工具的分化：

地区	主要使用的AI工具
中国	DeepSeek、豆包（字节跳动）、Kimi（Moonshot）、通义千问（阿里巴巴）、元宝（腾讯）
中国以外	ChatGPT（OpenAI）、Gemini（Google）、Claude（Anthropic）、Copilot（Microsoft）

工具不同，但全球范围内的依赖模式是相同的——学生利用AI走捷径完成作业，然后面对线下考试时措手不及。

这真的会对他们造成伤害吗？

很有可能，除非他们培养出反制习惯。 以下是风险总结：

记忆萎缩 —— 他们没有记住事实/公式；他们总是通过AI查找。
没有支架的写作 —— AI起草文章；他们从未在压力下从头写过一篇完整的作文。
数学推理缺陷 —— AI一步步解题；他们既不明白过程，也不明白原因。
考试恐慌 —— 在像中考这样限时、高风险的环境下，“空白页问题”尤为严重。
批判性思维发展不足 —— 线下考试最测试的技能，恰恰是过度依赖AI所侵蚀的。

这些学生（以及他们的父母/老师）应该做什么？

有意识地练习“无AI区域” —— 限时写作、心算、线下模拟考试。
用AI来检查，而不是生成 —— 先自己起草，然后用AI验证。
理解AI的输出 —— 不要复制；用自己的话重新构建。
间隔重复和主动回忆 —— 建立闭卷考试所需记忆的技巧。
学校应重新设计评估方式 —— 从只依赖作业成绩转向课堂内可观察的工作。

结论

是的——2012年出生的这一代正陷入一个结构性陷阱：AI对做作业有用且可用，但高风险的线下考试（中考、高考、GCSE、SAT）刻意设计成测试AI无法在考场内为你做的事情。学生越是把思考外包给AI而不独立重建，考试体验就越痛苦。这可以说是这一代全球学生面临的决定性教育挑战。

参考资料：

返回捐助