我获得了第一名,但感觉是污名和不应得的:大学AI作弊危机背后

这封邮件突然出现:这是大学行为规范团队的信件。


阿尔伯特,一名19岁的本科英语学生,不知道该怎么反应。他被指控使用人工智能完成一份评估作业。如果他不出席听证会来回应教授提出的指控,或者不回复邮件,他将自动在该模块中不及格。问题是,他并没有作弊。

阿尔伯特对此感到非常沮丧。虽然这可能不是他最好的作品,但他在这篇论文上努力了很久。他肯定没有使用AI来写它:“因为一些‘指示性短语’,如‘此外’和‘相反而言’,而受到指控让我感到非常受辱。”指控的后果在他脑中不断回响——如果他在这个模块不及格,他可能不得不重修整整一年——但为自己辩护时的羞辱感更让人难以承受。“因为一篇写得不好的论文被指控使用AI,这对我整个模块的努力来说简直是重大的侮辱,”他说。“我努力学习,成绩通常都是A——一下子因为一篇糟糕的论文,就让我被怀疑使用AI?”

在听证会上,阿尔伯特坐在三名工作人员面前——两名来自他所在系的人员,还有一名观察人员。他们告诉他,听证会将被录音,并询问了他的姓名、学号和课程代码。接着,他们对他的作业进行了半小时的询问。距他提交论文已有数月,他感到无法自如回答这些问题,但他尽力而为。工作人员问他,是否曾经创建过ChatGPT的账户?还有Grammarly?阿尔伯特在发言结束时才感到能够为自己辩护,而这时他已经快要哭了。“我甚至向他们承认,我知道论文写得不好,但我没有使用AI,”他表示。

自从Chat GPT-3问世以来,已经过去了四年。这款由旧金山的OpenAI开发的工具,已对电影、媒体、医学等多个行业造成了影响,而教育领域也不例外。它使几乎任何人能够根据简单的输入在几秒钟内生成合格的书面作品。如今,许多类似的工具可供使用,例如谷歌的Gemini、微软的Copilot、Claude和Perplexity。这些大型语言模型吸收和处理庞大的数据集,如同人脑一般,以生成新材料。对于学生来说,这就如同一位24/7的私人导师,随时提供帮助,对于教育者而言,却是一场噩梦。

根据高等教育政策研究所的调查,超过一半的学生现在使用生成AI来帮助完成评估,约5%的学生承认使用它进行作弊。11月,《时报高等教育》报道称,尽管“记录保存情况不佳”,拉塞尔集团大学的作弊案件似乎正在飙升,其中一些大学报告的作弊数量增加了15倍。但对于这些工具是否应该使用,甚至如何使用,学术界的混淆在这些建立在信任基础上的机构之间播下了怀疑的种子。有些人认为,AI有望彻底改变学习方式,比如一个24/7的私人导师——类似于HAL教授;而另一些人则认为,它对整个学习体系构成了生存威胁,被称为“教育的瘟疫”,正如《Inside Higher Ed》的一篇评论所言,这将彻底毁灭学术探究的过程。

在试图把这个基于科技的“精灵”重新放回瓶子里的斗争中,各大学卷入了一场愈演愈烈的科技军备竞赛,甚至开始借助AI来努力抓捕不当行为。教师们对学生,学生们彼此之间也日益产生了对立,勤奋努力的学生则在这场风波中受到了波及。这使得许多人对高等教育的未来感到悲观。但是,究竟是ChatGPT带来的问题,还是更深层次的因素在造成这些动荡?

阿尔伯特并不是唯一一个被错误指控使用AI的学生。多年来,学术界反作弊的主要工具一直是诸如Turnitin之类的软件,这些软件扫描提交的作品以查找抄袭的迹象。2023年,Turnitin推出了一种新的AI检测工具,评估文本中可能由AI撰写的比例。

在应对AI撰写作业激增的背景下,这似乎是一剂“魔法灵药”。自那时起,Turnitin已经处理了超过1.3亿篇论文,并表示已标记350万篇文本为80%由AI撰写。但是,它也并非100%可靠;有广泛报道指出假阳性,而且一些大学选择了退出。Turnitin声称其错误率低于1%,但考虑到学生人数之庞大,许多人发现自己进入了火线也不奇怪。

还有证据表明,AI检测工具对某些族裔存在偏见。斯坦福大学的一项研究发现,许多AI检测器对非英语母语者的作品的标记被标记为61%,而对英语母语者的则只有5%(Turnitin并不是这项研究的参与者)。上个月,《彭博商业周刊》报道了一名被AI检测工具错误标记为使用AI的自闭症谱系障碍学生的案例。她形容被指控作弊就像一记“重拳击中肚子”。神经多样性学生、用更简单的语言和语法写作的人似乎在这些系统中受到不成比例的影响。

英越大学的生成AI研究员迈克·珀金斯博士认为,AI检测软件存在“显著局限性”。“所有研究反复表明,这些工具不可靠,”他说。 “而且它们很容易被蒙蔽。”他自己调查发现,AI检测器检测AI文本的准确率为39.5%。运行简单的文本篡改技巧后,准确率下降了至22.1%。

那些决定作弊的学生不会简单地从ChatGPT上复制粘贴文本,他们会对其进行编辑或做成自己的作品。此外,还存在AI“人性化”工具,如CopyGenius和StealthGPT,后者声称能够生成不可被检测的内容,并声称帮助50多万名学生撰写了近500万篇论文。“唯一不这样做的学生就是那些在学业上真的很艰难的人,或者是不愿意或无法支付最先进的AI工具费用的学生,比如ChatGPT 4.0或Gemini 1.5,”珀金斯说。“最后你抓到的往往是那些本就处境艰难,学业生涯受到损害风险最大的人。”

如果有人了解这种感觉,那就是艾玛。一年前,她原本期待收到课程作业的成绩。然而,一封邮件在她的收件箱中响起,通知她她得了零分。“涉嫌抄袭”,邮件中写道。作为一名单亲妈妈攻读艺术学位的她,那一年一直在挣扎。在学习、照顾小孩、家务之间,她还抽空申请兼职工作以维持生计。面对堆积如山的截止日期,她被ChatGPT的诱惑慢慢吸引了过去。当时,她感到松了一口气——一篇完成的作业现在出现在她面前。现在,她却感到恐惧。

艾玛在使用生成AI之前并没有多想。她没有时间。社交媒体上关于AI的热烈讨论不断激荡,当一场生病使她在学习中落后,心力交瘁时,她决定更仔细地看看它能做些什么。登录ChatGPT后,她能够快速完成分析的最后部分,把它们放入论文中,然后继续前行。“我知道我所做的是错误的,但那种感觉被疲惫完全压倒了,”她说。“我已经没有力气再去给出更多,但我必须提交一份完整的作品。”当她的导师在屏幕上调出Turnitin生成的报告时,看到整整一段文字被标记为AI生成,她感到除了坦白之外别无选择。

她的案例被送往不当行为小组,但最后她幸运了。显然她的减轻情节得到了考虑。尽管令她感到吃惊,特别是因为她承认使用了ChatGPT,但小组最终决定特定的抄袭指控并不能被证实。

这是一个解脱,但更多的是一种羞辱。“我得到了那个学年的第一名,”艾玛说,“但它感觉受到玷污和不应得。”这次经历让她感到震撼——她的学位和未来悬于一线——但她相信大学应该更意识到学生面临的压力,并更好地帮助他们驾驭这些陌生的工具。“学生使用AI的原因有很多,”她说,“我希望他们中的一些人没有意识到他们使用它的方式是不可接受的。”

不论是否作弊,怀疑的氛围在校园内投下了阴影。一名学生告诉我,他们被卷入了一场不当行为听证会——尽管他在Turnitin的AI检测工具上的得分很低——因为一位导师坚信该学生使用了ChatGPT,因为他的一些论点以列表形式结构化,而这正是聊天机器人所倾向的。尽管他最终被清除,整个过程依旧使他“精神受到了影响。”他的信心遭到重创。“我连拼写检查工具都不敢使用来帮助编辑我的作业,因为我太害怕了。”

许多学者似乎相信,“你总是能够知道”一项作业是否是由AI撰写的,他们认为能够识别出与这些工具相伴随的风格特征。越来越多的证据表明,他们可能高估了自己的能力。雷丁大学的研究人员最近进行了一项盲测实验,使用该大学自己的考试系统提交ChatGPT撰写的答案:94%的AI提交作品未被发现,并且得分高于人类提交的作品。

学生们也开始彼此之间产生对立。大卫,一个本科生,同样要求匿名,他在做一个小组项目时,收到了一位课程同学的作品,感觉异常光鲜。大卫解释说,这名学生的英语水平存在困难,“这不是他们的错,但报告绝对是我见过的最好的一篇。”大卫将这篇作品放入几个AI检测器中,确认了他的怀疑,然后他礼貌地向该学生提出了这个问题。该学生当然否认了。大卫觉得自己无能为力,但他确保“收集证据”以备深入交流时使用。“所以,如果我们的课程作业被标记,我就可以说我有检查。我知道有很多人为了这个花了几个小时,而仅仅一个人就可能毁掉所有人的努力。”

大卫并不是一个反对AI的人。他发现它在复习中很有用,将学习文本输入并要求ChatGPT反问他。 但他周围无处不在的作弊现象令人沮丧。“我对这一切已变得麻木。”他说。“班级中一半的学生展示的显然不是他们自己的作品。如果我对每一个AI被使用的情况都做出反应,我现在可能已经崩溃了。”最后,大卫认为学生们只是在自欺欺人,但有时他也在思考,这种诚信的侵蚀将如何影响自己未来的学术和职业生涯。“如果我进行硕士学习,或者工作时,大家都是通过作弊到达那里的……那该怎么办?”

什么算作弊,最终是由机构和考官决定的。许多大学已经在调整评估方法,制定“AI积极”政策。以剑桥大学为例,生成AI的适当使用包括用于“概念的新概要”、 “作为一个协作教练”,或“支持时间管理”。该大学警告说,过度依赖这些工具可能会限制学生发展批判性思维技能的能力。我所咨询的一些讲师表示,这种方式是有帮助的,但另一些却表示这是一种妥协。一位讲师表达了对她的大学似乎不再重视学术不端的沮丧;她收到了一个“耳语警告”,不再将怀疑使用AI的案例提交给中央纪律委员会。

他们都一致认为,转向不同形式的教学和评估——一对一辅导、口试等等,将使学生更难使用AI来完成艰巨的工作的。“如果我们真心想要真实地评估学生,而不仅仅是让他们通过一年的9000英镑课程而无怨无悔,那我们就需要这样做。”一位红砖大学的讲师告诉我。“但这意味着要增加教师数量,或者减少学生人数。”他所在部门的压力如此之大,以至于连讲师都承认使用了ChatGPT来快速编写研讨会和辅导计划。难怪学生们也这样做。

如果说AI作弊危机暴露出获得学位过程的交易性,那么高等教育日益市场化,大学在追求学生的过程中束缚了质量学习。与此同时,学生们自身也面临着财务压力,清楚地意识到安全的毕业生职业机会愈加稀缺。正如代写机构的兴起与2000年代高等教育的迅速扩展相伴而生,ChatGPT的崛起恰逢当代学位显得更加贬值。

学生作弊的原因很复杂。研究指出,如表现压力、时间管理不善或简单的无知等因素也都在其中。而且,这也受到大学文化的助推——而当一家机构被认为未认真对待作弊时,情况必然加剧。但在处理作弊时,我们的最终答案往往还是:师生关系。博士保拉·迈尔斯在最近一篇关于学生为何作弊的论文中写道,“这是至关重要的”,并在帮助减少学术不端的案例中“发挥着强大的作用”。而现在,看起来人际互动匮乏的地方,AI便填补了这一空白。

阿尔伯特在焦急等待两个月后终于得知,他通过了该模块。虽然松了一口气,但他却无从得知那篇被怀疑的论文是否被降分。但无论如何,伤害已经造成。他原本就对大学感到格格不入,并考虑辍学。这次不当行为听证会让他最终做出了决定,并选择转学到另一所学校进行他的第二学年。

这段经历在许多方面都代表了他在大学的时光,他表示。他对教授没有先与他沟通论文感到沮丧,也对在学习期间缺乏向学生求助和获取支持的机会感到失望。对于AI,他持中立态度——他认为使用AI进行学习和做笔记是可以的,只要不是用于提交的工作。他相信,问题的核心在于,高等教育的方式过于冷漠。“大学应该停止将学生视为数字,而更应该视为真实的人。”

一些名称已被更改。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

我获得了第一名,但感觉是污名和不应得的:大学AI作弊危机背后

https://www.gptnb.com/2024/12/16/2024-12-15-auto1-n0TJLU/

作者

ByteAILab

发布于

2024-12-16

更新于

2025-03-21

许可协议

You need to set install_url to use ShareThis. Please set it in _config.yml.
You forgot to set the business or currency_code for Paypal. Please set it in _config.yml.

评论

You forgot to set the shortname for Disqus. Please set it in _config.yml.