扫码打开虎嗅APP
本文来自微信公众号:惊蛰青年,作者:晓洋,编辑:Felicia,校对:遇见,头图来自:《天才枪手》
上周三,正值许多高校期末考期间,ChatGPT突然崩溃。
据OpenAI的事故报告称,这次ChatGPT崩溃从北美太平洋时间12月11日15:16开始,直到19:01所有功能才全面恢复。有网友锐评:“ChatGPT崩溃四小时,全球科研倒退十万步。”
在语言不通的异国他乡,留学生早已把ChatGPT尊为“Chat老师”,日常写论文、打代码频频“叨扰”,期末考期间和论文作业截止日期前,学生们更是恨不得长住在Chat老师的对话框里。
Chat老师究竟有什么魅力,使万千学生心甘情愿拜入其门下?学生人手一个Chat老师,人类老师对这件事怎么看?据说,因为Chat老师的出现,还发生了一些“罗生门事件”……
学生:Chat老师是我的独孤九剑
论文截稿最后一小时,该冲刺总结重点了,留子们盼着再抱一抱ChatGPT的大腿,高喊着:“我需要你,恩师求你睁开眼吧。” 面对着屏幕前的出错提示,不少学生陷入了自我怀疑:“不会吧?该不会是我把Chat老师搞崩了吧?”最不凑巧的是,有人在网络期末考中途赶上了ChatGPT的宕机。
留子们的哀嚎,不仅在“美国版贴吧”Reddit”里久久回荡,而且跨越重洋,传至祖国的社交平台。北京时间12月12日9:30,话题#ChatGPT崩了#冲上微博热搜,最高排名跻身第6位,吸引了4280多万的阅读量。
Chat老师悄悄摸鱼了几个小时,学生们就难过至极。
作为一款海外AI工具,ChatGPT的崩溃上了热搜。(图/微博)
两年前没有ChatGPT的时候,大家不也照常科研,照样活着通过期末考吗?为什么人们如今却为了Chat老师的罢工要生要死?自称离不开ChatGPT的留子表示:“对不起,我是在它出生后才开始做科研的,就像先有马、后有车,我会开车却不会骑马一样。”没有Chat老师帮助润色,哪怕给导师手敲一封英文邮件,一些留子也会感到如履薄冰。
总之,时代不同了,两年可以改变很多东西。无论是打工人还是学生,都越来越离不开生成式AI,尤其是首先占据了赛道的ChatGPT。不少学生习惯了有问题就找Chat老师,而不是咨询真人老师。这次ChatGPT崩溃被热议,也从侧面反映出许多学生依赖它来辅助学习,甚至直接靠它来完成作业。
OpenAI于 11月14日发布了《学生使用ChatGPT写作指南》(A Student's Guide to Writing with ChatGPT)。指南的开头写道:“如果使用得当,ChatGPT可以成为一个强大的工具,帮助学生培养严谨思维和清晰写作的技能,协助他们思考创意、掌握复杂概念并得到写作草稿的反馈。”
OpenAI发布的《学生使用ChatGPT写作指南》。(图/OpenAI官网)
看完指南里的12条写作建议,小红书网友@巴比龙Dylan表示“感觉自己像是穿越到了论文写作的武林秘籍中,Chat老师简直是我的独孤九剑。”
对此,真人老师却连连摇头。
由于英语学术词汇量的局限,有学生会觉得ChatGPT生成的论文比自己写的更有学术范儿,“人家好歹用的是学术词汇,我写出来纯属科普文章” 。然而,留子自认为的“学术感”,在真人老师眼里却是一股恶心的AI味。
老师:AI写的作业,一股馊味
朱昊在美国高校从事计算机专业教学3年,授课对象包括本科和研究生。多次碰到那些用ChatGPT写的学生作业后,他忍不住发帖吐槽:“改AI写的作业真的巨恶心,就像喝了假奶,隔着屏幕都能闻到一股馊味。”
具体来说,这股“AI馊味”就是文章中夹杂大量重复、无意义的话语。有的学生的作业中会直接复制粘贴ChatGPT生成的内容,连“作为AI的看法(As an AI)”等明显字眼也没有删除。
以前老师要抓学生互相抄作业,现在则要对学生使用AI的程度做判定。“敷衍应付的学生年年都有,打低分就完事了。现在我需要判断(是否直接用AI写作业),然后再找证据。为这,我还得把车轱辘话看好几遍,你说恶心不?”朱昊说道。
通常来说,朱昊会把疑似用AI写作业的学生名字记下来,接着对比他/她的数次作业,方初步判定他/她是否存在学术不端,然后尝试与其沟通,讲清楚个中厉害。在一两周布置一次作业的频率下,这种“找AI”的麻烦事,往往占据了大半个学期。
学生用没用AI?老师头疼。(图/《猫鼠游戏》)
每次课堂考试后,朱昊会尝试与考砸了的学生沟通。除了发挥失常的情况,很多依赖AI完成作业的学生一到考试就现形了。朱昊解释:“知识滑过大脑,(学生)没自己花时间想过,容易记不住。”
在朱昊看来,适度AI益脑,沉迷AI伤身。如果学生没法把“学习”和“完成作业”这两步分开,那么最好不要使用ChatGPT。要是作业都是AI写的,老师可能很难及时通过作业来获得学生学习情况的反馈,继而无法调整课堂内容,甚至可能会产生误判而把考试难度设置得过高。
学习本是一个老师和学生通力合作的渐进过程。记忆会因为情感价值的体验而加深,而这些体验几乎往往是通过人与人之间的交流、个人的反思沉淀来促成的。一旦学生赖上了ChatGPT,传统教学模式可能就失灵了。
过去20多年来,维多利亚·利文斯通(Victoria Livingstone)都在给大学生上写作、文学和语言类课程。她最近在美国《时代》杂志上发表文章,将自己辞掉老师工作的主因归结为ChatGPT等大模型的出现。
维多利亚·利文斯通的文章发表在9月底的《时代》杂志上。图/Time
批改学生交上来的文章时,利文斯通觉得更多时候不是在给学生写评语,而是向AI提反馈。学计算机的博士生们清楚知道大模型的回答存在虚构和捏造,然而,他们还是照样将研究笔记丢给Chat老师,请其来代笔。
利文斯通还发现,QuillBot这样的AI改写工具会改变文本的原意,使表述出现偏颇。在课堂上,她试过把AI的输出与学生的原始写作并置分析。只可惜,学生们都不以为然,或者说看不出语词间的微妙差别。
除了教与学的循环外,学习的最终效果也是老师们所看重的要点。接受公众号“青年志”的采访时,中国人民大学新闻学院传播系主任刘海龙表示自己不会禁止学生使用AI,但会要求学生把人与AI共创的过程都展示出来,包括具体的提示词、AI修改前后的内容等。
刘海龙认为:“AI目前没有办法替代人的思考,也没办法替代学生去做访谈、调查和收集问卷。如果你所有的答案都是 AI 回答的,那么你自己其实并没有在思考的过程中形成理解。一个道理是很容易明白的,但你怎么有条理地去思考它,怎么通过叙事将它论证清楚?这是更难的。”
无论是写论文,还是写作业,关键很可能是“写”的过程。写作并不完全是将头脑中明确存在的思想进行转录,相反,写作是与思考紧密相连的过程。美国科幻小说作家姜峰楠曾写道:“使用ChatGPT完成作业就像把一台叉车带到健身房,这样你永远不会提高你的认知能力。”
非英语母语作者,竟是“AI先天圣体”
靠AI写的论文作业无法代替思考,甚至可能给学生招来麻烦。
哪怕紧跟《ChatGPT学生写作指南》,学生们仍然可能被AI给坑到。人工智能自动化处理繁琐任务的能力素来被推崇,该指南里第一条建议是——使用ChatGPT来调整文献格式,好让学生们能“把精力集中在有趣的部分”。
指南里关于参考引用的建议。(图/OpenAI官网)
对于这一建议,刚取得985高校博士学位的小四直言:“不靠谱!我只是让GPT把我的参考文献列表整理成MLA 格式(英文论文写作较常用的一种参考文献格式),它都乱来……删掉已有的文献,偷换成它编的文献。”要是小四没有仔细对照检查,极可能造成引文看起来有明显错误的后果,这惊吓效果可一点都不有趣。
有些时候,即使学生没有用AI来直接生成论文作业,也可能“AI率”拉满。有学生吐槽自己是“AI先天圣体”,好不容易逐字敲出来的实验报告,丢进AI检测器里却测出“AI含量100%”。
目前在澳大利亚留学的Chrystal,曾有一份作业被老师判为AI写作。幸运的是,她保留了小组讨论的内容,自己的英文表达也比较好,最终申辩成功。打那以后,她在提交所有作业前,都会用AI检测器过一遍。
以前期末里忙着“查重降重”,现在学生们忙着“降AI率”。社交媒体上流传着各种降低AI率的攻略,内容小至AI常用词汇替换,大到篇章段落改写的方法。然而,这所谓的“AI检测”却不一定可靠。
Face challenges和Crucial role均被认为是AI高频词。图/受访者供图
很多外国大模型一直存在某种词汇歧视问题,现在连AI检测器也“继承”了这一顽疾。SCI期刊Patterns曾发布过一项针对AI检测器准确率的研究,研究人员使用7款广泛使用的AI检测器,对91篇非英语母语者的托福作文进行评估。作为对比,他们还使用同一组AI检测工具对99篇美国八年级学生的英文作文进行了检测。
结果显示,这些检测器将非英语母语者的作文判为AI生成导致的平均误判率超过60%,而对美国学生作文的误判率仅不到一成。研究人员认为:“在社交媒体中,GPT检测器可能错误地将非英语母语者的内容标记为AI抄袭,从而令特定的非英语母语者遭遇不公正的困扰。”
小钱是正在申博的英国留子。在学术写作课上,她有一份练习是“正儿八经自己写的”,仅个别词句使用了谷歌翻译。当时老师没批改作业,表示既然是用AI改过的,他就不给改了。尽管那份作业不必算进成绩,但小钱还是有淡淡的隐忧:“真要因AI而涉嫌学术不端的话,要怎么举证?就怕老师一看一个不吱声。”
为了避免老师们秋后算账,部分学生用AI辅助写作业时会提前留一手。有人每写一部分作业就往邮箱里发一个备份,并标上时间;有人干脆转用在线文档来码字,遇到老师质疑就把历史修改记录甩过去,让老师翻看几十个版本和时间跨度;还有人笑称写作业时会录视频,顺便积攒视频素材。
AI不太靠谱,AI检测器也不太靠谱。这些不靠谱的大模型,正在侵蚀着老师与学生之间的信任,甚至蔓延到学生党经常出没的领域。广州某家留学中介发文诉苦,指出AI检测器的出现给留学顾问带来信任挑战:学生怀疑留学顾问用AI一键生成文书,而留学顾问则猜测学生提供的材料是Chat老师生成的。
资深留学顾问小张告诉新周刊记者,曾有学生拿着AI检测结果去投诉留学顾问。据GPTZero平台的检测,那份文书初稿的人工成分仅有21%,出现了较多高频AI词汇。为此,小张尝试将自己逐字敲的文段上传到GPTZero做检测,AI率竟高达80%,而另一封几乎都是AI生成的信件,反倒被判定为仅有“10%AI”。
平台检测的AI含量为10%,“实际上只有10%人工”。图/受访者供图
无论是多番打批注、来回修改的新近文书,还是十多年前的申请文书,都可能被检测出超高的AI率。小张发现:“(文书)写得越好就越AI,因为用词规范,逻辑顺畅。”然而,这种小范围的测试并不能有效自证清白,毕竟没有人会像《让子弹飞》的六子那样,用剖腹的方式证明自己只吃了一碗粉。
而Chat老师在学生党中引起的“罗生门事件”,可能仅仅是社会大众与人工智能碰撞中的一个章节的小开端。OpenAI总裁Sam Altman于 12月初透露,ChatGPT的每周活跃用户突破3亿。较早前,该公司设定的增长目标是未来一年内达到10亿活跃用户。
这回ChatGPT崩溃前夕,苹果发布了针对iOS、iPadOS和MacOS的系统更新。这意味着ChatGPT将正式登陆Apple Intelligence(苹果智能)。当苹果用户向Siri提出复杂问题,Siri会调用ChatGPT的算力提供更智能的详细回答。
Chat老师正在向更多普通人走去,进入校园、办公室,潜伏于每一个低头刷手机的瞬间。“AI版罗生门”会在其他领域复制蔓延吗?目前还不好说。
本文来自微信公众号:惊蛰青年,作者:晓洋,编辑:Felicia,校对:遇见