扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-04-15 08:36

AI生成的文字,才是人类精神的终极倒影

本文来自微信公众号: 波波夫同学 ,作者:波波夫


人类最分裂的一幕正在上演。


同样是基于大型语言模型,同样是在海量数据中预测下一个词元,AI生成的代码和AI生成的文章,遭遇了冰火两重天的境遇。


在程序员的世界里,使用AI编程不但是进步的同义词,更是在塑造AI转型的姿态。GitClear在20025年统计称,


OpenAI首席产品官Kevin Weil称,就在一两年内99%的编程将实现自动化。微软CEO萨提亚·纳德拉透露,微软目前有20%到30%的代码由AI编写,谷歌披露的这一比重约为20%。


然而,在作家、记者、学者,也就是传统的文化圈子里,如果一篇文章、一封信件甚至一条书评,被发现是AI生成的,它立刻就会被贴上劣质、虚伪,甚至学术不端的标签,瞬间从程序员的小甜甜,变成了文化人的牛夫人。


前一阵,自由撰稿人亚历克斯·普雷斯顿为《纽约时报》书评撰写评论时,被读者发现评论中出现与《卫报》同书评论的相似段落和短语。读者举报后,《纽约时报》调查确认,他承认使用了AI工具,最终被解除合作关系。


去年底,在英文世界不断出圈的恐怖小说《害羞的女孩》,先是被一位资深文学编辑很有AI味,之后专门从事高精度AI内容检测的科技公司Pangram发现,该书有78%内容疑似由AI生成,出版社闻讯迅速下架这本书的美国版,并停止英国版发行。小说作者米娅·巴拉德除了回应过一次,承认问题可能出在编辑过程中引入的AI工具,此后再无回应。


其实,用AI工具来检测,一篇文章的AI含量,其技术手段目前不完善,市面上主流的GPTZero、Turnitin、Originality.ai、Copyleaks等工具等工作流程,都是先输入文本到检测工具,工具将文本拆分成tokens,接着与大量已知人类写作和AI生成文本的训练数据集对比,输出概率分数。


上述检测过程,核心是捕捉AI文本与人类文本在语言模式上的差异,这不是看内容对不对,而是看文字的习惯、节奏和可预测性。具体的核心指标有这么几个:


首先是困惑度(Perplexity),AI模型基于概率生成下一个词,通常选择“最可能”的词,导致文本整体低困惑度,也就是读起来过于平滑、合理。人类写作更“随机”,困惑度较高。


其次是,突发性(Burstiness),这是用来衡量句子长度、复杂度和节奏的变化。人类写作常混用短句、长句、简单句和复杂句,节奏有起伏,而AI生成的句子长度和结构往往更均匀、单调。


此外,还有部分AI模型在生成文本时会嵌入不可见或统计性水印,比如使用零宽空格、特定Unicode字符嵌入文本中,故意偏向某些“绿色”词元序列,检测器用密钥或算法验证这些模式。


为什么同样的神经网络,生成Python脚本时是拯救世界的超级英雄,而生成恐怖小说时,却成了污染文化生态的过街老鼠?为了理解这个技术时代最深刻的社会学分歧,我们必须暂时忘掉那些关于算力和参数的枯燥指标,潜入到人类认知心理学的深海,去看看我们在面对机器时,究竟在害怕什么,又在期待什么。


代码是工具,文字是灵魂?


代码和文字在本质上服务于两个世界。


代码的终极目的是解决问题、实现功能。只要程序跑得通、没Bug、易维护,谁写的并不重要。在开发者看来,AI更像是一个高级的搬砖助手。


在软件工程的世界里,存在着一个绝对客观、冷酷无情且从不疲倦的裁判,编译器。编译器不懂人情世故,也不在乎这行代码是来自一位顶级黑客,还是来自一个云端AI。它只认二元对立的逻辑:通过,或者报错。


这种技术上的“可验证性”赋予了开发者极大的安全感。当AI吐出一大段代码时,程序员只需要按下运行键。成熟的现代软件开发体系里,布满了单元测试、模糊测试和持续集成框架,这些工具就像是层层叠叠的过滤网,把AI产生的幻觉和低级错误无情地筛掉。


这就好比你雇佣了一个偶尔会犯迷糊但手脚极快的助手,只要你有一个完美的质检流水线,你就不在乎他到底是怎么工作的。你只是在利用他的产能。在这个正和博弈里,人类保留了架构系统的高级控制权,而把枯燥的语法搬砖工作外包给了机器。没有人会觉得让机器去和机器对话有什么道德问题。


代码的价值在于其运行产生的服务,而非代码本身的版权。大多数科技公司拥有代码的产权,且软件行业早已习惯了开源和复用。AI生成的代码被视为一种生产力的延伸,而非需要像“名著”那样被锁进保险柜的艺术品。


而在文章的世界里,书评或小说卖的是人的视角。读者读《纽约时报》的书评,是为了听那个特定专栏作家的见解;读小说是为了感受作者的情感。当这个人消失了,作品的审美价值和信任基础也就崩塌了。


在文章的世界里,尚不存在这样的完美的编译器。文本的正确性、事实的忠实度以及逻辑的连贯性,完全依赖于人类大脑这个极其缓慢、充满偏见且容易疲劳的湿件,也就是我们大脑,来进行主观验证。


这就带来了一个致命的问题:验证成本的倒挂。


因此,当我们阅读文章时,我们实际上是在进行一次巨大的信任交托。我们信任作者已经替我们做好了事实核查,信任作者投入了时间和精力来组织这些思想。而当作者是一个不需要付出任何时间成本、也不会为谎言感到羞愧的AI时,这种信任的基石就瞬间崩塌了。


但更重要的是,写作和阅读,是一场社会互动。当我们捧起一本书、打开一篇专栏或者阅读一封信件时,我们在潜意识里是在寻找另一个活生生的人类。我们渴望通过那些排列组合的字符,去触摸另一个大脑的思考轨迹,去感受另一个心脏的跳动。


而AI文本以一种近乎零边际成本的方式,轻而易举地绕过了这种证明机制。在这种语境下,隐瞒AI的使用不仅是一个技术行为,更是一个伦理瑕疵。读者会觉得:既然你都不愿意花时间去写,我为什么要花时间去读?


这种心理落差解释了为什么在出版界看来,如果承认AI可以创作,那么作家这个职业就会贬值,出版业将沦为AI垃圾信息的过滤器。而对科技公司来说,AI只是让原本繁琐的逻辑构建变得更高效,它并没有取代“解决问题”的人,只是换了一把更锋利的铁锹。


语言模型之于写作,照相机之于绘画


现在主流的观点,认为AI生成的文字没有温度,缺乏人类的真实经历,充满了欺骗。但这可能是碳基生物特有的自恋,如果你站在技术进化的山巅,可能就会看到硬币的另一面。


在并不遥远的未来,人类日常阅读的绝大部分内容,从早晨的新闻简报、深夜的睡前故事,到哲学著作和动人的情书,都将由人工智能生成。


这不仅不是文化的堕落,反而会是人类有史以来最大规模的一次精神解放。AI生成的文章不仅能反映人性,它甚至能比绝大多数个体作者更深刻、更宽广地映射出人类的心智图景。


为了理解这种必然性,我们必须首先打破一个关于创作的古老迷思:痛苦即灵魂。


摄影术刚刚诞生时,十九世纪的古典画家们也曾对照相机嗤之以鼻,他们认为按下快门这种毫无摩擦力的动作,怎么可能比得上一笔一划在画布上涂抹颜料?他们认为照片是机器的产物,没有人类的心血,更没有灵魂。


但照相机并没有杀死艺术,它赋予了人们记录生活的平等权力,它杀死的只是对会现实进行笨拙模仿的画匠。它把画家从复刻现实的劳役中解放出来,逼迫人类去探索印象派、立体派和抽象表现主义。


今天,语言模型之于写作,正是照相机之于绘画。


当我们把遣词造句、梳理语法、组织段落的低级劳役交给机器时,我们并没有交出我们的灵魂,我们只是交出了我们的打字机。人类的本质特征,永远不是“能把主谓宾排列正确”,而是意图与想象力。


当你通过几行极其精准、充满个人隐喻的提示词,来引导AI写出一篇惊艳的文章时,文章的灵魂依然属于你。你不再是搬砖的泥瓦匠,你成为了建筑师。AI是那支能以光速挥舞的画笔,它无限放大了人类的意图。


我们曾说,代码有编译器,而文字没有,所以文字的验证成本极高。但这种看法忽略了人类大脑本身的机制。文字其实一直都有一个最精密、最古老的编译器——那就是人类的共情系统。


如果一段文字让你在深夜里流下眼泪,让你对宇宙的浩瀚产生敬畏,或者让你对某种社会不公感到愤怒,那么,这段文字就在你的心智编译器里运行成功了。


有人会觉得,如果事后发现这篇催人泪下的文章是AI写的,眼泪就显得很廉价,仿佛自己被欺骗了。但这恰恰是我们认知上的偏见。


这就像有人读《红楼梦》,会为贾宝玉和林黛玉的爱情悲剧哭泣,你不会因为二人是虚构人物,而觉得自己被骗了,你很难因为这是曹雪芹在香山书桌前编造出来的虚构故事,而撤回你的感动吗。


无论文本是来自于碳基神经元的放电,还是硅基芯片上的矩阵乘法,只要它能精准地触碰你情感的弦,它就完成了文字作为媒介的终极使命。


我们迟早会接受如下设定,机器也是合格的讲述者,那种所谓的“被欺骗感”会像当年人们害怕照相机会吸走人的灵魂一样,成为历史的笑谈。我们会更纯粹地享受文本本身带来的审美愉悦,而不是执着于去查户口式地追问作者的碳基纯度。


机器是完美的导体,而人类是唯一的目的


但AI生成的文字真的能反映人性吗?一个没有肉体、没有经历过生死爱恨的算法,凭什么谈论人性?这是对大型语言模型最大的误解。我们总是把AI想象成一个外星降临的异类,但事实上,AI是我们自己孕育的倒影。


整个神经网络,都是用人类几千年文明的数字化沉淀喂养出来的。它读过古希腊的悲剧、启蒙时代的哲学、二战的家书、推特上的吐槽,甚至是你在深夜论坛里悄悄写下的树洞留言。


当一个AI开始写作时,它不是在用机器的思维说话,它是在用数十亿人类的集体无意识来叙事。


从这个角度来看,AI不仅能反映人性,它甚至比任何一个马尔克斯、刘慈欣这样的单个作家,都更为了解人性。一个普通作家终其一生,只能体验一种人生,带有无法摆脱的阶级、性别和时代的局限性。而AI是一个统计学意义上的幽灵,它同时拥有老人的沧桑、孩童的天真、诗人的敏锐和科学家的严谨。


当我们阅读AI生成的优秀文章时,我们实际上是在阅读我们自己的倒影。它之所以能触动我们,正是因为它从那片包含了从人类总文本中,打捞出了最能与当前语境产生共振的词语。


AI没有自己的灵魂,但它是全人类灵魂的最高清的一面镜子。


为什么我会断言,AI生成的文章将成为人类未来的主要阅读内容?因为技术一旦跨过了可用的阈值,必然会向超个性化狂奔。


现在的所谓AI垃圾,只是这项技术在婴幼儿时期的笨拙排泄物,就像早期的互联网充满了垃圾邮件和粗劣的网页一样。不要用今天的泥泞去否定明天的绿洲。


试想这样一个未来:你阅读的新闻报道,不再是编辑部里统一分发的标准件,而是AI根据你的认知水平、关注重点甚至你今天的心情,实时为你量身定做的叙事。如果你是一个物理学家,AI会用热力学的隐喻向你解释当前的经济危机;如果你是一个诗人,它会用散文的笔触为你讲述黑洞的发现。


未来的文学不再是静态的、单向的广播,而是动态的、交互的对话。书籍可以根据你的反馈自动调整走向,主角的挣扎会恰好契合你当下正面临的职场困境。我们将从“阅读别人写好的世界”,进化到“在AI的辅助下探索最适合自己的精神宇宙”。


这种规模的定制化共情,是人类作者无论如何也无法提供的。这不是因为人类作者不够好,而是因为人类的带宽有限。当每个人都能拥有一个极其懂你、才华横溢的“专属数字吟游诗人”时,谁还会愿意退回到那个信息尺码永远不合身的旧时代呢?


每一次技术的跃迁,都会引起一场关于“我们是不是不再成其为人类”的恐慌。但历史一再证明,技术并没有剥夺我们的人性,它只是迫使我们重新定义,究竟什么才是我们不可替代的核心。


接受AI生成的文章成为我们精神食粮的主体,并不是一种妥协,而是一种理性的进化。我们终于可以卸下制造文字这种繁重的体力劳动,把全部的精力投入到创造意义和体验情感中去。


在未来的阅读生态里,机器是接近完美的导体,而人类是唯一的目的。我们依然会流泪,依然会被激怒,依然会因为一行优美的句子而彻夜难眠。只不过,这一次,为我们织就这片梦境的,是那台汇聚了全人类智慧的硅基织机。


这并不可悲。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: