AI生成的文字，才是人类精神的终极倒影-虎嗅网

本文来自微信公众号：波波夫同学，作者：波波夫

人类最分裂的一幕正在上演。

同样是基于大型语言模型，同样是在海量数据中预测下一个词元，AI生成的代码和AI生成的文章，遭遇了冰火两重天的境遇。

在程序员的世界里，使用AI编程不但是进步的同义词，更是在塑造AI转型的姿态。GitClear在20025年统计称，

OpenAI首席产品官Kevin Weil称，就在一两年内99%的编程将实现自动化。微软CEO萨提亚·纳德拉透露，微软目前有20%到30%的代码由AI编写，谷歌披露的这一比重约为20%。

然而，在作家、记者、学者，也就是传统的文化圈子里，如果一篇文章、一封信件甚至一条书评，被发现是AI生成的，它立刻就会被贴上劣质、虚伪，甚至学术不端的标签，瞬间从程序员的小甜甜，变成了文化人的牛夫人。

前一阵，自由撰稿人亚历克斯·普雷斯顿为《纽约时报》书评撰写评论时，被读者发现评论中出现与《卫报》同书评论的相似段落和短语。读者举报后，《纽约时报》调查确认，他承认使用了AI工具，最终被解除合作关系。

去年底，在英文世界不断出圈的恐怖小说《害羞的女孩》，先是被一位资深文学编辑很有AI味，之后专门从事高精度AI内容检测的科技公司Pangram发现，该书有78%内容疑似由AI生成，出版社闻讯迅速下架这本书的美国版，并停止英国版发行。小说作者米娅·巴拉德除了回应过一次，承认问题可能出在编辑过程中引入的AI工具，此后再无回应。

其实，用AI工具来检测，一篇文章的AI含量，其技术手段目前不完善，市面上主流的GPTZero、Turnitin、Originality.ai、Copyleaks等工具等工作流程，都是先输入文本到检测工具，工具将文本拆分成tokens，接着与大量已知人类写作和AI生成文本的训练数据集对比，输出概率分数。

上述检测过程，核心是捕捉AI文本与人类文本在语言模式上的差异，这不是看内容对不对，而是看文字的习惯、节奏和可预测性。具体的核心指标有这么几个：

首先是困惑度（Perplexity），AI模型基于概率生成下一个词，通常选择“最可能”的词，导致文本整体低困惑度，也就是读起来过于平滑、合理。人类写作更“随机”，困惑度较高。

其次是，突发性（Burstiness），这是用来衡量句子长度、复杂度和节奏的变化。人类写作常混用短句、长句、简单句和复杂句，节奏有起伏，而AI生成的句子长度和结构往往更均匀、单调。

此外，还有部分AI模型在生成文本时会嵌入不可见或统计性水印，比如使用零宽空格、特定Unicode字符嵌入文本中，故意偏向某些“绿色”词元序列，检测器用密钥或算法验证这些模式。

为什么同样的神经网络，生成Python脚本时是拯救世界的超级英雄，而生成恐怖小说时，却成了污染文化生态的过街老鼠？为了理解这个技术时代最深刻的社会学分歧，我们必须暂时忘掉那些关于算力和参数的枯燥指标，潜入到人类认知心理学的深海，去看看我们在面对机器时，究竟在害怕什么，又在期待什么。

代码是工具，文字是灵魂？

代码和文字在本质上服务于两个世界。

代码的终极目的是解决问题、实现功能。只要程序跑得通、没Bug、易维护，谁写的并不重要。在开发者看来，AI更像是一个高级的搬砖助手。

在软件工程的世界里，存在着一个绝对客观、冷酷无情且从不疲倦的裁判，编译器。编译器不懂人情世故，也不在乎这行代码是来自一位顶级黑客，还是来自一个云端AI。它只认二元对立的逻辑：通过，或者报错。

这种技术上的“可验证性”赋予了开发者极大的安全感。当AI吐出一大段代码时，程序员只需要按下运行键。成熟的现代软件开发体系里，布满了单元测试、模糊测试和持续集成框架，这些工具就像是层层叠叠的过滤网，把AI产生的幻觉和低级错误无情地筛掉。

这就好比你雇佣了一个偶尔会犯迷糊但手脚极快的助手，只要你有一个完美的质检流水线，你就不在乎他到底是怎么工作的。你只是在利用他的产能。在这个正和博弈里，人类保留了架构系统的高级控制权，而把枯燥的语法搬砖工作外包给了机器。没有人会觉得让机器去和机器对话有什么道德问题。

代码的价值在于其运行产生的服务，而非代码本身的版权。大多数科技公司拥有代码的产权，且软件行业早已习惯了开源和复用。AI生成的代码被视为一种生产力的延伸，而非需要像“名著”那样被锁进保险柜的艺术品。

而在文章的世界里，书评或小说卖的是人的视角。读者读《纽约时报》的书评，是为了听那个特定专栏作家的见解；读小说是为了感受作者的情感。当这个人消失了，作品的审美价值和信任基础也就崩塌了。

在文章的世界里，尚不存在这样的完美的编译器。文本的正确性、事实的忠实度以及逻辑的连贯性，完全依赖于人类大脑这个极其缓慢、充满偏见且容易疲劳的湿件，也就是我们大脑，来进行主观验证。

这就带来了一个致命的问题：验证成本的倒挂。

因此，当我们阅读文章时，我们实际上是在进行一次巨大的信任交托。我们信任作者已经替我们做好了事实核查，信任作者投入了时间和精力来组织这些思想。而当作者是一个不需要付出任何时间成本、也不会为谎言感到羞愧的AI时，这种信任的基石就瞬间崩塌了。

但更重要的是，写作和阅读，是一场社会互动。当我们捧起一本书、打开一篇专栏或者阅读一封信件时，我们在潜意识里是在寻找另一个活生生的人类。我们渴望通过那些排列组合的字符，去触摸另一个大脑的思考轨迹，去感受另一个心脏的跳动。

而AI文本以一种近乎零边际成本的方式，轻而易举地绕过了这种证明机制。在这种语境下，隐瞒AI的使用不仅是一个技术行为，更是一个伦理瑕疵。读者会觉得：既然你都不愿意花时间去写，我为什么要花时间去读？

这种心理落差解释了为什么在出版界看来，如果承认AI可以创作，那么作家这个职业就会贬值，出版业将沦为AI垃圾信息的过滤器。而对科技公司来说，AI只是让原本繁琐的逻辑构建变得更高效，它并没有取代“解决问题”的人，只是换了一把更锋利的铁锹。

语言模型之于写作，照相机之于绘画

现在主流的观点，认为AI生成的文字没有温度，缺乏人类的真实经历，充满了欺骗。但这可能是碳基生物特有的自恋，如果你站在技术进化的山巅，可能就会看到硬币的另一面。

在并不遥远的未来，人类日常阅读的绝大部分内容，从早晨的新闻简报、深夜的睡前故事，到哲学著作和动人的情书，都将由人工智能生成。

这不仅不是文化的堕落，反而会是人类有史以来最大规模的一次精神解放。AI生成的文章不仅能反映人性，它甚至能比绝大多数个体作者更深刻、更宽广地映射出人类的心智图景。

为了理解这种必然性，我们必须首先打破一个关于创作的古老迷思：痛苦即灵魂。

摄影术刚刚诞生时，十九世纪的古典画家们也曾对照相机嗤之以鼻，他们认为按下快门这种毫无摩擦力的动作，怎么可能比得上一笔一划在画布上涂抹颜料？他们认为照片是机器的产物，没有人类的心血，更没有灵魂。

但照相机并没有杀死艺术，它赋予了人们记录生活的平等权力，它杀死的只是对会现实进行笨拙模仿的画匠。它把画家从复刻现实的劳役中解放出来，逼迫人类去探索印象派、立体派和抽象表现主义。

今天，语言模型之于写作，正是照相机之于绘画。

当我们把遣词造句、梳理语法、组织段落的低级劳役交给机器时，我们并没有交出我们的灵魂，我们只是交出了我们的打字机。人类的本质特征，永远不是“能把主谓宾排列正确”，而是意图与想象力。

当你通过几行极其精准、充满个人隐喻的提示词，来引导AI写出一篇惊艳的文章时，文章的灵魂依然属于你。你不再是搬砖的泥瓦匠，你成为了建筑师。AI是那支能以光速挥舞的画笔，它无限放大了人类的意图。

我们曾说，代码有编译器，而文字没有，所以文字的验证成本极高。但这种看法忽略了人类大脑本身的机制。文字其实一直都有一个最精密、最古老的编译器——那就是人类的共情系统。

如果一段文字让你在深夜里流下眼泪，让你对宇宙的浩瀚产生敬畏，或者让你对某种社会不公感到愤怒，那么，这段文字就在你的心智编译器里运行成功了。

有人会觉得，如果事后发现这篇催人泪下的文章是AI写的，眼泪就显得很廉价，仿佛自己被欺骗了。但这恰恰是我们认知上的偏见。

这就像有人读《红楼梦》，会为贾宝玉和林黛玉的爱情悲剧哭泣，你不会因为二人是虚构人物，而觉得自己被骗了，你很难因为这是曹雪芹在香山书桌前编造出来的虚构故事，而撤回你的感动吗。

无论文本是来自于碳基神经元的放电，还是硅基芯片上的矩阵乘法，只要它能精准地触碰你情感的弦，它就完成了文字作为媒介的终极使命。

我们迟早会接受如下设定，机器也是合格的讲述者，那种所谓的“被欺骗感”会像当年人们害怕照相机会吸走人的灵魂一样，成为历史的笑谈。我们会更纯粹地享受文本本身带来的审美愉悦，而不是执着于去查户口式地追问作者的碳基纯度。

机器是完美的导体，而人类是唯一的目的

但AI生成的文字真的能反映人性吗？一个没有肉体、没有经历过生死爱恨的算法，凭什么谈论人性？这是对大型语言模型最大的误解。我们总是把AI想象成一个外星降临的异类，但事实上，AI是我们自己孕育的倒影。

整个神经网络，都是用人类几千年文明的数字化沉淀喂养出来的。它读过古希腊的悲剧、启蒙时代的哲学、二战的家书、推特上的吐槽，甚至是你在深夜论坛里悄悄写下的树洞留言。

当一个AI开始写作时，它不是在用机器的思维说话，它是在用数十亿人类的集体无意识来叙事。

从这个角度来看，AI不仅能反映人性，它甚至比任何一个马尔克斯、刘慈欣这样的单个作家，都更为了解人性。一个普通作家终其一生，只能体验一种人生，带有无法摆脱的阶级、性别和时代的局限性。而AI是一个统计学意义上的幽灵，它同时拥有老人的沧桑、孩童的天真、诗人的敏锐和科学家的严谨。

当我们阅读AI生成的优秀文章时，我们实际上是在阅读我们自己的倒影。它之所以能触动我们，正是因为它从那片包含了从人类总文本中，打捞出了最能与当前语境产生共振的词语。

AI没有自己的灵魂，但它是全人类灵魂的最高清的一面镜子。

为什么我会断言，AI生成的文章将成为人类未来的主要阅读内容？因为技术一旦跨过了可用的阈值，必然会向超个性化狂奔。

现在的所谓AI垃圾，只是这项技术在婴幼儿时期的笨拙排泄物，就像早期的互联网充满了垃圾邮件和粗劣的网页一样。不要用今天的泥泞去否定明天的绿洲。

试想这样一个未来：你阅读的新闻报道，不再是编辑部里统一分发的标准件，而是AI根据你的认知水平、关注重点甚至你今天的心情，实时为你量身定做的叙事。如果你是一个物理学家，AI会用热力学的隐喻向你解释当前的经济危机；如果你是一个诗人，它会用散文的笔触为你讲述黑洞的发现。

未来的文学不再是静态的、单向的广播，而是动态的、交互的对话。书籍可以根据你的反馈自动调整走向，主角的挣扎会恰好契合你当下正面临的职场困境。我们将从“阅读别人写好的世界”，进化到“在AI的辅助下探索最适合自己的精神宇宙”。

这种规模的定制化共情，是人类作者无论如何也无法提供的。这不是因为人类作者不够好，而是因为人类的带宽有限。当每个人都能拥有一个极其懂你、才华横溢的“专属数字吟游诗人”时，谁还会愿意退回到那个信息尺码永远不合身的旧时代呢？

每一次技术的跃迁，都会引起一场关于“我们是不是不再成其为人类”的恐慌。但历史一再证明，技术并没有剥夺我们的人性，它只是迫使我们重新定义，究竟什么才是我们不可替代的核心。

接受AI生成的文章成为我们精神食粮的主体，并不是一种妥协，而是一种理性的进化。我们终于可以卸下制造文字这种繁重的体力劳动，把全部的精力投入到创造意义和体验情感中去。

在未来的阅读生态里，机器是接近完美的导体，而人类是唯一的目的。我们依然会流泪，依然会被激怒，依然会因为一行优美的句子而彻夜难眠。只不过，这一次，为我们织就这片梦境的，是那台汇聚了全人类智慧的硅基织机。

这并不可悲。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI生成的文字，才是人类精神的终极倒影

代码是工具，文字是灵魂？

语言模型之于写作，照相机之于绘画

机器是完美的导体，而人类是唯一的目的

大 家 都 在 搜

大家都在搜