扫码打开虎嗅APP
本文来自微信公众号: 简写2019 ,作者:余子申
AI把供给推到了近乎无限:文章、脚本、设计稿、分析、方案,你描述一下需求,几秒钟就能得到一份“看起来很完整”的结果。
真正的变化不在“能不能产出”,而在“产出是否可信”。因为在AI时代,错误往往不是确定性的,而是概率性的;更麻烦的是,它经常以半真半假的形态出现。
所以我越来越确定一个判断:AI时代,人人都是质检。这里的“质检”不是挑刺,而是“放行责任”:什么能直接用,什么必须复核,什么必须拦截,决定权回到人手里。
1)最危险的不是“全错”,而是“半真半假”
AI最可怕的失败模式,往往不是胡说八道,而是:
细节很多、结构很顺、语气很专业;
其中一部分事实可能确实正确;
但在关键的因果链条、边界条件、时间点、口径一致性、结论落点上悄悄偏一点点。
“全错”反而好识别,因为你会本能警惕;“半真半假”最难,因为它通过了人的第一道筛选:读起来顺、像那么回事、细节足够多,于是就被直接放行。
这也是为什么质检在AI时代会从“可选项”变成“基础设施”:供给越大,半真半假的混入概率就越高;你不设关口,系统就会被概率事件击穿。
2)张文宏的案例:核心不是反对AI,而是强调“质检能力”的稀缺
2026年1月的公开讨论中,张文宏谈到医疗AI时给出一个非常克制但很有穿透力的立场:他表示在其所在医院拒绝把AI引入电子病历系统。
他的逻辑并不是“AI没用”,恰恰相反——他明确承认自己会使用AI,让它“先看一遍”,但资深医生能凭经验快速识别错误;他真正担忧的是:如果年轻医生在训练阶段就借助AI直接得到结论,培养路径会被改变,未来可能缺乏鉴别AI正误的能力。
这句话抽象出来,其实是在讲一个更普遍的结构:
AI让“答案”变得廉价,但“判断力/质检能力”依然稀缺;当质检能力不足时,半真半假最容易直接进入高风险系统。
3)供给无限时,质检目标可以从“单篇完美”转向“挑能用的”
很多人一听“质检”,默认目标是把每一份输出都修到可用。但在供给几乎无限的前提下,很多场景更优的策略反而是:
批量生成候选,然后挑能用的;不能用的就快速pass。
这套策略成立有两个硬条件:
可用率不低于阈值(例如80%):低于这个水平,挑选成本会反噬效率。
质检成本足够低:你能用很快的方式判断“能不能放行”,而不是每一份都要深度审阅。
一旦满足这两个条件,追求“所有东西都能用”就不划算了。更好的做法是:把时间从“修补每一件”抽出来,投入到更高价值的部分:更好的选题判断、更可靠的事实核验、更清晰的结构、更强的表达、更好的产品化。
我曾经做过一套视频本地化翻译的工作流,体感非常强:当小语种的可用率稳定在90%左右时,最优解往往不是继续追100%。因为从90%到100%的那10%,通常是最贵、最难、最不值得自动化的部分。更合理的是“90%直接放行+10%快速人工处理”,整体吞吐量和交付稳定性反而更好。
这就是供给无限时代的一种现实主义:不追求零缺陷,追求高通过率的生产体系。
4)关键不是“用不用AI”,而是一开始就把质检写进系统里
如果还沿用旧思路——先让AI产出、再靠人兜底——规模一上来,你就会被质检吞没,变成不停擦屁股的编辑,而不是创造价值的人。
更可靠的做法,是在工作流设计的第一步就把质检当作系统结构:加入自动质检节点,提前过滤低成本错误,同时把人的精力留给高价值判断。
我理解的人机协同会发生两个变化:
变化A:加入自动质检节点,把低成本问题先拦住
例如对来源、时间点、数字口径、内部一致性做基础校验;对明显缺失边界条件、论证断裂的内容做拦截;对高风险场景设置更严格的“不可通过条件”。
自动质检的价值不在于“保证永远正确”,而在于:把人从低价值筛查里解放出来,让人的判断力只用在真正关键的地方。
变化B:人机分工从“人生产、AI辅助”变成“AI供给、人放行”
AI更像候选生成器与初级检验员;
人更像总质检与系统设计者:定义放行标准、决定哪里该严哪里该松、在关键节点承担放行责任,并把节约下来的时间投入到更高价值的事情上。
结尾:AI时代稀缺的不是内容,而是“可信的通过率”
供给几乎无限之后,真正稀缺的不是产出,而是可信的通过率。
会用AI只是产能;能把质检前置进系统、用自动节点降低不确定性、并重塑人机协同的分工方式,才是生产力。
在这个意义上,“人人都是质检”不是一句口号,而是一种新的工作方式:让AI在该快的地方快,让人在该判的时候判。