2026-07-04 13:43

AI时代的Taste其实很简单,喻颖正:把自己当大模型训练

author_path 混沌学园
头图

本文来自微信公众号: 混沌学园 ,作者:混沌学园,原文标题:《AI时代的Taste其实很简单!喻颖正:把自己当大模型训练》


让我们想象一个饭局。桌上坐着很多当代社会的聪明人,门打开,苏格拉底和苏东坡走了进来。哪怕他们来自两千多年前,能接触到的信息远少于今天的普通人,他们仍然很可能迅速成为席间最有智慧、最有趣的两个人。


为什么?


苏格拉底和苏东坡的大脑都像是一个大模型,靠反复、自我对弈和长时间思考,用极少的数据形成了极深的参数。当这个模型撞上新的现实信息,也能够快速反馈处理进行迭代。


在堂课,我们讨论的一个核心问题是:当AI可以替人完成越来越多工作,我们究竟还应该训练什么?


答案不是掌握更多工具和提示词,而是训练属于自己的Taste。


纠正对AI的四个误读,建立“你×AI”的双智能系统


AI时代好像很多东西都被替代了,但有一样东西不仅没有贬值,而且还在升值。这一样东西就是判断力。AI正在重新给人的能力定价。


写方案、做PPT、生成内容、编写代码、进行竞品分析等等,这些过去被视为专业能力的“做事类”工作,正在迅速变得便宜。还有一类“中等判断”,虽然需要专业知识,但也能够被结构化、标准化和复制,正处在贬值边缘。


真正变得更加稀缺的,是“选择与担当类”:选择什么方向,押注什么人,舍弃哪些机会,承担什么后果,以及如何从错误中更新自己。



在我看来,有四个最大的关于AI的常见误读:


第一个误读,是只看到外部的大模型,却忽视了自己。


每个人真正长期拥有、也最值得训练的大模型,仍然是自己的大脑。


第二个误读,是所有人都在学习怎样训练龙虾、Agent,却很少训练自己的taste。


工具会过期,模型会更新......拿开所有AI工具之后,你仍然拥有的你的Taste到底是什么?这才是最值得训练的。


第三个误读,是希望找到一台现成的AI赚钱机器。


假如真有这样的赚钱机器,你能用,别人也可以用,它就不会构成真正的优势。最好的且真属于你的赚钱机器,一定是你与AI构成的“双智能系统”:人提供目标、Taste和责任,AI提供算力、搜索、执行与反馈速度。


第四个误读,是把AI时代想象成一次暴富机会。


事实上,真正稳定的财富秘密依然是复利。工具可以放大速度,却无法替代长期积累;能够形成复利的,也不是偶然踩中一个热点,而是持续提升自己的判断质量。


我们应该要把这四个误读一一正过来,真正回答四个问题:你是什么?你到底该训练什么?你应该如何连接使用AI?以及,如何实现你的人生复利。


以前我们说“失败是成功之母”,在AI时代,我们可以有另一种解释:失败是一种训练成本。


比如OpenAI去年净亏损几百亿美元,但是相对于训练出一个这样强的AI,以及公司可能创造的价值,这几百个亿的成本是值得的。


对于人来说也是一样。你的错误有多大?亏了多少?这不是重点。重点是你的将来是否配得上这笔训练成本。


由此假如我们每个人都是一台需要去训练的大模型,那在某种意义上来说,我们不是在思考,而是在运行。自己这台模型有可能在运行中变得越来越强,也有可能被磨损变得越来越差。


Taste是你的模型参数,但最关键的在目标函数


为了下一步能够动手去训练自己这台模型,我们首先要知道这个“模型结构”大致包括五个部分:


第一是训练数据。你读过的书、见过的世面、爱过的人、遭遇的亏损、承担的责任和摔过的跟头,都是训练数据。真正影响人的,往往不是听过多少道理,而是哪些经验进入了身体,并留下不可轻易抹去的反馈。


第二是模型参数,也就是Taste。它包括价值观、习惯、品性、默认常识和潜意识中的选择倾向。当来不及详细分析时,一个人最后依靠的,往往就是这些长期积累的参数。


第三是上下文窗口,也就是此刻的注意力与工作记忆。同一个人,在注意力涣散和高度专注时,会作出完全不同的判断。注意力不仅是一种时间管理能力,也是模型此刻能够调用哪些信息的边界。


第四是目标函数。到底想要什么?最不愿失去什么?用什么定义成功和失败?目标函数一旦混乱,努力越多,越可能奔向一个自己并不真正想要的结果。


第五是反馈回路。以上所有的东西,撞上现实后,根据误差来不断更新自己。对于我们每一个人来说,尤其是创业者,可怕的不是失败,而是任何反馈都被解释为“我们的大方向没有问题”,或者都理解为自我否定。真正有效的反馈,既不自我粉饰,也不把一次失败扩大为全部人生。



很多时候,我们以为自己正在自由思考,实际上是在运行一套早已形成的参数:某些经历让我们本能地信任一种人,某些失败让我们回避一种选择,某些奖励机制让我们重复同一种行为。要改变判断,就不能只修改一次结论,而要看清结论是怎样生成的。


我们都希望自己越来越聪明,希望像乔布斯、马斯克那样。那么到底什么是聪明?如果把聪明单纯理解为反应快、记忆好、计算能力强,那在AI时代,这些能力正在迅速被机器超过。


事实上,聪明不是一把尺子,而是一道阶梯。这个“阶梯模型”至少包含五层:算力、压缩、校准、目标、自我重写。


信息不会让你变聪明,撞上现实产生误差才会。苏东坡的一生,就是一次又一次自我重写。从乌台诗案到黄州、惠州、海南,每次被贬都是昂贵而诚实的误差反馈。它们不仅让他调整某个具体判断,更逐渐改变了他用什么尺度衡量人生。


我要说的是,人和机器的最大的差别其实是在“目标”这个圆心。AI大模型的目标函数是工程师给的,人的目标是自带的。人最原始的目标是“活下去”,但慢慢地会进化成被“追求意义”驱动,每次输出都会改变你要承受的世界。这就是AI作为工具和人作为主体的一个最大区别,也就是我们这套类比的边界所在。


Taste不是审美品味,而是一种选择力


当AI让“做出来”越来越便宜,“决定做什么”就越来越昂贵。如果AI让所有人都能够做出60分的东西,拉开差距的不是产出速度,而是谁知道什么值得做到95分。


Taste是一个有点大的词,常被翻译为品味。但其实它不是用来审美的,是用来选择的。我们可以把它解释为是某种选择力:在岔路口,选这个而不选那个的判断质量。


AI时代商业中的Taste,可以简化为两件事:选方向,选人。


乔布斯并不是苹果所有技术的最佳工程师,但他在选方向时能够砍掉大量产品,选择图形界面、智能手机等重要方向,也能够选择与自己性格和能力高度不同的库克作为接班人。马斯克虽然具有很强的技术理解力,真正关键的工作同样是选择火箭回收、纯视觉自动驾驶等方向,并聚集能够把判断变成现实的人。他本质上也是做好了选方向和选人这两件事。


Taste不是天赋式玄学,而是一组可以训练的能力。它由五个相乘的零件构成:


Taste=压缩×校准×取舍×下注×迭代。


这就是我要重点说的“Taste的五件闭环”方法论。是相乘,不是相加。任何一项为零,整体都可能失效。


第一件事,压缩。


压缩不是概括,而是找到生成规则。假如此生只能反复解决一个问题,你愿意把一生交给什么?过去做过的事情中,是否存在一条反复出现的暗线?哪些事情即使没有奖励,你仍然愿意投入?


第二件事,校准。


校准要求我们不仅作出判断,还给判断标上诚实的置信度。不要只说“我觉得这个方向会成功”,而要说“我有六成把握认为它会成功”。概率迫使人承认不确定性,也让反馈能够真正被记录,并实现校准复利。


第三件事,取舍。


完美不是无可添加,而是无可删减。AI的天性是发散:给出更多方案、更多内容和更多下一步。人的责任则是收敛,把二十个可能性砍到一个真正值得做的方向。取舍的困难,在于拒绝总意味着放弃眼前可能获得的收益,尤其是在增长迅速、掌声最多时主动踩刹车。


第四件事,下注。


不承担后果的判断,只是评价。Taste必须押上真实代价:时间、声誉、金钱、职业路径或机会成本。正因为世界充满不可计算的不确定性,人必须在信息不充分时作出选择。这个环节有两个关键点:既要敢下注,又要活得久。


第五件事,迭代。


迭代的核心,是让判断可以被证伪。写下自己的结论、置信度、什么事实会证明它错误,以及在什么时间复盘。只有这样,失败才会转化成模型更新,而不是模糊的情绪。


这五件事首尾相接,才构成完整的Taste闭环。每转一圈,更准一圈。


理解人与AI的关系,可以借用小说《挽救计划》中的故事:人类科学家Grace遇到外星生物Rocky,双方生存环境、感知方式和身体结构完全不同,甚至无法共享空气,却因为能力互补而共同完成拯救各自星球的任务。


他们之所以能够彼此拯救,不是因为相似,而恰恰因为不同。


人和AI也像两个隔墙协作的物种。人拥有目标、意义、身体经验和对后果的承担;AI拥有算力、速度、记忆、搜索和持续执行能力。人的弱项往往是AI的强项,而AI结构性的缺失,也正是人的价值所在。


所以,最好的AI应用,不只是把它当作一个工具,也不只是做一个带AI功能的产品,而是你和AI构成一个“双智能系统”,并在Taste五件闭环中各有分工。用一句话概括就是:把苦活交给AI,把Taste留给自己,把后果扛在自己身上。


拿到任何一个任务,我们首先必须作为人类完整地独立思考一遍。因为AI不会自动提高生产力,它只会放大一个已经会拆解、验证和复盘的系统。


如果一个人没有独立思考的能力,AI可能只是噪声放大器;如果一个组织没有明确目标和反馈机制,引入更多智能体也可能只是让混乱运转得更快。


在这里可以和大家分享一个小技巧,就是用AI来做你的反方合伙人。不要让AI来证明你做出的判断,而是去证伪。当你能够很好应对AI的反驳、批评、怀疑的时候,你的思考才更有价值。当然,AI可以做反方和助理,但最终的判断权依然是在你这里。


判断的结果是,形成我们的人生复利


我们训练自己的模型、建立Taste、接上AI,最终并不是为了追逐技术本身,而是为了让我们的一生能够过得更好、获得更好的复利。


现在,我们正在进入一个特别未知的时代:AI时代的最大特征不是确定,而是不确定。通用人工智能究竟是否已经到来,人类目前并没有形成共识;AI备受关注,却仍然缺少足够多已经稳定创造价值的产品;机器的能力迅速增长,但社会如何吸收这种能力成为生产力仍然模糊。


按照海德格尔的观点,技术从本质上就是人无法完全控制的东西,它一旦展开就有自己的逻辑了,甚至反过来有可能重新安排我们。


实际上,AI也正在把人类分裂成极端的两极分化:让一些人变得更聪明、更富有,让另一些人逐渐外包思考、丧失提问和面对复杂问题的能力。


越是在这种时候,人越不能把自己变成机器。我们真正需要守住的,是机器没有的部分,也就是我们说的两端:


一端是追寻意义。这个世界到底应该造什么?效率提升之后,人真正想过怎样的生活?


另外一端是压方向。在没有答案、概率不明的路口,根据历史、大局观和价值判断选择一个方向,并承担它。


我们前面说的所有内容其实就是一件事:你要能够把你一生的判断,变成一个谁也拿不走、还会自己形成复利的一个长期资产。


而这件事情必须基于你知道“我要做的事情到底是什么,我的人生母题是什么?”。在一个充满变化的的环境里,只有你能够守住你自己的母题,才能够实现自己的真正的人生复利。


回到最开头说的苏格拉底和苏东坡。这两个人都处在一个数据极少的时代,但却能够拥有非常非常深的智慧,关键就在于他们这的一生都在训练自己那台模型,以至于令他们的智慧能够穿越千年。


我不知道在AI变得越来越强大之后,人类会留下哪些东西?但是我几乎可以肯定地说,可能再过1000年,苏格拉底和苏东坡被未来的人类铭记的可能性,比现代的很多事情被记住的可能性会更大。


但是这点也许对我们每个人来说也给我们的一个启发,就是也许在这样的一个喧嚣的时代,我们依然值得铭记苏格拉底和苏东坡的智慧,过一种充满醒察的人生。


我们可能会面临各种各样的人生的波折和起起伏伏,这些都是我们人生中特别重要的一部分。重点在于我们能否真诚地经历这些体验,以及用这些体验能够让自己的大模型变得越来越好。



课程结束,为自己建立一个72小时行动契约


  • 第一,砍掉一件低价值事项。建立一条“不做清单”,用一次真实拒绝训练取舍。


  • 第二,让AI成为反方陪练。把一个重要判断交给它攻击,而不是让它替你证明自己正确。


  • 第三,设计一个能够快速得到现实反馈的小实验。无论结果对错,都必须形成一次完整的预测、行动、反馈和更新。


工具会迭代,热点会过去,外部模型会越来越强。但最终决定一个人能否实现长期复利的,仍然是那套谁也拿不走、并且能够持续自我更新的判断系统。


每个人都是一个独一无二的模型。现在,为自己的大模型命名。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。