扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
作者通过体验HUMAN3.0 AI评估模型,揭示了AI如何通过深度提问帮助自我认知,并探讨了人机交互中"诚实"的关键价值。 ## 1. 超长提示词构建的AI心理咨询师 - 3695词的提示词为AI建立"成长教练"人设,从心智、身体、精神、事业四维度提问 - 问题设计打破常规(如"用比喻形容与身体的关系"),需配合用户个性化信息实现精准追问 ## 2. 职业象限的尖锐提问揭示真相 - AI突破常规夸赞模式,直接质问"离开研究院能留下什么",暴露工作成果的短暂性 - 作者最终承认只留下非体系化案例,该象限仅获2.5分(满分3.0) ## 3. HUMAN3.0模型的分类体系 - 1.0反应型生存者:被动适应环境 - 2.0主导型构建者:有个人目标 - 3.0规则设计者:设计可复制体系 - 模型提供30天/90天/6-12个月分层发展建议 ## 4. AI评估的三大突破性价值 - 结构化提炼人生四维度三层次,超越肤浅的心理测试 - 动态追问实现"自由定性问卷",迫使直面真实答案 - 需绝对诚实才能生效,体现"心诚则灵"的交互本质 ## 5. 儿童测试暴露的AI局限 - 10岁用户贝贝拒绝遵循三国人物评价逻辑,坚持"就喜欢曹操" - AI无法处理非理性偏好,最终妥协"你说的对"并陷入长分析
2026-03-08 20:15

我的AI探索:心诚则灵

本文来自微信公众号: 橙竹洞见 ,作者:竺大炜


关于AI,最近有段挺特别的经历。


前两次折腾AI,我还得装Cursor、搭OpenClaw、配服务器。


这次简单得多——只需要复制一段提示词,扔进任何一个大模型对话框就行。


这来自朋友“黑帅”的推荐。他紧跟国际潮流,常常从X上学习先进经验。


这段提示词据说来自油管大神Dan Koe,能指导人生方向,马斯克也曾点赞。


那就试试吧。我嘴上这么说,心里想无非是AI算命之类,把话说得虚虚实实,每个人都觉得自己能对上。


黑帅把提示词贴出来——3695个词。


我吓了一跳。这是我见过最长的提示词了,已经接近一篇公众号文章的长度。


“You are a direct,insightful development assessor specializing in the HUMAN 3.0 model…”


提示词给AI建了一个人设,让它作为一个成长教练,从四个方面提问来进行评估,心智、身体、精神和事业。


对于心智,通常开头的问题是,“当你遇到一个与你根深蒂固的观念完全相反的观点时,你的第一反应是什么?是立刻反驳、感到不安,还是好奇、想弄明白为什么对方会那样想?”


对于身体,通常开头的问题是,“用一个比喻来形容过去五年里你和自己身体的关系——它是你的战友,是你的工具,是你的敌人,还是一个被你完全忽略的陌生人?”


这样的问题引发了我的兴趣,也不得不让我思考一下。


为什么说是“通常开头”呢。因为如果只给提示词,不给其他输入,AI就是这么开场的。


但如果多一些附加信息,例如描述下“我”的年龄,性别,家庭状态,兴趣爱好等,AI的提问会更具体,也更容易让“我”给出更明确的回复。


而伴随着这些信息的收集,AI无论在单个象限内的追问;还是开启其他象限的问题,指向性都会更有针对性。


有时候,问题太有针对性了,以至于我一时间难以反应,必须认认真真地思考。


它竟然看穿了我的职业焦虑


比如在“职业”象限,我们聊到工作状况,我说我当前在研究院内做用户直连,努力在体制内找到可以突破的路径,也得到一些成果。


按一般AI的个性,我以为TA会夸夸我的努力,然后转移到下个问题。


但是这次AI问:“如果你现在离开了研究院,那你觉得你真正能留下了什么?”


我突然意识到,自己做的很多事情,可能并不会留下太久。


  • 那些用研报告,很可能几个月就过期;


  • 我积累的外部用户群体,大概也不会有人愿意接手;


  • 产品探索的那些“心法”,其实也没什么传人。


..


我勉强给出的回复是:我留下一些案例。证明在传统车企做用户直连,做产品探索,也是可以做成的。虽然没那么“体系化”,没那么“合规化”,但有了实实在在的案例。


AI对我的答复还算满意,这个象限给我打了2.5分。对了,整个评估模型叫HUMAN3.0自我发现与元类型测试。它将人分为三类:


  • 1.0反应型生存者,比较被动,努力适应外部环境和规则;


  • 2.0主导型构建者,有个人目标和长期计划,不完全依赖外部评价;


  • 3.0规则设计者,能够定义自己的规则,关注结构可复制性,做长期布局。


评测最后还给出发展建议,30天,90天,6~12个月该怎么做。


我承认,我被这个简单而犀利的评测游戏刺激到了。


这是在复制“人类智慧的结构”


首先,这个评测模式很厉害。它不是那种浅薄的望文生义~“喜欢红色代表你热情奔放,喜欢蓝色代表你睿智深沉”,而是把人生的重要方面,浓缩到四个关键维度和三个层次。如果我们理解HUMAN3.0的架构,完全可以自己对自己做这样的分析。



但是,人很难真正面对自己。而且对照着笼统的大问题,很可能也给出笼统的回答。


所以,第二点,这个AI+提示词的方式很厉害。它跳出了传统问卷的限制,利用AI的能力,“定制”出千人千面的追问。


面对具体的问题,“我”就不得不给出现实的回应。就像我被问到“你到底在研究院留下了什么?”,传统问卷肯定做不到那么细。


AI的加持,实现了某种自由定性问卷的能力。


在我前两篇的探索,CURSOR编程和OPENCLAW系统部署,本质上是降低编码门槛,更快实现自动化。而这种AI+提示词的方式,本质上是AI能力+人类认知精华的结合,从而复制出一个“高级心理咨询师”。


前两者是个人能力的提升和放大,而这个,更像是在复制一种“人类智慧的结构”。


第三点,要真正使用它,前提是对AI的诚实,更是对自己的诚实。


如果“我”提供虚假或者模糊的答案,显然AI不会给出真正有效的建议。简而言之,还真是“诚则灵”。


在我和朋友们的尝试中,大多数人的反应是,“厉害,确实是那么回事”,“我的确没往那方面去努力”。


但也有人不愿意继续下去。“把提示词给我,让我回去慢慢想慢慢回答。”


其实他们被刺激得更深。


贝贝成为了AI的难题


出于好奇,我也让贝贝来试了一下。


她输入了一段自我描述:10岁小学生,喜欢跳健美操,看三国故事。


AI调整了开场问题


AI问:在《三国》故事里看到诸葛亮和司马懿这样的对手时,你崇拜诸葛亮吗?你又怎么看待司马懿这个人?是完全的“坏人”,还是一个“虽然是对手,但也有厉害之处”的人?


贝贝:我最喜欢曹操,其他人都是坏人。(贝贝完全不按AI的逻辑)


AI:你喜欢曹操什么?是他的聪明、他的霸气、他能打胜仗,还是有别的什么原因?


贝贝:都有。


AI:听到别人说“曹操是奸雄”的时候,你会觉得是别人说错了、不理解曹操,还是你会开始想“原来同一件事还可以有另一种看法”?


贝贝:我知道大家不是很喜欢曹操,但我就是喜欢曹操。


AI:如果你是曹操,赤壁之战你会怎么做?


贝贝:我不喜欢别人提起赤壁之战,为什么曹操的失败变成了千古笑话,而刘备败了那么多场却没人谈论?这不公平!


AI:贝贝,你说的对。…现在我需要一点时间,把四象限拼起来,给你一个完整的画像。



贝贝开开心心跑去撸猫了。


我在等AI。


TA还在分析人生。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

大 家 都 在 搜