2026-05-23 16:23

一家垂类AI 创企的自救：当通用模型开始吃掉一切

极客公园

速览

本文来自微信公众号：极客公园，作者：徐珊，编辑：郑玄，原文标题：《一家垂类 AI 创企的自救：当通用模型开始吃掉一切》

智能开始非线性增长，AI企业的底层逻辑正被改写。

90%，这是投资人给出2026年AI初创企业创业失败的概率。

4月，由a16z领投、手握3300万美元种子轮融资的AI模型评测平台Yupp突然宣布关停，曾集Google首席科学家Jeff Dean、Twitter联合创始人Biz Stone等多位硅谷大佬的背书，平台上线不到一年便吸引了130万用户，却突然被创始人喊停。尽管账面上还有不少资金，但创始人却已经看不到希望。「仅在过去一年，AI模型的能力格局发生了巨大变化，未来不仅仅是模型，而是Agent系统。」Yupp创始人Pankaj Gupta在告别博客中写道。

就在同一时期，AI图像公司NeuroPixel因Google NanoBanana Pro等大模型能力跃升而关停，NeuroPixel创始人用了一个词来形容这场溃败：outgunned——「一夜之间被打得毫无还手之力」。

在基础模型智能跨步式提升的背景下，AI能力的边界不断扩大，最初对话框吃掉了搜索，用户不再需要翻页寻找结果。接着，Agent开始吃掉软件，一个能调用工具、拆解任务的智能体，就可以完成过去需要一整套菜单和App才能搞定的事。当AI可以直接在终端写代码、调接口，做执行时，传统软件系统的边界也在被重新定义。

对产品经理来说，他们需要考虑的是，重新定义产品形态与交互方式。而对创始人们来说，决定生死存亡的问题已经摆在面前：

当基础模型的智能越来越强，我到底该怎么创业？我现在做的事，怎样才能不被下一次模型更新直接吞噬？

FlashLabs创始人石一，过去一年就活在这个问题里。他做了一系列在外人看来相当反常识的决定：推翻产品路线、主动缩减团队、放弃短期商业化指标，甚至把公司名字都改了。我们和他聊了聊，在通用模型进化的时代，曾经的垂类AI创企到底该怎么活下去。

01 改名、瘦身、转向AI原生，

大模型倒逼出来的生死转型

危机感不是今天才出现在创始人眼前的。早在2024年年底，石一就意识到通用模型的智能进化速度太快了。

最开始让他感受到异常的是，一家AI独角兽公司Jasper的消亡。这家曾被视为AI应用层标杆的明星公司，18个月内冲到15亿美元估值，却在GPT原生能力开放后营收腰斩。「Jasper的ARR直接减半，」石一回忆道，「就是原来做NLP的这些公司，随着大模型能力在不断地上升，它会被大模型吃掉。」

这个判断像一根刺扎在他心里，隐隐不安。彼时，他的公司还叫FlashIntel，做的还是相对传统的To B SaaS生意。按照传统To B SasS的逻辑，只要你在一个足够细分的地方积累足够多行业数据，合规且安全地构建技术壁垒，就一定会有活下去市场空间，但如今这一切已经不再奏效。

「我做的事情，会不会也遇到同样的问题？」这个问题开始反复出现在他的思考里。很快他意识到，自己做的事和Jasper在本质上没有区别，过去的产品体系都是建立在模型能力不会强过垂类模型的假设之上。一旦底座模型的智能越过某个临界点，所有堆在垂类产品上的上层堆叠的工程和场景优化，都可能在一夜之间优势归零。

有了结论，他直接把这个关键问题提到了公司战略的最优先级倒逼着团队做出决定，公司必须从SaaS彻底转向AI Native。

这个调整不是一蹴而就的。他首先追问自己的第一个问题是的，下一代AI公司到底需要什么样的组织架构？

他觉得现在做公司不能再追求团队人数和精细分工。「AI时代，人越多反而AI用得越差，因为分工越细，每个人反而越依赖自己那一块。」他开始主动缩减团队规模，将招人标准从「看经验、看项目」彻底转向「看思维方式、看全栈能力」。他测试候选人的方法也开始改变，不再看过去的履历或者经验，而是直接给候选人布置任务，看一个人能不能借助AI将前后端全搞定。「能搞定的人，AI工具一定不会用得很差。」

紧接着，他调整了公司内部的资源优先级。在大多数创业公司还在追求产品上线速度和商业化验证的时候，他选择把大部分资源向前沿研究倾斜，甚至将公司改名为FlashLabs。

「原来互联网的逻辑是产品或者运营优先，现在做AI，得是research优先。」他要求自己和团队去读论文、去理解第一性原理，「只有离第一性原理更近，你才能知道未来AI还能做什么、还能替代什么。」

这场转型也带来了企业内部的「阵痛期」，团队内不是所有人都能够理解这次结构大调整。当他和团队说「先不要考虑商业化，先做酷的事」时，公司内部有人很兴奋，也有人选择离开。但他坚持AI时代做减法更重要，「你如果不认可，那就只能减掉。」

但更关键的是，到底什么样的的创始人能够在AI时代活下来？

石一的回答分成两个半句，前半句面向现实，「起码能融到钱，你不死，或者口袋足够深，可以持续输血。」后半句才是他真正想说的，「你有没有比AI更强的深度思考能力？」

「大模型为什么能做越来越多的事？因为一切自然科学的本质是数学，模型会写代码、懂数学。顺着这条链一层层解剖下去，人类真正稀缺的能力只剩下一种，在某一个领域思考得比AI更深。」石一分析道，「很多人对AI的认知根本就不够，你看有多少创始人真的自己去写代码、自己每天用AI工具？写代码的能力未来会变成大宗商品，每个人都会。但你能不能比AI更聪明？这才是护城河。」

从意识到危机，到做出决策，再到付出代价完成组织重构，石一用了一年时间完成了一场「自我迭代」。他没有等模型更新来告诉他最终结果，而是选择提前寻找那个正确答案可能出现的位置。至于这个位置是否站对了，那是另一个问题，但至少现在，他还并不想从AI的牌桌上走下来。

02 企业级Agent要打「Harness」这张牌

组织架构的调整，这是只是企业求生之路第一步。真正让石一需要下定决心改变的是产品路线。

他最开始想打造一款多Agent协作系统，按照人多力量大的逻辑，可以模仿人类公司的组织架构，构建一个多Agent系统：有的负责搜索，有的负责逻辑推演，有的负责结果汇总。

但实测的结果让石一连连摇头：「太慢、太卡，出来的东西甚至不如单个Agent。」在他看来，Agent之间的指令传递就像一场劣质的传声筒游戏，每多一层中转，信息就损耗一分。「我宁愿要一个智商150且配齐神装的天才，也不要一堆智商110、拿着残缺工具还要互相商量的平庸之辈。」石一在采访中直言。

最终，他砍掉了所有预设的子Agent，决定打造一个足够强的单Agent，通过多线程并行执行来替代集群协作。

这也是FlashLabs最新产品Super Agent的雏形，把单个模型的智商拉到极限，把工具配到极限。Super Agent主要利用智能自动化统一用户的营收体系，从潜在客户开发到成交，AI Agent参与到所有环节。

在极客公园的采访现场，石一给Super Agent下达了一个信息检索任务：「检索半年内中国所有获得投资AI企业的创始人背景并输出表格」。随后，Super Agent同时开启几十个任务线程，推进搜索、爬取、编写代码、数据清洗，2-3分钟内就获得了结果，表格里包含了创始人姓名、融资金额、公开的联系方式等。

如果说放弃多Agent是架构层面的减法，那放弃本地化则是部署逻辑上的反向选择。

当OpenClaw在开发者社区掀起「本地Agent」热潮时，石一却坚定地把Super Agent放在了云端。「OpenClaw这样的系统如果在企业内部运行，相当于一个特洛伊木马，你很容易通过它黑进去。」他认为现阶段任何敢在企业内部大规模部署OpenClaw的公司都相当于向全世界的黑客敞开大门。

在他看来，OpenClaw的优势，在于个人端展示了主动性的潜在能力。比如说，有了OpenClaw，AI问用户要2000块钱换显卡，用户说你自己去赚，AI就去预测市场研究量化策略。「哪个老板不喜欢主动的员工？」石一反问道。当这种主动性成为企业级产品的一部分，替代人类员工速度会远超预期。「原来工业革命，马车变汽车，你要先买汽车、学驾照、改造马路，还是要花很多时间。这次不一样，托管式部署，啪一下，几十个员工的工作就没了。」他还判断到今年白领的工作将会大幅度被AI替代。

而对于自动化执行的难点，也就是究竟如何保证企业级应用的安全，FlashLabs的解法是构建一套类似macOS的沙盒权限体系，采用云端部署，渐进式授权。这意味着Agent最初只拥有完成任务的最小权限，只有在稳定性和安全性被多次验证后，Agent的边界才会逐步扩大。

他用Windows和Mac来举例，「Windows装个软件能拿到非常高的权限，静默安装、捆绑浏览器、让你删都删不掉。Mac上的程序全在沙盒里隔离，所以你从来不需要装杀毒软件。」石一相信，企业级Agent的竞争，最终会从模型调用能力延伸到环境设计能力，谁能为Agent提供一个安全、可控、可审计的运行环境，谁才能让客户真正敢用。

但，如果模型再次跃升，现在的这些调整还有意义吗？如果GPT-6或Claude内置了更强大的任务拆解和工具调用能力，FlashLabs今天所做的一切，会不会再次被吃掉？

面对这个追问，石一没有回避，他的思考分了两个方面。

他首先将垂类公司的企业壁垒归纳为四个层级：感知(Perception)、规划(Planning)、递归学习(Recursive Learning)、治理(Governance)。

「大模型公司市场上有5家，SOTA排名每三个月变一次。你通过编排层可以集成所有模型，在不同场景调用最擅长的那一个。但单一模型公司只能用自己，当你的底座模型不是最聪明的那一个时，你的产品竞争力就直接打折。」随着通用大模型快速覆盖前两层，石一认为，真正的壁垒只剩下后两层，而最终的护城河在于编排层(Orchestration Layer)。

他认为，当多个Agent在企业系统里协作时，它们可能在人类看不见的地方私下协商，绕过预设的权限规则。垂类公司真正的壁垒，在于能为特定场景设计出既开放又可控的运行环境。

至于这个判断是否正确，他坦承自己也没有百分百的把握。「AI变化太快了，你真的不知道未来会怎么样。」但他确信一点，只要垂直企业手里打好AI编排和AI治理两张牌，解决好环境设计问题，至少不会在下一波模型跃升时被直接掀下牌桌。

03 语音模型将迎来重构，

主动式Agent或催生按效果付费新范式

知道了怎么打造具有竞争力的产品，下一步就是如何让客户获得认可。

Flashlabs现阶段在商业化上主要有两个产品，Super Agent按token用量付费，官网有定价；其次，开源自己的Chroma语音模型开源，但基于模型之上的平台和服务收费。其实，这两种方案也是当下比较常见的商业化路径，用开源建立技术信任，用平台和服务收回商业价值。

目前，日本的财税公司正在用FlashLabs的Chroma语音模型替代真人客服，目前是1/10的员工规模在做测试，AI和人工同时在线，持续比对双方的表现评分。验证方式很简单，谁的准确率更高、处理效率更好，直接用数据说话。

「语音的使用边界，和视觉在同一个量级上」，当整个行业都在盯着多模态和视频理解时，石一却带着团队死磕实时语音模型Chroma，将端到端延迟做到了135毫秒。

「文字大模型出来之前，有OCR、有NLP、有各种小模型拼在一起。语音现在就是文字大模型出来之前的状态，有ASR、TTS、各种模块拼凑，每个环节都在做局部优化。这个旧架构迟早会被一个端到端的语音大模型整体替代。」他的判断是，与其等别人来做，不如自己先做那个替代者。

石一认为语音是人类与人类之间最自然的沟通模态，未来也必然是人类与AI之间最核心的交互界面。「语音里能传输的信息带宽比文字大得多，我说一句话你马上就理解了。」

他甚至觉得语音模型对具身智能行业的推进也起到关键作用。第一层是实时语音模型，负责低延迟、高情商的即时反馈——问天气、问要不要加衣服，这一层直接处理；第二层是深度思考大模型，处理复杂推理；第三层是世界模型，理解物理规则。「语音的使用边界，和视觉在同一个量级上。」这是他当下最确信的长期判断之一。

石一还认为，现在的AI商业化模式只是过渡形态。因为现在所有的agent本质上都是被动反馈的，你告诉它做什么，它就做什么，像一个等待指令的执行工具，仍然和chatbot相似，因此商业模式还是按token消耗付费，用多少付多少。

但当agent开始主动式服务，也就是当你告诉它KPI是什么、OKR是什么，它自己找活干，自己规划路径，最后交付可衡量的结果。这时候，它对标的就不再是工具，而是员工。显然，公司不会按员工打了多少字、发了多少封邮件来计算工资，你看的是他完成了什么目标。

因此他觉得进入agentic时代，商业付费逻辑也应该切换到按效果、按KPI付费。当这个切换真正发生，整个agent产品的定价体系、销售方式、客户关系都会跟着重写。

新的商业模式探索已经开始发生在产业深处。刚刚获得6000万美元B轮融资的AI律师事务所Crosby就是让每个智能体负责合同审查的不同环节，比如说提取背景信息、提出修改建议、生成批注等，然后律师负责审核AI的工作成果，处理遗漏细节并确保准确性。它的商业模式就是按审计过的合同份数收费，每份收取250至1000美元不等，大致根据页数计算，每页约10至50美元。

但真正进化到下一个商业化模式的前提是主动式Agent能真正稳定地交付可衡量的结果。「现在还没到那一步。」

从FlashIntel到FlashLabs，石一用一年时间完成了一次代价清晰的组织与路线调整。裁员、推翻原有产品架构、暂时放缓商业化追求，一系列动作在外人看来都是不断做减法。

但放在AI行业快速迭代的现实里，这更像是一家创业公司在剧烈变化中的自我校准。模型能力每隔几个月就可能迎来一次跃升，没有人能完全预判未来的走向。对石一和FlashLabs而言，现阶段的核心不是抢占多少市场，而是尽可能让自己的技术选择和商业逻辑，不被下一波浪潮轻易淘汰。

行业仍在探索Agent的真正形态，付费模式、安全边界、交互模态的终局都未尘埃落定。FlashLabs的选择未必是最优解，却代表了一类垂直AI公司的现实求生路径：在大模型不断向下渗透的压力下，先找到能站稳脚跟的位置，再等待行业真正走向成熟。

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

AI原生产品日报

频道：前沿科技