No.1

2024-04-18

十字路口Crossing 十字路口

站在 AI 的十字路口，未来呼啸而来 | 我在 Q1 的 16 点观察和思考

主理人：

Koji

这是一个振奋人心的年份，科技变革一日千里，待对了地方，能轻松嗅到空气中充满了兴奋和汗水的味道。

写在前面

2024 第一季度完结，这是我近几年来输入和输出最“疯狂”的三个月。我几乎用上了所有闲暇时间进行阅读、交流和写作。

我从新年开始写公众号「十字路口 Crossing」，并启动了同名播客，发布了十几篇文章和六期播客节目。

这是一个振奋人心的年份，科技变革一日千里，待对了地方，能轻松嗅到空气中充满了兴奋和汗水的味道。

这篇文章中，我尝试将自己在 Q1 的观察和思考做一篇汇总式写作。

因为如果要说在 Q1 我最大的收获是什么？想必是「费曼学习法」 ——输出是最好的输入。

自从我带着“理解之后我要输出给别人听”的目的开始阅读和思考，不但笔记也做得更勤快了，也不自觉地将知识、观点、概念结成了一张更清晰的网。

DALL·E 生成: 站在樱花飘雪的十字路口，未来呼啸而来

❶ 未来呼啸而来，2020 年的两个信号

2020 年初，我的朋友 Indigo 在博客「Indigo 的数字镜像」中写了一篇文章，提到关于 2020 年的两个重要信号。4 年过去，回头看，很有洞察力。

1.1. 在 2020 年前的世界，科技在堵车

在 ARK 2019 年发布的白皮书中，有一张图表展示了过去两百年技术创新对经济生产力（Economic Productivity）的影响：

设想一下，如果你从 1800 年穿越到 1970 年，一定会发现人们的生活经历了翻天覆地的变化，这一切得益于电气化和汽车普及的第二次工业革命。

然而，若从 1970 年穿越至 2020 年，发达国家人民的生活，包括衣食住行、医疗和教育等方面，与七十年代的差异，并不如第一次和第二次工业革命带来的进步那般显著。

信息技术浪潮虽然催生了新一批科技巨头，但对经济生产力的影响不及前两次工业革命。在信息技术浪潮过去后，大停滞的下坡开始了。

就像 Peter Thiel 曾放在 Founders Fund 官网的那句嘲讽整个硅谷科技行业的金句：

“We wanted flying cars, instead we got 140 characters.”我们曾幻想拥有会飞的汽车，却只得到了 140 个单词（指每条 Twitter 限制长度在 140 个单词）。

在 2011 年，乔治梅森大学（George Mason University, GMU）的经济学教授和纽约时报专栏作家泰勒·科文（Tyler Cowen）出过一本在当时很有影响力的书《大停滞》。

这是一本悲观的书，书中最核心的论调是未来的二十年，我们的科技都将处于停滞状态。

1.2. 在 2020 年的第一个信号

然而，就在 2020 年 11 月，这本《大停滞》的作者却说 “大停滞可能要提前结束了”。

他的博客「Marginal Revolution」上引用了一篇推文，列举了各种令人振奋的新进步：mRNA 疫苗、SpaceX 的可回收火箭、电动汽车、数字货币，当然，也有当时还在萌芽的 OpenAI GPT-3。

1.3. 在 2020 年的第二个信号

2020 年还出版了一本畅销书，叫做《未来呼啸而来》，作者是奇点大学执行董事长彼得·戴曼迪斯（Peter H. Diamandis）。

书中介绍了风口上的 9 大指数型技术——量子计算、人工智能、网络、机器人、虚拟现实与增强现实、3D 打印、区块链、材料科学与纳米技术、生物技术，并洞察这 9 大指数型技术的互相融合会带来巨大的变革力量，将会完全重塑我们的生活方式与商业模式。

书中，他提到三个主要观点：

过去创新停滞是因为力量还在积蓄，而现在时机已经到——从 2020 开始的未来十年；

技术的融合是 1 + 1 > 2 的力量，能够带来巨大的改变；

技术进步影响的不仅仅是那个领域本身，而是整个的生活方式和商业模式。

1.4. 「AI 一年，人间十年」

从 2020 年到现在，4 年过去，任谁都不能否认，科技确实让我们看到世界将发生巨大变化的新潜力。首当其冲，自然是生成式 AI 的滔天大浪。有人戏称，「AI 一年，人间十年」。

整个 Q1，几乎每天早上醒来，都有了不起的大新闻。比如，在我写作这篇文章的这一天最值得注目的新闻是：马斯克宣布，美国的所有特斯拉车主，可以免费使用其进步巨大的自动驾驶新版本 FSD 12.3 一个月。

近日红杉在自家的 AI Ascent 2024 活动上提到，生成式 AI 的总收入约为 30 亿美元，这还不包括 F.A.N.G. 四大巨头和云 AI 提供商产生的所有增量收入。以 30 亿美元为基准，SaaS 市场花了近十年的时间才达到这一收入水平，生成式 AI 只用了一年。

❷ 美国 Q1 在发生什么？

2.1. Ark 对 2024 的预测

乐观，是 Ark Big Ideas 2024 报告的核心关键词。

乐观来自于新技术的突飞猛进，首当其冲自然是生成式 AI，尾随其后是自适应机器人、自动驾驶、可回收火箭、下一代电池、3D 打印等。

不管是它们对 GDP 和消费者剩余的逐年增长率贡献（下图 1），还是对 GPD 的整体增长率贡献（下图 2），都卓越显著。

对于 AGI 哪一年会来临的预测也在加速。在前 GPT-3 年代，人们普通认为需要 80 年；但现在，在 Ark 调校后的预测中，只需要 8 年了。

在过去的一个世纪里，撰写书面内容的成本在实际价值上一直相对稳定。然而，在过去两年中，随着 LLM 写作质量的提高，这一成本抖降。

技术创新可能具有足够的颠覆性，足以主导全球股票市值。Ark 估计 2023 年股票市值为 117 万亿，其中突破性创新市值 19 万亿，非创新 98 万亿，预计 2030 年破坏性创新市值将高达 220 万亿美元，远超非创新的 140 万亿美元。

2.2. Sora、Suno 和 Devin

Sora 在中国的大年初三发布，在朋友圈刷屏的势头不亚于初五迎财神。它展示了 Transformer 模型还能持续大力出奇迹的潜力，生成出令人瞠目结舌的惊艳视频。

除了 Sora，还有 LTX 也让我眼前一亮。如果说 Sora 只展示了肌肉能力，那么 LTX 展示出来的是让普通人也可以做导演、做出完整大片的一整套用户体验。

而我个人认为，上周发布的 AI 音乐生成 Suno v3 比 Sora 更特别一点。过去，普通人靠智能手机也能拍视频，但不可能原创一首歌。Suno 让所有人都能写歌了，这不一定能创造出穿越时空打动人心的艺术作品、也不一定会产生下一个周杰伦或下一个陈奕迅，但至少能让音乐带给人们更多欢乐：比如，《连花清瘟说明书之歌》。

我写了两篇关于 Sora 和 Suno 文章，分别访问了 5 位顶级专业视频创作者（中国头部的导演、摄影师、设计师），和 2 位音乐领域的幕后大佬（中国最厉害的音乐厂牌们的 CEO）：

Sora 喧嚣过后，理性浮现 | 我问出了这 5 位顶级创作者的真实想法

下一个周杰伦，是人还是AI？|和「有此山」CEO与「哇唧音乐」总经理聊Suno

——他们的观点各成一派。但我想所有人都会同意的是：未来以来，只是尚未均匀分布。

Devin，第一个被业界普遍认可的 AI 软件工程师。它甚至还能遇到问题后，自己跑去 Slack 上求助人类，然后回来继续写代码。10人团队，0 收入，今天的新闻是他们正在追求 20 亿美金估值的一轮融资。

Sora 团队只有 15 人，Suno 只有 12 人，Devin 只有 10 人。因为生产工具的进步、基础设施的完善，新一代的 AI 公司只需要极小规模的团队就能生产出撼动世界的产品。

2.3. 英伟达继续一骑绝尘

Q1 短短的三个月，英伟达的股价涨了 82%，带动纳指 QQQ 和标普 500 SPY 也分别上涨约 10%。

3月19日，英伟达在全球技术大会（GTC）上发布 GB200 超级芯片，该芯片号称是史上最强的 AI 芯片，拥有 2080 亿个晶体管。

一骑绝尘。

2.4. SpaceX 星舰第三次发射

SpaceX 的星舰，是有史以来运载能力最大的火箭。它最终的设计目标是实现完全可重复使用，能够在发射塔上进行控制着陆，并在发射回收后的几小时内再次重新发射。星舰可以降低太空旅行的成本，将人类送上月球和火星。

3 月份，星舰第三次发射，是我经历的少有的令人欢呼的“失败”，一次堪称成功的失败。

这是 SpaceX 对待科技探索的哲学：“星舰遵循小步快跑、迅速迭代的研发理念，不怕暴露问题，从一次次失败中快速找到技术漏洞，优化到下一代的版本中。” ——通过一次次真刀真枪的发射任务，发现问题、解决问题，提高可靠性。而不是把时间花在长期、反复的论证和测试上。

2.5. 特斯拉 FSD 12.3 的跨越式发展

特斯拉自动驾驶 FSD 新版本 v12.3 采用了全新的端到端神经网络结构，显著提升了识别和规划能力。它的驾驶更加平稳自然，更加接近人类驾驶的乘坐体验。

在自动驾驶系统，对比谷歌的 Waymo 和特斯拉的 FSD，Waymo 需要各种雷达、各种传感器，而 FSD 仅仅需要 9 个摄像头，成本明显降低。

在汽车动力方面，电动的价格也远低于传统内燃气的价格。神经网络 + 电池技术的进步融合，让自动驾驶迅速进步。

2.6. Figure 01 "具身智能"的前兆

Open AI 投资的人形机器人公司 Figure AI 展示了新型机器人 Figure 01 的演示视频。

在视频中，Figure 01 可以与人类进行流畅对话，理解人类的意图和自然语言指令；能够执行诸如拿取、放置物品等基本家务任务，并解释自己的行为。

Figure 01 的技术路线也得益于 AI 的进步，是基于端到端的神经网络控制。它的演示被认为是机器人技术的一个重大突破，展现了机器人与人类自然交互的能力，被认为是"具身智能"的前兆。

2.7. Apple Vision Pro

这可能是让最多人感到振奋的一款新产品。

说来好笑，一直不好意思分享。可能我是国内为数不多爱 Alicia Keys 的粉丝，因此我对 Apple Vision Pro 发布后的第一期待是看到 Alicia 的那段 Immersive Video。

我戴上 Vision Pro，看到 Alicia Keys 闪现在面前，缓缓唱起《No One》这首歌，“everything is gonna be alright”，我感到一股电流通过我全身般感动 ——从 14 岁开始喜欢的歌手，唱起你在 14 岁那年听的歌，站在半米开外，自信又温柔，对着你笑、对着你唱。

Performing Arts，自此改变。

❸ 中国 Q1 在发生什么？

3.1. 朱啸虎 vs 杨植麟

腾讯科技在 Q1 分别采访了朱啸虎和杨植麟，两位在 AI 领域的代表性创业者和投资人。他们都能量爆棚，但他们的能量截然不同，形成鲜明对比。

杨植麟的麟，在此刻的中国，像是凤毛麟角的麟。朱啸虎的观点是主流，适用于大多数有志于 AI 的企业家。

在这篇《中国 AI：少谈梦多赚钱》的文章中，作者写到：

AI 既是卓绝的科学竞赛，也是残酷的金钱角力。中国的 AI 事业面前是，第一，缺乏美元基金这类优质长钱。第二，英伟达最好的GPU，买不到。

其实，杨植麟和朱啸虎并不是对立的。在中国也可以做大模型，但是要基于两个真相。第一，阿里这类云计算厂家会砸钱，反正大模型买我的算力，甚至投资款都用算力支付，云计算规模上去还可以打价格战，一石多鸟，空手套白狼。第二，大模型作为基础设施，中国肯定要自主可控，不管好不好，肯定要有。

这些机会，属于杨植麟这样的，和杨立昆一起发过 paper 的天之骄子。而普通人做 AI，多听听朱啸虎说的，不要挑战高大上的科研，一定要做应用，一定要想办法快赚钱，养活自己。

正视差距反而可以摆正心态，反而可以找到信心。好好做追赶者，关注技术落地。其实，放眼全球，能追赶，能谈 AI 落地已经是一件门槛很高的事。

套用《一代宗师》的台词：今天我们不比武功，比想法。

3.2. 国产大模型肯定有戏

世界两极化，中美的大模型事业必然会独立发展。国产大模型在 Q1 也自有热闹。

月之暗面以 25 亿美金融资 10 亿美金，旗下 Kimi 凭借其卓群的体验和方便的入口（小程序、App、PC 都体验顺滑）在社媒拥有高热度。甚至 A 股市场一度掀起 Kimi 概念股热潮。

MiniMax 被盛传即将完成有阿里和红杉在内的新一轮估值超 25 亿美元的融资。

智谱、MiniMax、阶跃星辰与百川智能分别在 Q1 发布了新的模型。

上下文长度成为各家大模型的竞争要点。就在 Kimi 宣布支持 200 万字上下文长度后不久，360 宣布支持 500 万字、阿里通义千问直接免费开放 1000 万字，号称全球第一。

而开源大模型也是一条很多人选择的竞争路线，如李开复的零一万物 Yi-9B、科大讯飞的讯飞星火认知、阿里巴巴的通义千问 Qwen-72B。

还有新的“老炮”在入局。光年之外联合创始人袁进辉宣布再次创业——成立新公司硅基流动，获创新工场、王慧文等 5000 万天使轮投资。

3.3. 大厂的 C 端产品

Copy to China 的模式再次复活。

360 高调发布 AI 浏览器和 AI 搜索，对标 Arc 和 Perplexity，像素级别的“借鉴”。当然，也有中国人擅长的微创新：比如用脑图模式展示搜索结果，传递出“ AI 真厉害”的情绪价值 ——我个人不认为这个功能有什么实用价值。

大厂推出的 AI Chatbot 产品越来越多，左一个、右一个，但谁也没想到 Q1 的风头被 Kimi 全部抢走。我给孩子们的 iPad 安装了豆包，让他们和艾莎与孙悟空聊天；而一旦涉及到工作，我自己还是习惯性地选择 Kimi。

除了 AI Native 的产品，大厂们也在积极将 AI 加持到现有产品之上。阿里开启了对话式推荐产品「淘宝问问」和商品种草营销工具「绘蛙」的内测，百度也将大模型应用到了最核心的广告营销场景，剪映、美图更是不会放过机会，在核心的视频与图片编辑流程上，不断增加 AI 功能。

3.4. 明星用 AI “复活” 女儿

Q1，用 AI 复活亲人多次上榜热搜，成为了绝大多数人们提到 AI 的第一反应。

音乐人包小柏用 AI “复活” 了自己的女儿，并且很勇敢地分享了整个过程。这是值得被看见、被讨论、被理解的一个 “科技在未来将如何影响人们的爱恨情仇” 的故事。

我希望看到更多这样的故事被讲述，它们或许令人惊讶甚至费解，但通过当事人的讲述，它背后的意义将会激发人们对科技与人文的思考、甚至启迪人们的行动。

3.5. 全球化套利

由于海内外资本市场的冷暖之别 + 付费意愿的强弱之别，催生了一个极其热门的创业方向：AI + 出海。

线性资本创始合伙人 Harry 王淮提出一个「成功新配方」：全球化套利，即国际化团队 + 海外技术 + 中国的供应链(人才和生产能力) + 国际化市场。

全球化套利是一个比较 positive 的说法，但这背后其实也透露着些许无奈。很多人出海的原因，不只是因为在海外拥有优势。

❹ 我最关注的 6 个方向

那么，AI 到底给我们带来了什么机会呢？红杉在 AI Ascent 2024 会议上提到，基于大语言模型的 AI 为我们带来了三种全新的能力，可以被编织进各种应用中。

首先是创造力，这也是生成式AI的名字来源。AI 可以生成图像、文字、视频、音频等各种内容，这是之前的软件不具备的能力；

第二是推理能力，可以是单步的，也可以是多步的类似 Agent 的推理，这也是之前软件做不到的；

有了创造力和推理能力，就相当于拥有了大脑的左右两半球，这意味着软件第一次具备了类人的交互能力，这一点非常关键，因为它意味着商业模式的深刻变革。

我最关注的 6 个方向包括

AI 在消费品、营销领域如何落地？这和躺岛与新世相的业务直接相关。

Character.ai 催生出了「百 C 大战」，但我对于 AI 擦边聊天和 AI 捏动漫角色扮演兴趣不大。我更关注以 Pi 和林间聊愈所为代表的产品将如何用好 AI ，为人们提供情绪价值、甚至心理疗愈？

因为我自己已经被浏览器（Arc）和搜索（Perplexity）虏获成为重度用户，我相信自己作为 early adopter 的感受与体验，也对于 Chrome 和 Google 被颠覆掉的潜在可能性感到无比兴奋，所以我高度关注这两个领域的进展。

企业如何借助 AI 提效、搭建自己的 AI 内部应用？虽然已有 Dify 和 Langchain 为代表的中间件公司，但考虑到企业服务的复杂和长尾，机会大量存在，竞争的进度条或许才刚刚走到 0.1% 的位置。

以 Sora、Suno 和 LTX 为代表的创作工具的突飞猛进，会给我们带来什么样的新内容偶像？

AI 在法律（Harvey、EvenUp、DraftWise）、医疗（Hippocratic）、金融（Reportify）、教育（Khanmigo、Speak）四个领域如何落地？这是智力密集型行业，也是极其依赖文字创造的行业，会首当其冲被 AI 改变。

👦🏻 Koji: 如果你也对上述话题感兴趣，欢迎添加我的微信 YuanchengYang

❺ 写在最后：未来的奇迹

波士顿咨询公司 BCG 每年都会发布 Top 50 创新公司名单，持续了超过二十年。今年，他们将历史榜单的变化做成了一个交互图表。

我们日子一天天过，很容易就麻木认为世界停滞不前，日光之下无新事。实则不然，看这张图，世界显然一直充满了变革、野心与机会。就连最创新的公司们都在剧烈震荡，青山常在、绿水长流，变化从不缺席。

上周，中信出版社的编辑请我给筹备中的《金钱心理学》作者的新书《一如既往》写推荐语，我因此读到了内部预览版。书中有一章「未来的奇迹」，写了一个关于爱迪生的小故事，非常适合这篇文章的结尾：

116 年前， 1908 年，《华盛顿邮报》采访爱迪生，“创新的时代正在过去吗？”爱迪生倍感诧异：“正在过去？怎么会过去？创新的时代还没开始呢。好了，你还有别的问题吗？”

该内容为专享内容

订阅十字路口Crossing，即可查看全部内容