扫码打开虎嗅APP
本文来自微信公众号:量子位 (ID:QbitAI),作者:明敏、克雷西,题图来自:Stanford University
AI教母李飞飞,创业了!
最新消息,斯坦福大学教授李飞飞正在建立一家AI公司,已完成种子轮融资。
公司方向定为“空间智能”——旨在让AI能像人类一样对视觉信息进行高级推理。消息人士表示,这将是该技术的一次飞跃。
投资方包括硅谷风投a16z和Radical Ventures。
作为AI领域影响力最大的女性和华人,李飞飞长期对学术界和工业界贡献斐然。她在斯坦福拿下终身教职,曾担任谷歌云AI首席科学家、推动Google AI中国中心成立、并长期统筹谷歌云AI、谷歌大脑以及中国本土团队工作。
但躬身创业,这是头一回。
目前,李飞飞及相关投资方对于这一新消息尚未作出回应。
但李飞飞的领英页面上已经多了一条新履历。
title是“新手”,介绍只写了“something new”,确定是全职,从2024年1月开始,到现在已经进行了5个月。
计划“让AI实现高级推理”
汇总各方信息,目前比较有迹可循的线索是参投的加拿大风投Radical Ventures。
去年,李飞飞以科学合伙人的身份加入了这家基金。
更多蛛丝马迹可以从李飞飞近期的公开活动看起。
上个月,李飞飞在温哥华举行的TED大会中发表了主题演讲,内容正是与空间智能相关。演讲中,李飞飞对“空间智能”的描述是从物体之间的关系中获得预测和洞察力的能力。
她表示,AI对空间智能理解的进步,正在催化机器人学习,使我们更接近让AI能与世界互动的目标。
为了解释“空间智能”,她展示了一张猫咪伸出爪子要把玻璃杯推向桌子边缘的照片。
她表示,人类大脑在这一瞬间可以评估玻璃杯的几何形状、它在3D世界中的位置、它与桌子、猫和其他东西的关系,并且能预测接下来会发生什么,采取行动制止。
大自然创造了这种由空间智能驱动的视觉和行为的良性循环。
同时,她表示自己的团队在实验室中也正在尝试如何教会电脑在3D世界中行动。
比如通过大语言模型,让一个机器人手臂执行任务,打开一扇门、做一个三明治以及对人类的口头指令做出反应等。
这里提到的工作应该是和去年发布的具身智能成果VoxPoser有关。
这个项目可以让人类给机器人下达指令,如“打开上面的抽屉,小心花瓶!”
然后大语言模型+视觉语言模型就能从3D空间中分析出目标和需要绕过的障碍,帮助机器人做行动规划。
并且在真实世界中,机器人在未经“培训”的情况下,就能直接执行这个任务。
除此之外,近期李飞飞也参与了一系列学术成果的发表,涉足领域包括计算机视觉、机器人、智能体等。
比如一些便携式动作数据收集系统。
还有一些与Agent相关。比如上个月发布的一项涉及1000多种人类日常活动的具身智能Benchmark,李飞飞就有参与其中。
在3D空间方面,李飞飞团队也在今年年初发布了一款隔空3D建模模型,可以透过遮挡物建模出人物的动作。
此外,她还与来自微软、斯坦福、UCLA等机构的15名研究人员共同发布了一份关于Agent AI的立场文件。
文件中明确了Agent AI的基本概念,并提出了Agent AI基础模型,即利用多模态预训练模型构建的通用Agent系统。
文件中指出,这些模型可以处理来自机器人、游戏等领域的交互式多模态数据。
另外,李飞飞的斯坦福主页显示,从今年年初到2025年末,她将处于“部分休假”状态。这一起始时间,刚好与李飞飞领英页面中“newbie”履历的开始时间重合。
AI教母李飞飞
如今,李飞飞已经成为AI领域内最具影响力的女性和华人之一。
对应AI教父的称号,大家称她为AI教母。
她的传奇经历一直为人津津乐道:
33岁成为斯坦福计算机系终身教授,44岁成为美国国家工程院院士,现任斯坦福以人为本人工智能研究院(HAI)院长。
她是计算机视觉领域举足轻重的领军人物,一手创立的ImageNet成为推动计算机视觉识别领域前进的标杆成果。
其门下高徒颇多,比如先后在OpenAI、特斯拉任职的Andrej Karpathy、目前在英伟达的Jim Fan等,这些都是AI领域内颇具影响力的人物。
后来李飞飞曾短暂进入工业界,出任谷歌副总裁兼谷歌云AI首席科学家。她一手推动了谷歌AI中国中心正式成立,这是Google在亚洲设立的第一个AI研究中心。并带领谷歌云推出了一系列有影响力的产品,包括AutoML、Contact Center AI、Dialogflow Enterprise等。
最新大模型趋势里,李飞飞团队聚焦于具身智能,将大模型接入机器人,无需额外数据和训练即可把复杂指令转化成具体行动规划,开辟新一轮浪潮中的重要方向。
一直以来,李飞飞都是AI领域风向标一样的存在。
最近,李飞飞的个人回忆录《我看到的世界》正式发表。在这本书中,李飞飞自述了自己如何从北京到成都再到美国,如何在AI变革中逐渐找到自己的使命,并且分享了自己对AI发展的看法。
由此,一个更加立体的李飞飞被勾勒出来。
她说自己不是开源派也不是毁灭派,她希望人类能和AI和平相处;
她分享,谷歌云的经历让她意识到,引领AI技术发展需要肩负起相应的责任;
她也表示,如果你追求时髦算法,那么这肯定不是最好的科研。毕竟她曾经也做过冷门项目——不听同行导师建议,用数年时间标注了用于训练ImageNet的1400万张图片。
李飞飞坦言,自己非常害羞,不敢讲自己的故事。
才四十多岁就写回忆录?我不是爱因斯坦。
而在写完自己前40年后,李飞飞给自己掀开了一个人生新章程。
正如她所说的,文明就像是一艘大船,我们在黑暗中航行。
科学家李飞飞,如今有了新故事。
参考链接:
[1] https://www.reuters.com/technology/stanford-ai-leader-fei-fei-li-building-spatial-intelligence-startup-2024-05-03/
[2] https://www.ft.com/content/d5f91c27-3be8-454a-bea5-bb8ff2a85488
[3] https://blog.ted.com/mind-expanders-notes-on-session-2-of-ted2024/
本文来自微信公众号:量子位 (ID:QbitAI),作者:明敏、克雷西