正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-07-08 17:07

法国:AI大革命

本文来自微信公众号:普通人的AI自由(ID:AI_Liberty_Guide),作者:Lian et Zian,题图来自:视觉中国

文章摘要
本文讨论了法国在AI领域的发展,以及底层大模型创业的现状和挑战。

• 💡 法国数学教育深厚,培养了众多数学天才,为AI创业提供了优质人才

• 🌟 法国拥有顶尖的数学研究历史和学术机构,为AI技术的发展提供了坚实基础

• 💰 法国AI公司如Mistral和Hugging Face在大模型和模型平台领域取得重要进展,为法国AI生态注入活力

一、底层大模型创业:数学天才的时代


真理总是掌握在少数人手里。而且,历史也是由少数人书写的。AGI大模型创业也是如此。


这轮AI创业看起来很奇怪:


  • 明星公司都是底层基础模型,应用层公司大多昙花一现,所以投资人也不敢投。


  • 只要卡够钱够,卷人数好像用处不太大:Mistral~20人团队照样完爆无数大厂。


从另一个角度,找PMF(Product Market Fit)非常难:


  • 即使看到了一个可能的机会,创业公司自己也没能力做出来;


  • 要么等到开源模型的能力更新,机会马上变成红海;


  • 要么是ChatGPT更新,瞬间机会就被碾压没了。


归根结底,是因为大多数AI公司都不拥有底层技术:拿到的开源模型也只是黑箱,自己并不知道怎么能真正做得更好,只能在现有模型上随机调优原地打转……


我们越来越发现:AGI大模型的底层技术,只掌握在少数天才的手里。而且,天才的重要性要大于人数和组织能力


大模型公司中研究的领军人物通常都拥有计算机/数学/物理博士学位,且深耕学术研究多年。而且我们都知道,计算机/物理/经济学……一切需要计算的学科中,最牛的人往往是数学最好的。比如前OpenAI灵魂人物Ilya Sutskever在本科阶段主修数学,Anthropic的CEO Dario Amodei从本科到博士都主修物理(数学也很重要)……


所以说,盛产数学天才的地方,才是AGI创业的真正沃土


所以今天要特别聊聊法国。


国人对法国的概念主要停留在艺术文化和奢饰品,但了解过Concours(法国高考)的朋友都知道,法国社会对于数学的重视程度一点不亚于海淀;数学和哲学作为Concours必考题目,才是这个国家精英眼中真正的明珠。教育基础也孕育了社会文化:除了吐槽法国政府之外,哲学-数学-历史-文学-艺术都是巴黎酒吧咖啡馆的重要下酒菜;而且,这类问题也是法国各类商业-政治沙龙的无形门槛。


回到法国数学教育本身:重理论轻计算——基本都是证明题。以个人为参照,本来以为北大物理系的数学应该不算太差,但到了法国一样被虐得很惨。才发觉,原来我本科学的叫“算术”,不叫“数学”……所以说,海淀可以量产“做题家”,但真正的“数学家”却出在法国。


但不得不说,数学天才们在法国挣得太少了。所以我们看到无数法国数学牛人去美国做算法/数据/IT,也知道很多在伦敦的量化交易公司的官方语言是法语……这些人的回流,正是当下法国AI生态的主力。


“数学理论的分支与关系”,亨利-庞加莱研究院 Institut Henri Poincaré


二、法国:数学家的摇篮


法国的数学研究历史底蕴深厚。中学数学到高等数学的课本中反复出现,虐我千百遍的名字原来那么多法国人!


从解析几何创始人笛卡尔(Descarte),到“数论先锋”费马(Fermat),从在微积分、复变函数和微分方程中大量冠名的柯西(Cauchy),到随处可见的傅里叶(Fourier)级数和傅里叶变换,乃至21岁决斗而亡的“群论之父”天才伽罗华(Galois),以及“最后一位数学全才”庞加莱(Poincaré),力学、天文学中有大量存在感的拉普拉斯(Laplace)、拉格朗日(Lagrange)……


17到19世纪的数学可谓群星闪耀,这与这一阶段法国统治者们(路易十四1654-1715在位,路易十五1715-1774在位,拿破仑1804-1815在位)热爱数学(都有专职数学老师)、大力投资数学、并从全欧洲挖角数学人才是密不可分的。



20世纪以来,法国数学仍是世界一流。素有数学界“诺贝尔奖”之称的菲尔茨奖,每四年一次,仅颁发给2至4名未满40岁作出突出贡献的数学家。而从1936年至今的69名获奖者中,法国(13人)几乎和美国(15名)并驾齐驱,并超过俄罗斯+苏联(9名)。要知道法国人口只有6700万,而美国有3.3亿。



有如此多大师坐镇的法国,如今仍是数学学习和研究者的向往之地。巴黎-萨克雷大学(Université Paris-Saclay, 包含巴黎综合理工École Polytechnique) 数次摘得数学专业世界排行榜第一,还有索邦大学(Sorbonne University, 包含巴黎六大),巴黎文理研究大学(Paris-PSL,包含巴黎高师ENS)、亨利-庞加莱研究所(Institut Henri Poincaré)等享誉世界的学校和研究机构。


三、AI届的法国大佬们


如今的AI领域,无论是学术界还是科技公司,都活跃着这些有扎实数学基础的法国人才,以下仅列出部分知名大佬:



四、Mistral:欧洲顶级大模型


美国以外最引人注目的大模型创业公司之一,无疑是法国的Mistral AI。当前重要AI创业公司估值如下:


  • OpenAI = 800亿美元(2024年2月)


  • Anthropic = 184亿美元(2024年3月)


  • Mistral AI = 65亿美元(2024年6月)


  • 月之暗面、Minimax、智谱 = 25亿-30亿美元



Mistral系列是当前仅次于Llama3系列的,最重要的开源模型。提供Mistral7B,Mixtral8x7B, Mixtral8x22B三个选择。



从Mistral 7B (2023年9月27日)发布,到Llama3(2024年4月10日)发布之间6.5个月里,Mistral系列一直被认为是开源模型的首选。而且,与Llama系列相比,Mistral使用宽松的Apache License 2.0;而且实测下来MoE架构的推理性价比真的很香。让我们期待Mistral下一代开源模型的发布。


在支持开源的同时,Mistral也在24年2月发布了闭源大模型Mistal Large 和对标Chatgpt的产品 "Le Chat"(翻译="猫")。Mistral Large在发布时是当时最接近GPT4的产品(2024年3月末被Anthropic的Claude3系列超越)


Mistral的开局如其名“冬日北风”一样发展迅速。23年4月三个创始人才在巴黎的咖啡馆确定“法国人也要有自己的ChatGPT”的愿景,6月就锁定1.13亿美元的种子轮融资。3个月后,不到20人的小团队,仅使用几百张A100做训练,快速发布开源模型Mistral 7B。


快速出成果的背后是人才。CEO Arthur Mensch曾参与Deepmind的Chinchilla等知名项目,包括CTO Guillaume Lample在内的很多团队成员都来自原Meta AI巴黎的Llama团队。(这里要感谢Meta的Yann Lecun在巴黎的投入:Llama背后有很多法国人。)


Mistral背后的资本是法国本土+美国的混合。带着“成为欧洲AI领导者”的愿景,Mistral的1.13亿美元的种子轮就吸引了不少法国投资者,包括德高JCDecaux Holding,Xavier Nie(法国电信运营商Free创始人),Rodolphe Saadé(航运公司CMA CGM的CEO),Motier Ventures(老佛爷百货所有者Moulin-Houzé 家族办公室)等法国亿万富翁和家族办公室。在此后的A轮和B轮融资中,CMA CGM, Bpifrance(法国国家队),法国巴黎银行BNP Paribas也加入融资。当然,美国的风投机构(General Catalyst, a16z, Lightspeed Venture)和大厂们(英伟达, 三星,IBM,Salesforce)也在投资者之列。


Mistral的意义是深远的。


首先,欧洲有了顶级大模型。于是,欧洲手里多了一张牌,可以在站队压力可控时做出独立选择,保持一定的外交独立性。


第二,Mistral的号召力盘活了法国的AI生态。围绕Mistral和HuggingFace,法国当前的AI创业生态非常繁荣,这样可以进一步聚集AI人才,也给投资人信心,走入良性循环。

五、不止Mistral,法国的AI“隐形冠军”们


1. Hugging Face: 模型平台



Github是代码的平台,HuggingFace(HF)是模型的平台,也是AI开源在全球扛大旗的。HF最大的想象空间,是成为“模型调用模型”的平台与规则制定者。于是,HF在23年5月发布Transformer Agent 1.0, 并在24年5月升级到2.0,做的就是这件事。官方宣称基于Llama3-70B-Instruct在GAIA Leaderboard测试中,比基于GPT4的Agent有更好表现。


Hugging Face其实是一家“法国-美国”公司。


  • HuggingFace在2016年由三位法国人Clément Delangue, Julien Chaumond和 Thomas Wolf在巴黎创立。公司初始想法是“面向青少年的AI驱动的聊天机器人”,当时在法国难以获得风投,于是搬到纽约以获得第一轮融资。


  • 2019年,在Google发布BERT模型后,公司逐渐将聊天平台转化为开发者社区,并逐步形成了全网最大的自然语言处理开源模型数据库,获得Google、Amazon、Nvidia、Salesforce等多个巨头的战略投资。


  • 目前HuggingFace约180名员工中三分之二在欧洲,其中70人位于巴黎。


HuggingFace的重要性在于,它本身就是生态。它正在成为一个创业工厂,从中已经产生了Adaptive ML(详情见下), Contextual和Arcee等AI初创公司。


2. H.ai: Mistral之外第二家底层模型公司



如果说,Mistral是Meta系,H.ai就是Deepmind-Google系。


创始团队:法国人Charles Kantos聚集了四位来自Deepmind的强化学习、博弈论和多智能体领域的专家,其中Laurent Sifre和Julien Perolat是法国人。


产品定位:开发“能动性”或“以行动为导向”的AI模型,这些模型能够推理、规划和协作解决问题,超越当前的语言模型;围绕行业的企业提供这些AI Agent,以推动生产力和人机协作。


融资:种子轮融资2.2亿美元(2024年5月),分别来自:


  • VC:Accel、Bpifrance(法国国家队)、Creandum、Elaia Partners等;


  • 家办:Eric Schmidt(前Google CEO和主席)、Xavier Niel(法国电信运营商Free创始人)、Bernard Arnault(LVMH董事长)等;


  • 大厂:亚马逊、三星和UiPath的战略投资。


3. Adaptive ML: LLM企业个性化部署



创始时间:2023年,总部位于纽约,但在巴黎有一个强大的技术团队。


创始团队:5位法国人Julien Launay, Daniel Hesslow, Baptiste Pannier, Alessandro Cappelli和Axel Marmet共同创立,他们都曾一起在开源的Falcon LLM项目上工作,并且三个人此后在HuggingFace工作。


产品定位:帮助企业将大型语言模型(LLMs)适应于他们的特定用例,并根据用户互动不断改进模型。


融资:种子轮2000万美元。


4. Dust:AI助手



创始时间:2023年。


创始团队:2位法国人,Gabriel Hubert和前OpenAI员工Stanislas Polu。


产品定位:用来自Notion、Slack、Google Drive等的内部数据,使用带有检索增强生成(RAG)的LLM来为公司客户构建一个内部AI助手平台;在OpenAI、Cohere和AI21等公司的现有LLM之上构建应用程序。


融资4500万美元+


5. Giskard:AI系统的安全



创始时间:2021年。


创始团队:2位法国人包括前Dataiku员工Alex Combessie和Jean-Marie John-Mathews,以及Andrey Avtomonov。


产品定位:开发一个开源AI测试框架,作为“市场上最好的大语言模型杀毒软件”,来保护AI系统安全。


融资:450万欧元。


6. Photoroom: 电商图片生产



创始时间:2019年。


创始团队:2位法国工程师背景的创始人,Matthieu Rouif和Eliot Andres。


产品定位:基于AI的图片编辑软件,让用户无需经过大量训练就能创造出令人印象深刻的图像;开发了自己的自定义基础模型“Photoroom ID”。


融资:6400万美元。


7. Owkin:药物发现&临床优化



创始时间:2016年。


团队:法国临床研究医生Thomas Clozel和生物学领域的人工智能先驱Gilles Wainri。


产品定位:开发用于药物发现、临床试验优化和人工智能诊断的技术;主要产品MSIntuit CRC - 一款在欧盟获得批准的人工智能诊断工具,用于预先筛选结直肠癌患者的生物标志。


融资:3亿美元(其中1.8亿美元来自赛诺菲)


除了最新的AI创业公司之外,更久一些法国人的科技创业故事是创立数据/SaaS/AI公司,获得美国风投,然后在美国上市。


8. Snowflake:云原生数字平台



  • 2012年在美国加州,由两个法国人Benoit Dageville和Thierry Cruanes,与Marcin Zukowski共同创立。


  • 2020年上市,当前估值约550亿美元。


  • 2023财年总收入为26.2亿美元,截至2024年1月,Snowflake在全球拥有7004名员工,并在福布斯全球2000强榜单中拥有691家世界最大上市公司的客户。


9. Datadog:用于云应用的监控和分析平台



  • 2010年在纽约,由两位法国人Olivier Pomel和Alexis Lê-Quôc共同创立。


  • 2019年在纳斯达克上市,当前估值约370亿美元。


  • 2023年收入超过20亿美元,拥有超过5200名员工,为全球27300名客户提供服务。


10. Dataiku:人工智能和数据科学公司



  • 2013年在纽约,四位法国人Florian Douetteau, Clément Stenac, Thomas Cabrol和Marc Batty共同创立。


  • 2022年8月E轮融资中筹集了4亿美元,公司估值达46亿美元。


  • 2023年营收约2.3亿美元,拥有约1400名员工和600多个全球客户。


六、挑战与机遇


最后,法国AI究竟有多强?有超过中国吗?


我觉得答案还是明确的:AI第一强国是美国,第二是中国。因为无论是从总AI论文数量还是研究者数量,中国都比法国要高出一个数量级。我们也看到假以时日,国产模型们也一步步逼近GPT4的水平。但问题是,我们的这些大脑是否用在了真正技术前进的方向,还是用在了完成内部KPI的雕花上?以及在这个天才创业的时代,个别天才是有可能改变历史命运的。


法国AI行业的瓶颈,一个是人才数量,另一个是半导体工业。


人才瓶颈目前主要由东欧和北非在补,但如何培养出更多的AI人才正在给法国当前的教育体系提出巨大挑战。以及,法国的高级AI算法人才的工资明显低于美国和中国:这一方面对于创业公司是成本优势,但另一方面也造成了国家层面的人才外流。


芯片相关的半导体工业的短板更加难补。目前芯片工业体系主要在美国和东亚,消费电子在中国更是有巨大优势。欧洲可能需要再造一个“空中客车计划”,才有可能在AI浪潮中立住根基。


最后,欧洲作为AI第三极有着更多与中国合作的空间。法国-欧洲的AI发展有着众多痛点缺陷,如果我们有能力提供一部分价值,那么机遇也自然会向我们招手。


本文来自微信公众号:普通人的AI自由(ID:AI_Liberty_Guide),作者:Lian et Zian

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: