正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-02-28 10:36
逼近GPT-4的新模型,为何选择了闭源?

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究,原文标题:《开源明星Mistral推出闭源大模型,挑战OpenAI》,题图来自:视觉中国

文章摘要
Mistral推出了闭源大模型,挑战OpenAI,成为今年大模型领域的新趋势。

• 💥 Mistral Large模型具备一流的推理能力,在语言、数学、编程、知识等方面直逼GPT-4和Claude2。

• 💰 Mistral的商业模式类似于OpenAI,通过提供API有偿服务,基于token用量计价。

• 🌍 Mistral代表欧盟大模型企业,影响到了人工智能法案的立法过程,并建立了自己的大模型经济。

当明星般的开源大模型公司Mistral宣布发布了旗舰大模型Large时,人们为它欢呼,以为是开源的又一次胜利。


结果发现它是一个闭源大模型,你不知道它有多少参数,只知道它自称具备一流的推理能力,在语言、数学、编程、知识等方面直逼GPT-4,超过了之前的老二Claude2。


当年OpenAI成立时,它号称要为了人类的利益,对抗谷歌的垄断,建立开放的人工智能,结果在推出GPT-3之后就封闭了。它说要在使命与商业利益之间做出平衡。


去年5月成立的法国AI初创公司Mistral,号称以开源为使命,去年底推出了开源模型Mistral 7B,Mistral 8X7B,风头盖过了Meta的Llama2。刚刚,它不仅发布了一个闭源模型,而且还接受了微软的投资,同样说要实现使命与商业利益之间的平衡。


商业、应用与政治,是开源独角兽Mistral推出闭源大模型的几重考虑。


目前最先进的闭源大模型,已经初步建立了商业模式,即token经济(tokenomics)。OpenAI去年的年化收入达到了20亿美元,并且预计今年会达到40亿美元。它的估值在2023年翻了三倍,在最近完成的一轮融资中,达到了860亿美元。


另一家独角兽AI公司Ahthropic,拥有排名第二的闭源大模型Claude2,去年其收入也达到了年化近10亿美元,去年的几轮融资数额为近70亿美元,估值已经达到了184亿美元。


Mistral能挑战OpenAI吗?它号称要做到“在AI世界里资本效率最高”,目前估值为20亿欧元,相比GPT-4训练投入了上亿美元,Mistral Large只投入了2000万美元。它在商业上要对标OpenAI,但从投入和融资上并没有显示出挑战OpenAI的雄心。


来源:Mistral官网 ,Mistral模型系列服务报价


它的商业模式类似于OpenAI面向开发者提供API有偿服务,基于token用量计价,目前输入百万token 8美元,输出百万token 24美元。上下文长度32K。目前只支持文本、转换、代码生成。


相比之下的GPT-4 Turbo, 128k上下文, 百万token输入10美元,输出30美元。


Mistral Large的原生函数调用和JSON 模式受到了称赞,RAG功能(检索增强生成)增强了它的准确性。但仍有不少疑惑,它的价格非常接近OpenAI,但它的差异性何在?


GPT-4、Mistral Large(预训练)、Claude 2、Gemini Pro 1.0、GPT 3.5 和 LLaMA 2 70B 在 MMLU 上的比较(衡量大规模多任务语言理解)。 

 

开源与闭源双管齐下,成为今年大模型领域的一个新趋势。最近谷歌在发布”最强“闭源大模型Gemini Ultra之后,发布了开源模型Gemma 2B 和7B,也是其加速推进AI的软硬件应用的战略举措。


而Mistral则是从开源杀入闭源。Mistral 7B到MoE架构的Mistral 8X7B,继在多项测试指标超过了Llama 70B之后,现在开始挑战闭源大模型GPT-4和Claude 2了。


目前无论是在PC设备终端,还是推理引擎上,开源模型Llama2和Mistral 7B都成为首选。而更多适配PC的7B模型,适配手机的2B或更小的模型,正在涌现。对于许多应用与模型公司来说,基于云的tokenonics无法成立的话,不妨向边缘走,向设备终端走。


第三个是政治考虑。Au Large不仅是Mistral的旗舰模型,是法兰西的旗舰模型,也是整个欧盟的旗舰模型。Mistral甚至代表欧盟大模型企业,影响到了人工智能法案 (AI ACT)的立法过程。在AI主权的趋势下,欧洲要建立起自己的大模型经济。这次微软的投资,只有1500万欧元,并且在云服务领域展开合作,并非外界夸张地以为微软又控制了一个大模型。


微软将在西班牙和德国投资50亿美元,建立数据中心。不管怎么说,欧盟在自己的境内,建立起了用自己的数据训练自己的大模型的基础设施。它首先服务的语言是英语、法语、西班牙语、德语和意大利语。


市场上领先的 LLM 模型在广泛常识、推理和知识基准上的表现:MMLU(测量理解中的大规模多任务语言)、HellaSwag(10-shot)、Wino Grande(5-shot)、Arc Challenge(5 次)、Arc Challenge(25 次)、TriviaQA(5 次)和 TruthfulQA。


除了 Mistral Large 之外,Mistral还发布了一个较小版本的闭源模型Small,其性能优于Mixtral 8x7B,并且延迟较低,为用户在开源产品与Large之间提供了选择。


Mistral还推出了一款名为Le Chat的聊天助手。任何人都可以在chat.mistral.ai上注册并试用,但因为注册人数太多,许多人被放到了等候名单上。目前该服务的访问是免费的,用户可以在三种不同的模型之间进行选择 - Mistral Small、Mistral Large 以及设计简洁的Mistral Next。Mistral还计划为企业客户推出Le Chat的付费版本。


这家位于巴黎的公司2023年5月才成立,团队由谷歌Deepmind和Meta前员工组成,最初6人团队以7页PPT融到了8亿元(相当人民币),成为一段传奇。


本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: