Kimi爆火后，大厂角逐长文本-虎嗅网

本文来自微信公众号：财联社（ID：cailianpress），作者：旭日，题图来自：视觉中国

文章摘要

近期，大模型应用Kimi引起了资本市场的关注，阿里、百度和360也纷纷发布了长文本处理能力。长文本处理在大模型领域的重要性备受关注。然而，Kimi在某些任务上还存在一些短板，如结构化信息处理和图像中文字识别。2024年被认为可能是大模型应用落地元年，但目前仍有一些问题需要解决。

• 💥 大模型应用Kimi引起了资本市场的关注，同时也促使阿里、百度和360等大厂发布了长文本处理能力。

• 💪 长文本处理能力在大模型领域具备优势，可以满足理解和问答的需求，但目前仍存在一些难点和短板。

• 🚀 2024年有望成为AI大模型应用落地元年，但目前仍需要解决成本、商业模式、基础设施等问题。

月之暗面不再“晦暗”。近期，由这家公司创作的大模型应用Kimi，吸引了大量目光。Kimi产生的效应已经从大模型圈外溢至资本市场，Kimi概念股在上周应运而生。用户激增，巨大流量突然涌入，甚至让Kimi服务器一度宕机。

Kimi在这一轮大模型应用当中突围，核心优势在于长文本读取和解析能力。颇为巧合的是，就在22日晚间，阿里高调宣布通义千问开放1000万字长文本能力。360当晚紧随其后，宣布360智脑正式内测500万字长文本处理功能，即将入驻360AI浏览器。

而据《科创板日报》了解，百度也将在下个月开放200~500万的长文本能力。

阿里巴巴、百度等互联网巨头纷纷布局并升级自家的大模型产品，强化长文本处理能力，正让业界重新审视长文本处理在大模型领域的必要性和重要性。而随着Kimi的崛起，这也让大模型的讨论焦点从大模型本身转移到了应用端，2024年是否会成为AI大模型应用落地元年？

长文本是必要的吗？

相较于其他大模型应用，Kimi的长处在于长文本分析联网搜索、文档处理和等功能上，尤其在深度解析厚重书籍内容方面，其性能远超远超其他模型。3月18日，月之暗面甚至一口气将无损上下文长度提升了十倍，直达200万字级别。

据目前的用户体验来看，Kimi也不是全能选手。有用户反馈表示，对于一些较为困难的任务，包括结构化信息处理和图像中潦草文字的识别以及对话连续性，Kimi仍显示出一些短板。在生成能力和语音能力上，目前Kimi还未加入这些模态。

尽管如此，长文本能力的重要性仍不言而喻。目前，市面上的大模型应用，GPT-4Turbo-128k公布的文本范围约为10万汉字，Claude3200k上下文约16万汉字。

一家AI上市公司大模型架构业务人士告诉记者，由于模型训练结构的限制，以往大模型的文本范围都不算长，但复杂任务和行业知识通常是长篇巨制，这种情况下，只能拆分输入提问，但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本可以全篇连贯的去理解上下文，满足理解和问答的需求，长文本能力在此时是具备优势的。

而国内大厂们，则正在长文本领域快速布局。

百度在下个月将对文心一言进行升级，届时也将开放长文本能力，文本范围在200~500万。目前，文心一言的文本最高上限在2.8万。

而阿里已经先行一步。22日晚间，阿里的通义千问官宣升级，向所有人免费开放1000万字的长文档处理功能。用户可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

360紧随其后，其在当晚宣布，360智脑正式内测500万字长文本处理功能，即将入驻360AI浏览器。

Kimi成功在前，阿里、百度、360先后角逐长文本。长文本能力会是大模型未来差异化的竞争点吗？

上述大模型架构人士表示，长文本能力目前在训练和效果上仍存在一些难点，比如如何避免遗漏细节。事实上，文本长度也可以通过RoPE等算法技术去拓展，但是此时会严重丢失细节，这就导致输出效果不准确。因此，核心标准是看输出结果的精准性连贯性，并不是文本长度越长越好。

另外一名大模型行业人士也告诉记者，长文本实际是大模型的基础能力，只要算力资源足够，理论上长文本可以追求无限长，“但是如果使用场景根本用不上长文本，那么此时的长文本就没有任何意义”。

2024年是大模型应用落地元年吗？

Kimi的火爆，一定程度上也反应了当下国内大模型的发展阶段，从打基建开始走向应用落地。那么，2024年是否会成为AI大模型应用落地元年？

澜舟科技CEO周明认为，从长远来看，人工智能在逼近AGI。而经过去一年的发展，大模型已经具备了落地的能力，企业侧也积攒了很多业务落地场景。加上国家政策的推动，2024年将会是大模型落地元年。

零一万物联合创始人祁瑞峰也表达了类似的看法，但他是聚焦在B端场景。目前，内容生成、理解、摘要和对话等应用仍占据主导，但随着新一代模型推理、决策和执行能力的提升，有望更快地将AI技术植入企业业务系统，真正开启大模型赋能的腾飞。

电商是AI应用最具代表性的领域之一。魔珐科技目前是阿里妈妈、淘宝直播生态官方指定的3D超写实虚拟直播服务商，旗下有一款3D虚拟人直播AIGC产品“有光”。

魔珐科技CEO柴金祥表示，电商是公司AI产品应用的最主要一个行业。从已有的使用效果来看，多个知名头部美妆品牌在使用魔珐科技提供的3D虚拟人后，午夜６小时的直播时段内累计年GMV增量高达数千万。3D虚拟直播午夜超级直播广告投放高于行业均值2倍以上，ROI大于5倍。

尽管2024年被寄予厚望，但是各方仍然保持着审慎乐观的态度。

祁瑞峰认为，在C端市场，目前成本还很高，商业模式还未完全跑通。即便是对于现在已经可以创收的B端市场，周明也认为，要想做好产品标准化和完整交付，训练和部署成本、行业适配能力、幻象问题、数据安全四方面的问题，还有待解决。

梦饷科技CTO曹均涛表示，虽然AI在电商行业的应用，想象空间非常大，梦饷也在通过GPT大模型重构业务场景，包括解决模特图片生成、素材差异化、服装秀、AI创作助手、聊天室导购等问题。

“但是现在的阶段，基础设施并不完善。”曹均涛告诉记者，梦饷在去年为创作者做了AI创作平台，虽然能生成模特图，但是成图率并不高，还是需要技术升级和内部做技术提示词、算法模型的调优，这个平台到现在还没有开放，“现在大家都在找应用场景，估计2024年开始能够看到更多AI、大模型带来的变化”。

在42章经创始人曲凯看来，2024年仍会是技术上不断突破的一年，很难真的做到大规模的落地和有非常多的场景，不过，不管是在B端还是C端，今年有望看到更多应用开始跑出来。与此同时，应用端的项目今年也将更受投资人青睐。

“去年大家投了非常多资金和精力在大模型本身，要想将这个故事持续下去，就需要有落地，因此会在应用端继续探索，找到PMF（Product Market Fit，产品市场匹配）。”曲凯说。

本文来自微信公众号：财联社（ID：cailianpress），作者：旭日

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉，请联系tougao@huxiu.com

Kimi爆火后，大厂角逐长文本

最新评论

大 家 都 在 看

大 家 都 在 搜

大家都在看

大家都在搜