扫码打开虎嗅APP
出品|虎嗅商业消费组
作者|苗正卿
题图|视觉中国
虎嗅获悉,截至2024年6月底,阿里国际的AI工具用户量超过50万个商家。阿里国际提供的数据显示,近期商家对阿里国际各个AI能力的日均调用量已经突破了5000万,并以每两个月翻一倍的速度继续增长。
2023年11月,阿里国际AI团队在ICCV(国际顶级计算机视觉学术会议)上,获得了“SMART-101 Challenge Winner Award”,这是一个涉及“视觉-语言算法推理”的奖项。几乎与此同时,阿里国际在旗下速卖通等产品以及投资子公司Lazada等产品上,开始试运行AI工具——部分商家开始获得试用机会。
经过近两个月的测试后,2024年初,阿里国际开始在所有产品、所有区域商家端上线AI工具。截至2024年上半年,阿里国际推出的AI工具已经可以覆盖包括搜索、广告投放、客服在内的40多个场景。
AI对阿里国际的业务影响也逐渐显现。最新季度财报显示,阿里海外电商的收入同比增长45%,连续7个季度双位数增长。
另据虎嗅独家获悉,阿里国际的AI工具,基于团队自行研发的多模态大模型(Ovis),简单来说Ovis是一个新型的基于图像与文本对齐架构的多模态大模型。
传统的MLLM(多模态大模型)架构,一般会以预先训练好的LLM(大语言模型)和视觉Transformer为基座,并基于这两大核心去构建文本模块、视觉模块。它常见的特点是:强项在于文本嵌入,但在视觉嵌入上可能会存在局限性。
Ovis解决的痛点问题,在于视觉嵌入部分。技术团队给Ovis引入了类似LLM中文本嵌入策略的“可学习视觉嵌入表”。简言之,大量视觉特征会先转化为视觉token,然后再通过视觉嵌入表的索引加权,去强化整体效果。
Ovis和基于此的AI工具研发,始于2023年一季度。据知情人士透露,阿里国际决策层对AI很重视,当时决策层要求团队尽快推动阿里国际的AI进程,并把重心放在提高整个链路的效率上。此后,多位技术人才加入阿里国际,迅速组建了一个人数超过100人的算法专家团队。
这些人才,被整合到名为“AI Business”的新部门,并由阿里国际数字商业副总裁张凯夫作为负责人。
在蒋凡掌舵淘天时代,张凯夫就是其D(直属下级)并负责淘天至关重要的商家等业务。据熟悉张凯夫的人透露,他本科就读于清华大学计算机系,后前往美国卡耐基大学修经济学博士,是阿里中典型的懂技术、懂商业、有过一线实战经验的高管。由张凯夫带队阿里国际AI项目,可以看出阿里国际决策层对迅速AI化的重视度。
不依赖专一大模型、不盲目比拼大模型
阿里国际AI Business团队在基座大模型选择上,采用了多个开源模型并用的模式。
“我们没有选择再从头去训一个千亿参数的大模型。我们的核心关注点还是多语言能力,因此合适的策略是基于性能比较强的通用模型底座,继续调优我们的多语言模型。”阿里国际AI业务算法负责人骆卫华(花名:闻彰)表示,在经过一段时间测试后,他们发现国际业务的多语言、多样化的特点,导致其用户和其他大模型的用户盘并不完全一样。“通用大模型基座和业务之间存在Gap,而我们团队的工作就是去弥合这个Gap。”
另一个遇到的难题是效率和性价比问题。骆卫华举了一个例子,有一个很常见的商家场景:给一个关键词,让AI工具生成标题和详情介绍。在测试过程中,团队发现,用几B的模型已经足以生成很好的效果,此时如果采用几十B、上百B的模型反而会浪费推理成本。
在多模态大模型的选择上,团队选择了自研,这也是Ovis诞生的缘由。“因为确实没有一个多模态模型做得足够好,让大家公认只能follow这种方法,没人再去想别的方案,所以这个阶段可以去做一些不一样的探索和尝试。”骆卫华说。
在研发Ovis之前,市面上主流的多模态模型有两种架构路线,一种是类似于LLaVA的图像和文本对齐的多模态架构,另一种则是图文统一训练架构。在讨论后,团队在借鉴了第一种架构的思路并考量到其不足之处后,研发新架构。
其中关键节点是要解决复杂图像信息的难题。这其实是跨境业务的关键挑战,比如不同语言商家,需要通过图片传递更多的信息,以及不同文化背景消费者对于图片审美、视觉需求方面有巨大差异。经过近半年的研发,Ovis雏形出现。此后,团队基于Ovis逐渐开发出了近40个场景落地的具体工具。
“找场景的过程是比较经验主义的,找产品的过程我们也没啥方法论,大家干了很多年电商了,这个活怎么干也知道。”阿里国际数字商业副总裁、阿里国际AI业务负责人张凯夫说。他表示,阿里国际的业务线中不乏多年来连续奋战在国内外电商前线的员工,大家把跨境电商的业务流每个关键环节都进行了复盘,然后通过经验,总结出其中最适合用AI提高效率、提高转化的场景,并开发工具。
一个典型案例是“拒付抗辩agent”。在跨境电商领域,很多中国商家,会遇到海外用户无理投诉的情况。此时,按照平台要求,商家可以通过抗辩邮件对客户的投诉进行回应,如果抗辩邮件有理有据,平台是可以维护商家并避免惩戒的。但碍于语言障碍、时间成本等因素,大量商家长期无法及时写抗辩邮件。因为观察到这个细节,阿里国际AI Business团队特意开发出了AI撰写抗辩邮件的功能。
据张凯夫透露,整个阿里国际AI Business团队,在每个AI工具研发过程中,都会去具体测算工具给业务带来的具体价值。“一个目标是通过AI给整个业务带来多少降本增效,钱的价值,我们会真的去算给转化带来多少增长,这个转化又能带来多少GMV。”
张凯夫表示,在整个阿里国际的商家后台,目前AI工具对内部客户不仅免费,且并没有以单独产品的形态出现。他们试图让商家自然而然地找到这些工具,并通过最终大盘整体的收益变化,去评估AI端投入的总账。
虎嗅获悉,目前阿里国际在AI布局和分工上的情况是:在GPU等算力底座上,采用以阿里云为主的云计算平台;在多模态大模型和基础AI能力方面,阿里国际的AI Business团队提供Ovis、MarcoPolo、翻译、虚拟试衣等工具;而AE、Lazada等子公司,可以根据具体场景,直接调用这些工具,或选用这些工具做二次定制。
跨境大厂都在关注AI
在跨境电商圈发力AI的不只是阿里国际。
虎嗅获悉,2023年以来亚马逊在迅速发力在跨境电商中的AI能力。目前,亚马逊的Amazon Bedrock服务已经可以提供多种大模型接口和工具;而2024年亚马逊在生成式AI方面推出了多款新工具,去解决跨境电商中多语言交互、用户转化等场景。
就在6月,亚马逊还宣布将以2.3亿美元主推初创型AI公司。而其中一些已经和亚马逊有所接触的公司,其业务场景和跨境电商关系密切。有相关初创公司人士告诉虎嗅,在诸如AI物流、AI多语言交互领域,亚马逊的兴趣很强。
而在近期,有消息人士透露,亚马逊正在加快对高级语言模型类产品的研发速度,而相关产品的关键能力之一正是包含文本和图片多种类型的复杂对话能力。
有接近亚马逊的知情人士告诉虎嗅,在跨境电商领域,AI已经是亚马逊的关键战略。无论是对于想通过亚马逊出海的中国商家,还是欧美市场的本地商家,大量AI工具已经被配置到了商家端。“用AI降低人效,并提高碎片化工作效率,已经是必然趋势。”
另一个跨境电商关键参与者Temu也正在发力AI。虎嗅获悉,目前Temu的AI工具已经可以提供包括一键翻译、智能客服等全链路通道服务。另有熟悉Temu的外部人士透露,Temu目前是把业务刚需的一些场景率先AI化。
值得注意的是,眼下,出海圈正在兴起半托管热。阿里国际、Temu、Shein等平台都在2024年发力半托管。而AI或将成为半托管浪潮的催化剂。
“半托管模式下,有供给优势、物流优势、运维优势的商家,会更容易享受红利。而AI可以进一步把这些商家从繁琐的低门槛事务中解救出来,让其聚焦于高门槛能力。”一位出海行业从业者表示,2024年下半年,各大平台或将出现一波AI工具热,但隐藏其中的难题是,这些AI工具对部分商家而言,依然有较高的学习成本,以及AI工具解决的是商家的“人类手的延展”但并不能解决工具之外的挑战。
“部分商家2023年以来,遇到的是利润率方面的压力和挑战。可能不只是提高自身效率、降本增效可以解决的。部分平台也需要调整策略,适当让利给商家。”上述人士说。
眼下,一个摆在亚马逊、阿里国际等AI工具库丰富厂商面前的挑战是:这些AI工具本身是否可以实现商业化?
来自阿里国际的最新消息显示,团队已经对于AI工具向外部客户付费开放有所考量。