2024-03-27

AI燎原 AI 早报

高通发布第三代S3、S5音频平台;Stability AI发布最新代码模型Stable Code Instruct3B

主理人:
虎嗅出品,每日推送AI领域资讯新闻,追踪AI的每一步进展。

巨头动态 

1.【高通发布第三代S3、S5音频平台】

高通推出第三代高通S3音频平台和第三代高通S5音频平台这两款全新的音频平台。两大平台分别将面向中端和高端耳塞、耳机和音箱提升无线音频体验。高通表示,这两款平台是各自系列中最强大的平台,将为S5和S3层级带来前所未有的音频体验。据悉,vivo即将推出全球首款搭载第三代高通S3音频平台的产品,即vivo TWS 4系列耳机。

 

2.【OpenAI的Sora在NVIDIA H100上生成1分钟视频约需12分钟】

据Factorial基金估计,OpenAI的Sora系统在NVIDIA H100上每小时能够产出5分钟的视频内容,每日可完成120分钟的视频生成任务。为支持TikTok和YouTube的创作者社区,大约需要89000个NVIDIA H100GPU。当这两个平台的AI生成视频产能合并后,每天产出的视频总量将高达10.7百万分钟。考虑到实际运行中的利用率变化、高峰期的需求激增以及网络流量的波动等因素,预测在需求高峰时所需的NVIDIA H100 GPU数量约720000个。更为复杂的是,创作者们在上传视频前往往会生成多个候选版本,平均每个上传视频背后都有两个备选作品,这一行为让GPU的需求再次翻倍。

 

技术突破

1.【Stability AI发布最新代码模型升级版本Stable Code Instruct3B】

Stability AI引入稳定代码指令3B,新指令基于稳定代码3B调整了LLM。通过自然语言提示,该模型可以处理各种任务,如代码生成,数学和其他软件工程相关的输出。该模型的性能可与类似或更大尺寸的型号相媲美,包括Codellama 7 B指令和DeepSeek-Coder指令1.3B。该模型现在可用于商业和非商业用途,具有稳定性AI会员资格。

 

2.【AI视频模型StreamingT2V可生成120秒超长视频】

UT奥斯丁等机构提出的StreamingT2V技术突破了以往视频长度的限制,实现了生成高度一致且长度可扩展的视频。StreamingT2V技术的核心构架包括条件注意力模块(CAM)和外观保持模块(APM)。CAM利用短期记忆单元确保视频连续性,而APM作为长期记忆单元保持视频中对象或场景的一致性。实现过程分为三个阶段:初始化、Streaming T2V生成和Streaming Refinement。特色亮点包括:从文本描述生成2分钟的视频;创建具有复杂动态运动的视频;确保长视频中的时间一致性。

 

3.【vivo自研蓝心大模型:中文能力第一,覆盖超2000万用户】

在3月26日晚的vivo旗舰新品发布会上,vivo介绍了自研蓝心大模型的相关情况:蓝心大模型发布五个月,在权威榜单中保持中文能力第一,覆盖超2000万用户,覆盖了亿、百亿、千亿三个参数量级。此外,蓝心大模型整体数据量跨越式升级到端侧7B” 云侧70B”的超大组合,可实现超700种手机相关功能。

 

4.【Openstream.ai 获得多模式人工智能驱动的人类数字孪生的关键专利】

Openstream.ai宣布扩大其多模态专利组合,并发布了名为“多模态对话的自动数字孪生行为建模系统和方法”的专利。这项专利方法使 Eva™(企业虚拟助手)平台的客户能够部署高级虚拟助手,专家数字孪生可以在任何渠道上采用人工智能化身、人工智能虚拟或人工智能语音代理的形式,或使用任何语言与最终用户协作,帮助他们实现目标。这使得企业能够根据需要扩展和部署数字孪生行为模型,以支持客户服务和员工帮助台。

 

5.【Kong发布AI驱动的电话邮件查询方案,创新“Ask Anything”功能提升客户互动效率】

Kong宣布创建基于人工智能的全面电话和电子邮件查询解决方案,除了个人通话、交易和机会历史记录之外,Gong的“Ask Anything”功能采用 Kong专有的生成式人工智能技术构建,该技术经过超过 30 亿次客户互动的训练,可提供准确、具体和透明的结果,而所需时间仅为通常研究交易所需时间的一小部分。Ask Anything 使卖家能够提出有关与特定个人互动以及客户和机会历史记录的任何问题,从而快速提出关键见解以推进交易,提高卖家效率。 通过新的“Contact Ask Anything”功能,收入团队可以根据特定潜在客户或客户的目标和痛点提出问题并收集见解。

 

AI安全与伦理  

1.【谷歌AI搜索出现问题,推广欺诈网站和恶意软件】

谷歌最近推出了其新的搜索生成体验(SGE),引入了一些页面上的AI生成搜索结果。但该功能可能会在搜索结果中推广一些欺诈网站和恶意软件。一些用户报告称,在搜索过程中遇到了AI生成的响应,这些响应指向一些垃圾网站。

AI燎原

一群来自虎嗅科技组的同学,制作了这个源流。我们想以观察者、亲历者视角,对 AI,尤其是 GenAI 进行祛魅——发布、提炼我们看到的 AI 进展,助你一手掌握 AI 的技术与行业动态,并一同迎接 AGI 的到来。