扫码打开虎嗅APP

No.45

2024-04-26

虎视 AI AI 早报

OpenAI获全球首台英伟达革命性DGX H200 AI超算设备;苹果发布OpenELM系列;EMO技术上线通义APP

主理人:
虎嗅出品,每日推送AI领域资讯新闻,追踪AI的每一步进展。

巨头动态

1.【OpenAI获全球首台英伟达DGX H200 AI超算设备】

OpenAI总裁兼联合创始人Greg Brockman在社交媒体X透露,英伟达向OpenAI移交全球第一部DGX H200,称这部黄仁勋倾力打造的设备“将推进AI、计算以及人类文明”。DGX H200是英伟达将多个Grace Hopper 超级芯片互连到同一个GPU 中打造的新型AI超算,可处理大型推荐系统、生成式 AI 和图形分析领域的 TB 级模型,为超大AI模型提供具备线性扩展能力的大型共享内存空间。Grace Hopper 超级芯片将英伟达的Grace CPU 与 Hopper GPU 结合在同一封装上,从而消除了对传统 PCIe CPU 至 GPU 连接的需求,可将带宽提高七倍,并将互联功耗降低五倍以上。

 

2.【苹果发布OpenELM系列:开源小型Transformer语言模型】

苹果在Hugging Face 模型库上发布了OpenELM一组四个小语言模型。苹果表示,OpenELM(即 “开源高效语言模型”)在类似电子邮件写作等文本相关任务上表现非常高效。OpenELM 比大多数轻量级AI模型小,分为四种规格:2.7亿参数、4.5亿参数、11亿个参数以及30亿个参数。OpenELM利用层间缩放策略在Transformer模型的每一层中进行参数的非均匀分配,以此提高模型的准确度和效率。该系列模型在公共数据集上进行了预训练,并且在多个自然语言处理任务上展现出了优异的性能。当前OpenELM的代码、预训练模型权重以及训练和评估流程已全部开放。

 

3.【EMO上线通义APP,输入音频及图像生成人物说话视频】

EMO上线通义APP,把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话。EMO之前的Talking Head技术都需针对人脸、人头或者身体部分做3D建模,通义实验室在业界率先提出了弱控制设计,无需建模就可驱动肖像开口说话,不仅降低视频生成成本,还大幅提升了视频生成质量。另外,EMO还学习并编码了人类表达情绪的能力,能将音频内容和人物的表情、嘴型匹配,还能把音频的语气特征和情绪色彩反映到人物微表情上。未来,EMO技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。

 

技术突破

1.【云计算巨头Snowflake发布480亿参数大模型Arctic】

云计算巨头Snowflake发布了一款高效、开源的企业级大型语言模型Arctic。该大模型是一个拥有480亿的参数,由128个细粒度的专家构成的混合专家模型(MoE)模型。在成本效益、训练效率和推理效率方面具有显著优势,适合执行SQL生成、编程和指令遵循等企业任务。Snowflake将Arctic与DBRX、Llama、Mixtral等模型在企业和学术指标方面进行了测试对比,Arctic在企业智能指标上表现更好,在如MMLU等通用知识基准上的性能可能略低于一些最新模型。同时,Arctic采用Apache 2.0许可,提供对模型权重和代码的开放访问。

 

2.【Adobe推出VideoGigaGAN:革命性的AI工具提升8倍视频分辨率】

Adobe公司推出名为VideoGigaGAN的全新AI工具,通过上采样技术可以将视频分辨率从128×128提升到1024*1024。VideoGigaGAN是在现有的图像GigaGAN技术的基础上,通过引入视频特有的改进实现。GigaGAN原本用于图像的上采样,提供高质量的细节增强。VideoGigaGAN将这一技术扩展到视频领域,特别关注于保持视频帧间的时间一致性和细节丰富度。研究人员在VideoGigaGAN的解码块中加入时间注意力层,使模型能够更好地处理视频帧之间的时间关系,从而减少时间上的闪烁和不连贯现象。

 

投融资信息

1.【Parloa在B轮融资中筹集6600万美元,推动AI客服技术革新】

德国AI客服对话平台初创公司Parloa宣布筹集了6600万美元的B轮融资。本轮融资的投资方包括美国的Altimeter Capital,以及EQT Ventures、Newion等。Parloa计划将筹集的资金用于加强其在欧洲和美国市场的增长,特别是加速在美国市场的扩张。Parloa还打算利用这笔资金来进一步发展其AI驱动的语音对话技术,以提供更人性化的客服体验。Parloa成立于2018年,由联合创始人兼首席执行官Malte Kosub和联合创始人兼首席技术官Stefan Ostwald领导。公司的主营业务是提供对话AI平台,专注于客服自动化,包括电子邮件和即时消息的自动化。Parloa利用大型语言模型和生成式AI基础设施,为客户提供更智能的对话式AI解决方案。

 

2.【英伟达宣布收购AI初创公司Run:ai,强化计算基础设施管理能力】

英伟达正式宣布与以色列人工智能初创公司Run:ai达成最终协议,将收购这家基于Kubernetes的工作负载管理和编排软件提供商。该交易的价值并未披露,估计约为7亿美元。Run:ai总部位于以色列,成立于 2018 年,是一家提供基于Kubernetes的工作负载管理和编排软件的公司,专门帮助企业客户管理和优化计算基础设施。Run:ai的平台支持所有流行的Kubernetes变体,并与第三方的AI工具和框架集成。英伟达计划在可预见的未来继续以相同的商业模式提供Run:ai产品,并将其整合到NVIDIA DGX Cloud中。

 

3.【Nooks在A轮融资中筹得2200万美元】

美国AI驱动的电话营销初创公司Nooks宣布筹集了2200万美元的A轮融资。本轮融资由前Stripe高管Lachy Groom领投,Tola Capital和Stifel Venture Banking参投。该公司计划将筹集的资金用于进一步开发其AI平台以自动化销售代表经常执行的重复性任务。Nooks由Dan Lee在2020年创立,主要业务是为销售团队提供自动化工具,以提高销售效率。Nooks转型利用AI技术帮助销售代表避免销售电话中的机械部分,如在无人接听时跳过数字,并提供笔记、呼叫记录和无效化处理功能。此外,Nooks还提供呼叫转录和评分功能,并且可以与Salesforce、HubSpot等CRM平台以及Outreach、SalesLoft和Apollo等销售参与平台集成。

 

AI安全与伦理

1.【华为Pura 70 Ultra手机AI消除功能引发争议,公司紧急进行算法调整】

华为Pura 70 Ultra手机中的AI消除功能近日引发热议。该事件的起因是,有网友在网络平台中晒出利用华为Pura 70 Ultra手机图库AI消除功能,对照片中的女生胸口处衣服进行涂抹的场景演示。演示中,该功能成功将照片中涂抹区域进行了补齐,生成出了相应画面。部分手持华为 Pura 70 Ultra 手机的网友也对此功能进行验证,发现该功能可以复盘实现,因此引发热议。华为相关工作人员表示,该情况属于功能BUG,已进行算法优化,在处理有风险图片时会提示该图片无法使用消除功能。