扫码打开虎嗅APP

No.50

2024-05-07

虎视 AI AI 早报

特斯拉人形机器人Optimus精准执行工厂任务;微软Start团队发布天气预测模型;Adobe推出Project Neo

主理人:
虎嗅出品,每日推送AI领域资讯新闻,追踪AI的每一步进展。

巨头动态

1.【特斯拉人形机器人Optimus精准执行工厂任务】

特斯拉分享了一段第二代Optimus人形机器人的工作视频,视频显示,该机器人可将电池单体精确地插入托盘中。特斯拉官方表示训练并部署了一个神经网络,允许Optimus开始执行有用的任务,例如从传送带上捡起电池单体并精确地将它们插入托盘中。这个神经网络完全端到端运行,只使用来自机器人的 2D 摄像头以及板载的本体感知传感器的视频,并直接产生关节控制序列。马斯克此前在一季度财报电话会议上表示,预计在今年底之前,特斯拉的Optimus人形机器人将拥有完成“有用的”工厂任务的能力,可能会在2025年底前将其对外销售。 

 

2.【微软Start团队发布天气预测模型,准确率、计算效率全面提升】

微软Start团队发布了一款数据驱动AI天气预测模型,能够准确预测未来30天的天气情况。该模型结合了五种不同的人工智能模型和三种深度学习架构,利用过去数十年的天气数据进行训练,能够学习并模拟复杂的气象变化规律。在预报准确率和计算效率上均有突破。在预估未来一周的天气预报方面,新AI模型的气温准确率比目前欧洲中期天气预报中心(ECMWF)的模型高出17%。ECMWF模型依赖超级计算机进行大量计算,新AI模型能够在单个NVIDIA V100图形处理单元上运行,在不到两小时的时间内产生100个30天的预测结果,大大减少了计算资源的需求。

 

技术突破

1.【南开大学HVision推出StoryDiffusion,可生成角色一致的多图漫画与长视频】

南开大学HVision团队发布了StoryDiffusion这一可以保持角色一致,生成多图漫画和长视频的工具。通过Consistent self-attention和Motion predictor,该工具能够生成连贯的图像和视频。StoryDiffusion的应用范围广泛,可用于漫画生成、图像转视频等多种场景,根据用户提供的文本提示,生成角色连贯的图像序列,通过预测不同图像之间的运动,能够进一步生成长视频。

 

2.【Udio AI音乐工具升级:扩展上下文窗口,助力创作更长更连贯的音乐】

AI音乐工具Udio宣布更新功能,致力于帮助用户创作出更长、更连贯的音乐作品。Udio的更新中,上下文窗口得到了扩展,现在用户在扩展一首歌曲的某个部分时,系统会考虑该部分前后最长两分钟的内容,使得歌曲在过渡和整体结构上更加流畅和自然。对于想要制作长篇混音、环境音乐或复杂前卫摇滚的音乐制作者来说,Udio现可支持长达15分钟的音轨制作。

 

3.【Adobe推出Project Neo,一站式解决2D图形设计的3D升级需求】

Adobe公司推出3D技术Project Neo,通过3D元素和效果的整合,提升传统2D图形设计的视觉效果和制作效率。借助Project Neo,用户可以为图标和动画插图创建独特的3D形状。该工具具备强大的风格化和造型功能,允许用户从不同角度对作品进行风格化和塑形,创建出引人注目的矢量和等距插图,并支持导出高质量的SVG文件。此外,Project Neo与Adobe的桌面和网络应用程序实现了无缝集成。

 

4.【HeyGen推出Instant Highlights 1.0,自动剪辑配音,加速多平台内容分发】

HeyGen公司推出一款自动视频剪辑工具Instant Highlights 1.0,旨在为用户提供更便捷的视频编辑体验,简化视频内容的多平台适配工作,提高内容传播效率。用户上传视频或粘贴视频链接,并选择语言,该工具将自动把视频剪辑成不同语言配音的短片,方便用户将内容分发到YouTube、Instagram、TikTok等多种平台上。此外,HeyGen还发布了Avatar in Motion 1.0技术,实现了虚拟角色的动作捕捉和声音克隆,拓宽了虚拟角色在多个领域的应用潜力。

 

5.【宾大突破:耐高温存储器问世,为恶劣环境AI系统奠定基础】

美国宾夕法尼亚大学科学家研制出一款可在600℃高温下持续工作60小时的存储器。这一耐受温度是目前商用存储设备的两倍多,表明该存储器具有极强的可靠性和稳定性。该设备由金属—绝缘体—金属结构组成,包括镍和铂电极以及一层45纳米厚的AlScN。这种结构设计使该存储器能与高温碳化硅逻辑器件兼容,与专为极端温度设计的高性能计算系统协同工作,有望在可导致电子或存储设备故障的极端环境或恶劣条件下应用。

 

投融资信息

1.【迁移科技获B轮数千万元融资,善达基金领投】

迁移科技完成数千万元B轮融资,由善达基金领投。迁移科技表示,本轮融资主要用于深化3D视觉产品全球化市场销售体系,加强底层技术研发以及3D视觉产品标准化,携手集成商伙伴实现3D视觉生态共赢。迁移科技成立于2017年,是一家3D工业相机和3D视觉系统供应商,累计完成了数亿元融资,致力于打造稳定、易用的AI+3D视觉系统,可应用于上下料、拆码垛、定位装配等场景,为全球工业制造和仓储物流自动化技术赋能。