扫码打开虎嗅APP

No.40

2024-04-23

APPSO Hunt Good周报

波士顿动力发布新款人形机器人,动作酷似《午夜凶铃》吓坏马斯克

主理人:
欢迎收看最新一期的 Hunt Good 周报!

在本期内容你会看到:

6 条新鲜资讯
3 个有用工具
1 个有趣案例
3 个鲜明观点

Hunt for News|先进头条

 

波士顿动力放大招了!人形机器人 Atlas 全面电动化

 

本周,波士顿动力公司上演了一场「仰卧起坐」般的表演。前一天还在宣布液压驱动的人形机器人 Atlas 正式退役,后一天则官宣全电动的 Atlas 人形机器人「复活」。

 

波士顿官方也分享了一段关于新 Atlas 的视频。视频中,该机器人先是一动不动地趴在地上,随后通过脚部以及头部的巧妙旋转,完成了一个完美的站立。

 

Atlas 最初被设计为一个搜救机器人,执行一些比较危险的任务,如今已经演变为更加贴近现实应用需求的机器人。

 

波士顿动力官方称:「下一代 Atlas 计划建立在数十年研究的基础上,进一步履行了我们的承诺,即提供最强大、最有用的移动机器人,解决当今行业最严峻的挑战:通过 Spot、Stretch,以及现在通过 Atlas。」

 

有趣的是,对于新 Atlas 的发布,马斯克也来凑热闹 

 

 

 

https://twitter.com/BostonDynamics/status/1780603212359205323

 

法国 AI 独角兽 Mistral AI 寻求新一轮融资

 

据 The Information 报道,「欧洲版 OpenAI」Mistral AI 正在与投资者接洽,希望以 50 亿美元的估值进行下一轮融资。

 

 

知情人士透露,尚不清楚哪些投资者参与了这笔交易,但 Mistral AI 一直在与英国、法国和美国的基金公司展开讨论。

 

今年 2 月,微软向 Mistral 投资了 1600 万美元,双方随即开展了合作,微软宣布将向其 Azure 云服务的客户提供 Mistral AI 的最新语言模型。

 

https://www.theinformation.com/articles/mistral-an-openai-rival-in-europe-in-talks-to-raise-capital-at-a-5-billion-valuation?rc=th6t9m

 

Nothing 耳机率先整合 ChatGPT

Nothing 公司近日宣布,将 AI 聊天机器人 ChatGPT 整合进其高端无线耳机和手机产品,让用户通过对话与设备互动,获取即时的会话式反馈。

 

自 4 月 18 日起,该功能已通过免费软件更新向用户逐步推出。用户可通过 Nothing 手机或耳机唤醒 ChatGPT,用于回答问题或执行任务。

 

 

首批搭载 ChatGPT 的 Nothing 手机包括 Nothing Phone 1 和 Nothing Phone 2a 等,更新将在接下来的数周内完成。

 

此外,Nothing Ear 和 Nothing Ear (a)系列耳机也将在不久后整合 ChatGPT 功能。

 

https://www.theverge.com/2024/4/18/24133813/nothing-chatgpt-ai-integration-announced

 

TED x Sora,用 AI 预见 40 年后

 

非营利组织 TED 近日与艺术家 @PaulTrillo 达成合作,使用尚未发布的 AI 视频生成工具 Sora 制作了 TED 40 年后的样貌。

 

TED 官方表示,该视频除了 TED logo,其余都是使用 AI/Sora 生成。视频如下

 

https://twitter.com/TEDTalks/status/1781351036877156452?ref\_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1781351036877156452%7Ctwgr%5E34e395ec43e680be79b590d3da16424aa3779a3b%7Ctwcon%5Es1\_&ref\_url=https%3A%2F%2Fwww.redditmedia.com%2Fmediaembed%2F1c82lge%2F%3Fresponsive%3Dtrueis\_nightmode%3Dfalse

 

VASA-1 让照片「活」起来

 

近日,微软推出新模型 VASA-1,支持用一张照片和音频样本,即可生成超逼真的说话脸部视频。

 

类似于阿里巴巴的 EMO 技术,生成的视频支持精确的唇语同步、逼真的面部特征和实时生成的自然头部运动。

 

例如,让蒙娜丽莎来段 Rap。

 

需要说明的是,目前该模型仅为研究预览版,尚未向公众开放测试。

 

论文地址:https://arxiv.org/abs/2404.10667

 

https://www.microsoft.com/en-us/research/project/vasa-1/?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=meta-takes-on-chatgpt

 

✏️ Stability AI 宣布 Stable Diffusion 3 现已通过 API 提供

 

在备受争议的前 CEO Emad Mostaque 离职后,AI 明星公司 Stability AI 本周宣布裁员 10%。

 

在裁员之余,Stability AI 还宣布其开发者平台 API 现已支持 Stable Diffusion 3 及其增强版本 Stable Diffusion 3 Turbo。

 

 

官方称 Stable Diffusion 3 模型在文字到图像生成领域的表现媲美或超越了如 DALL·E 3和 Midjourney v6 等行业领先模型。

 

体验地址:https://sdxlturbo.ai/stable-diffusion3

 

https://stability.ai/news/stable-diffusion-3-api?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=a-new-humanoid-robot-emerges


Hunt for Tools|先进工具

 

Sora 加入 Adobe 全家桶!

本周,Adobe 公司宣布将更新 Premiere Pro,向其中引入来自第三方 AI 视频生成模型的插件如 OpenAI 的 Sora 以及 Runway ML Gen-3 和 Pika 1.0 等。

 

除了支持第三方模型,Adobe 还发布了一些新功能,比如对象添加、对象移除,以及创意内容 AI 扩展的能力。

 

 

前不久,有消息称,Adobe 开始采购视频素材,以开发 AI 视频生成工具追赶 OpenAI 的视频生成工具 Sora。

 

具体可回看 APPSO 此前文章

 

Sora 加入 Adobe 全家桶!一句话 P 视频,真成「美图秀秀」了

 

https://news.adobe.com/news/news-details/2024/Adobe-previews-breakthrough-AI-innovations-to-advance-professional-video-workflows-within-Adobe-Premiere-Pro/default.aspx?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=adobe-s-ai-video-magic

 

Meta 推出 Llama 3 开源大模型

Meta 正式推出旗下新一代的开源大语言模型 Llama 3,包括两个版本:Llama 3 8B 与 Llama 3 70B。

 

据介绍,Llama 3 使用的数据量是 Llama 2 的七倍,模型性能和准确性提高,推理、代码生成和遵循指令等方面的能力取得突破,使其更加灵活和易于使用。

 

 

Meta 声称,基准测试显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试中击败 Google Gemma 7B 以及 Mistral 7B Instruct,而 Llama 3 70B 则略胜于 Gemini 1.5 Pro。

 

Meta 还透露,他们最大的模型参数超越 400B,接下来几个月将会推出具备多模态、多语言对话、更长上下文窗口等能力的新模型。

 

https://twitter.com/AIatMeta/status/1780997403979735440

 

月之暗面 Kimi 智能助手功能升级

 

昨日,国内 AI 初创公司月之暗面宣布为旗下 AI 聊天机器人 Kimi 推出新功能。本次 Kimi 在四个方面迎来了更新:

 

·模型能力提升,更稳的基座能力

 

·Kimi 常用语,更开箱即用的 Prompt

 

·语音输入/播报,更丰富的交互

 

·搜索支持引用溯源,更严谨的回答

 

据介绍,Kimi 在逻辑能力、交互方式上取得进步,给出的信息也更严谨。

 

https://mp.weixin.qq.com/s/tXjq0yzYmPZrx5l-HNQ8Eg

 

Hunt for Fun|先行

 

在 iPhone 上跑模型,一个 App 搞定

全球最大 AI 开源社区 Hugging Face 近日发布了一款名为「Hugging Chat」的 iOS App。

 

借助该 App,用户即可在手机上访问和使用 Hugging Face 平台上托管的各种开源模型。

 

 

不过,目前该应用仅提供 Command R+、Zephyr-14b、Mixtral8x7B,Gemma-1.1-7b 等模型,且这些模型中文能力欠佳。

 

下载链接:https://apps.apple.com/us/app/huggingchat/id6476778843

 

https://twitter.com/imxiaohu/status/1780961832104350128

 

Hunt for insights|先知

 

黄仁勋:未来机器人会越来越像人类

近期,英伟达 CEO 黄仁勋与美国 CNBC 知名主持人吉姆·克莱默展开了一场关于未来技术的对话。

 

黄仁勋在访谈中提到,通过加速计算,英伟达重新定义了计算机的本质,让计算机的速度比过去快了 100 倍,能效提高 20 倍,成本降低 20 倍。

 

 

在他看来,正如使用 AI 去理解一本小说一样,未来人类可以使用类似的技术来理解蛋白质的结构、生命的本质,甚至使用计算机来模型生命过程。

 

黄仁勋认为未来机器人会越来越像人类,「原因之一是,我们为自己建造了世界工厂的『工作站』,工厂的生产线对人类来说非常有创意;另一个原因是,我们必须教会机器人如何成为一个高效的工作者。」

 

https://www.youtube.com/watch?app=desktop&v=BUqenMWZ7oE

 

李飞飞团队发布《2024 年人工智能指数报告》

 

由李飞飞联合领导的斯坦福大学以人为本人工智能研究所发布了《2024 年人工智能指数报告》,揭示了 2023 年人工智能行业的 10 大主要趋势:

 

1.人工智能在某些任务上胜过人类,但并非在所有任务上。

2.产业界继续主导人工智能前沿研究。

3.前沿模型变得更加昂贵。

4.美国成为顶级人工智能模型的主要来源国。

5.严重缺乏对 LLM 责任的可靠和标准化评估。

6.生成式人工智能投资激增。

7.数据显示,人工智能让打工人更有生产力,工作质量更高。

8.得益于人工智能,科学进步进一步加速。

9.美国的人工智能法规数量急剧增加。

10.人们对人工智能的潜在影响有了更深刻的认识,同时也更焦虑。

 

附上报告原文:https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI\_AI-Index-Report-2024.pdf

 

https://mp.weixin.qq.com/s/ohRWJ7wMfHEb8XBRk3xhPA

 

OpenAI CEO、COO:AI 成本可降至接近零

OpenAI CEO Sam Altman、COO Brad Lightcap 近日一同接受了 20VC 采访。

 

采访中,Altman 认为限制如今 AI 发展的关键是地缘政治、社会经济等方面的不稳定,这甚至可能是「根本原因」。

 

 

他也表示,OpenAI 可以将非常高质量的 AI 技术成本降至「接近零」,这将对世界上大多数事情非常有利。

 

Lightcap 认为,企业供应链「非常需要 AI 技术加持」,将 ChatGPT 投入到供应链管理流程可削减特定领域 20% 的支出。

 

https://www.youtube.com/watch?v=G8T1O81W96Y

 

彩蛋时间

 

 

作者:@AIARTGALLARY

 

工具:DALL·E 3

 

prompt:A dron shot of Giant sculpture of [SUBJECT] constructed from [MATERIAL] at [LOCATION], intricate detail, 4k rendered

 

https://twitter.com/AIARTGALLARY/status/1778789754575978849