No.40

2024-04-23

APPSO Hunt Good周报

波士顿动力发布新款人形机器人，动作酷似《午夜凶铃》吓坏马斯克

主理人：

APPSO-by-ifanr

欢迎收看最新一期的 Hunt Good 周报！

在本期内容你会看到：

6 条新鲜资讯
3 个有用工具
1 个有趣案例
3 个鲜明观点

Hunt for News｜先进头条

波士顿动力放大招了！人形机器人 Atlas 全面电动化

本周，波士顿动力公司上演了一场「仰卧起坐」般的表演。前一天还在宣布液压驱动的人形机器人 Atlas 正式退役，后一天则官宣全电动的 Atlas 人形机器人「复活」。

波士顿官方也分享了一段关于新 Atlas 的视频。视频中，该机器人先是一动不动地趴在地上，随后通过脚部以及头部的巧妙旋转，完成了一个完美的站立。

Atlas 最初被设计为一个搜救机器人，执行一些比较危险的任务，如今已经演变为更加贴近现实应用需求的机器人。

波士顿动力官方称：「下一代 Atlas 计划建立在数十年研究的基础上，进一步履行了我们的承诺，即提供最强大、最有用的移动机器人，解决当今行业最严峻的挑战：通过 Spot、Stretch，以及现在通过 Atlas。」

有趣的是，对于新 Atlas 的发布，马斯克也来凑热闹

https://twitter.com/BostonDynamics/status/1780603212359205323

法国 AI 独角兽 Mistral AI 寻求新一轮融资

据 The Information 报道，「欧洲版 OpenAI」Mistral AI 正在与投资者接洽，希望以 50 亿美元的估值进行下一轮融资。

知情人士透露，尚不清楚哪些投资者参与了这笔交易，但 Mistral AI 一直在与英国、法国和美国的基金公司展开讨论。

今年 2 月，微软向 Mistral 投资了 1600 万美元，双方随即开展了合作，微软宣布将向其 Azure 云服务的客户提供 Mistral AI 的最新语言模型。

https://www.theinformation.com/articles/mistral-an-openai-rival-in-europe-in-talks-to-raise-capital-at-a-5-billion-valuation?rc=th6t9m

Nothing 耳机率先整合 ChatGPT

Nothing 公司近日宣布，将 AI 聊天机器人 ChatGPT 整合进其高端无线耳机和手机产品，让用户通过对话与设备互动，获取即时的会话式反馈。

自 4 月 18 日起，该功能已通过免费软件更新向用户逐步推出。用户可通过 Nothing 手机或耳机唤醒 ChatGPT，用于回答问题或执行任务。

首批搭载 ChatGPT 的 Nothing 手机包括 Nothing Phone 1 和 Nothing Phone 2a 等，更新将在接下来的数周内完成。

此外，Nothing Ear 和 Nothing Ear (a)系列耳机也将在不久后整合 ChatGPT 功能。

https://www.theverge.com/2024/4/18/24133813/nothing-chatgpt-ai-integration-announced

TED x Sora，用 AI 预见 40 年后

非营利组织 TED 近日与艺术家 @PaulTrillo 达成合作，使用尚未发布的 AI 视频生成工具 Sora 制作了 TED 40 年后的样貌。

TED 官方表示，该视频除了 TED logo，其余都是使用 AI/Sora 生成。视频如下

https://twitter.com/TEDTalks/status/1781351036877156452?ref\_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1781351036877156452%7Ctwgr%5E34e395ec43e680be79b590d3da16424aa3779a3b%7Ctwcon%5Es1\_&ref\_url=https%3A%2F%2Fwww.redditmedia.com%2Fmediaembed%2F1c82lge%2F%3Fresponsive%3Dtrueis\_nightmode%3Dfalse

VASA-1 让照片「活」起来

近日，微软推出新模型 VASA-1，支持用一张照片和音频样本，即可生成超逼真的说话脸部视频。

类似于阿里巴巴的 EMO 技术，生成的视频支持精确的唇语同步、逼真的面部特征和实时生成的自然头部运动。

例如，让蒙娜丽莎来段 Rap。

需要说明的是，目前该模型仅为研究预览版，尚未向公众开放测试。

论文地址：https://arxiv.org/abs/2404.10667

https://www.microsoft.com/en-us/research/project/vasa-1/?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=meta-takes-on-chatgpt

✏️ Stability AI 宣布 Stable Diffusion 3 现已通过 API 提供

在备受争议的前 CEO Emad Mostaque 离职后，AI 明星公司 Stability AI 本周宣布裁员 10%。

在裁员之余，Stability AI 还宣布其开发者平台 API 现已支持 Stable Diffusion 3 及其增强版本 Stable Diffusion 3 Turbo。

官方称 Stable Diffusion 3 模型在文字到图像生成领域的表现媲美或超越了如 DALL·E 3和 Midjourney v6 等行业领先模型。

体验地址：https://sdxlturbo.ai/stable-diffusion3

https://stability.ai/news/stable-diffusion-3-api?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=a-new-humanoid-robot-emerges

Hunt for Tools｜先进工具

Sora 加入 Adobe 全家桶！

本周，Adobe 公司宣布将更新 Premiere Pro，向其中引入来自第三方 AI 视频生成模型的插件如 OpenAI 的 Sora 以及 Runway ML Gen-3 和 Pika 1.0 等。

除了支持第三方模型，Adobe 还发布了一些新功能，比如对象添加、对象移除，以及创意内容 AI 扩展的能力。

前不久，有消息称，Adobe 开始采购视频素材，以开发 AI 视频生成工具追赶 OpenAI 的视频生成工具 Sora。

具体可回看 APPSO 此前文章

Sora 加入 Adobe 全家桶！一句话 P 视频，真成「美图秀秀」了

https://news.adobe.com/news/news-details/2024/Adobe-previews-breakthrough-AI-innovations-to-advance-professional-video-workflows-within-Adobe-Premiere-Pro/default.aspx?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=adobe-s-ai-video-magic

Meta 推出 Llama 3 开源大模型

Meta 正式推出旗下新一代的开源大语言模型 Llama 3，包括两个版本：Llama 3 8B 与 Llama 3 70B。

据介绍，Llama 3 使用的数据量是 Llama 2 的七倍，模型性能和准确性提高，推理、代码生成和遵循指令等方面的能力取得突破，使其更加灵活和易于使用。

Meta 声称，基准测试显示，Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试中击败 Google Gemma 7B 以及 Mistral 7B Instruct，而 Llama 3 70B 则略胜于 Gemini 1.5 Pro。

Meta 还透露，他们最大的模型参数超越 400B，接下来几个月将会推出具备多模态、多语言对话、更长上下文窗口等能力的新模型。

https://twitter.com/AIatMeta/status/1780997403979735440

月之暗面 Kimi 智能助手功能升级

昨日，国内 AI 初创公司月之暗面宣布为旗下 AI 聊天机器人 Kimi 推出新功能。本次 Kimi 在四个方面迎来了更新：

·模型能力提升，更稳的基座能力

·Kimi 常用语，更开箱即用的 Prompt

·语音输入/播报，更丰富的交互

·搜索支持引用溯源，更严谨的回答

据介绍，Kimi 在逻辑能力、交互方式上取得进步，给出的信息也更严谨。

https://mp.weixin.qq.com/s/tXjq0yzYmPZrx5l-HNQ8Eg

Hunt for Fun｜先行

在 iPhone 上跑模型，一个 App 搞定

全球最大 AI 开源社区 Hugging Face 近日发布了一款名为「Hugging Chat」的 iOS App。

借助该 App，用户即可在手机上访问和使用 Hugging Face 平台上托管的各种开源模型。

不过，目前该应用仅提供 Command R+、Zephyr-14b、Mixtral8x7B，Gemma-1.1-7b 等模型，且这些模型中文能力欠佳。

下载链接：https://apps.apple.com/us/app/huggingchat/id6476778843

https://twitter.com/imxiaohu/status/1780961832104350128

Hunt for insights｜先知

黄仁勋：未来机器人会越来越像人类

近期，英伟达 CEO 黄仁勋与美国 CNBC 知名主持人吉姆·克莱默展开了一场关于未来技术的对话。

黄仁勋在访谈中提到，通过加速计算，英伟达重新定义了计算机的本质，让计算机的速度比过去快了 100 倍，能效提高 20 倍，成本降低 20 倍。

在他看来，正如使用 AI 去理解一本小说一样，未来人类可以使用类似的技术来理解蛋白质的结构、生命的本质，甚至使用计算机来模型生命过程。

黄仁勋认为未来机器人会越来越像人类，「原因之一是，我们为自己建造了世界工厂的『工作站』，工厂的生产线对人类来说非常有创意；另一个原因是，我们必须教会机器人如何成为一个高效的工作者。」

https://www.youtube.com/watch?app=desktop&v=BUqenMWZ7oE

李飞飞团队发布《2024 年人工智能指数报告》

由李飞飞联合领导的斯坦福大学以人为本人工智能研究所发布了《2024 年人工智能指数报告》，揭示了 2023 年人工智能行业的 10 大主要趋势：

1.人工智能在某些任务上胜过人类，但并非在所有任务上。

2.产业界继续主导人工智能前沿研究。

3.前沿模型变得更加昂贵。

4.美国成为顶级人工智能模型的主要来源国。

5.严重缺乏对 LLM 责任的可靠和标准化评估。

6.生成式人工智能投资激增。

7.数据显示，人工智能让打工人更有生产力，工作质量更高。

8.得益于人工智能，科学进步进一步加速。

9.美国的人工智能法规数量急剧增加。

10.人们对人工智能的潜在影响有了更深刻的认识，同时也更焦虑。

附上报告原文：https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI\_AI-Index-Report-2024.pdf

https://mp.weixin.qq.com/s/ohRWJ7wMfHEb8XBRk3xhPA

OpenAI CEO、COO：AI 成本可降至接近零

OpenAI CEO Sam Altman、COO Brad Lightcap 近日一同接受了 20VC 采访。

采访中，Altman 认为限制如今 AI 发展的关键是地缘政治、社会经济等方面的不稳定，这甚至可能是「根本原因」。

他也表示，OpenAI 可以将非常高质量的 AI 技术成本降至「接近零」，这将对世界上大多数事情非常有利。

Lightcap 认为，企业供应链「非常需要 AI 技术加持」，将 ChatGPT 投入到供应链管理流程可削减特定领域 20% 的支出。

https://www.youtube.com/watch?v=G8T1O81W96Y

彩蛋时间

作者：@AIARTGALLARY

工具：DALL·E 3

prompt:A dron shot of Giant sculpture of [SUBJECT] constructed from [MATERIAL] at [LOCATION]， intricate detail， 4k rendered

https://twitter.com/AIARTGALLARY/status/1778789754575978849

该内容为专享内容

订阅APPSO，即可查看全部内容