2025-05-08
大幅提升了编码等相关能力 尤其在前端开发方面,排名 WebDev Arena 第一 -更好地支持函数调用、模块重构、逻辑判断 - 首次成功通过 Cognition 的高级开发者评测,具备“类资深开发者”的架构理解力 - 可基于一段 YouTube 视频,自动生成交互式学习 App 包括内容提取、界面构建与逻辑生成,使得AI 正从“语言驱动代码”进化为“视频驱动产品”的多模态阶段。

据报道,苹果公司正在开发基于人工智能的搜索引擎,计划将其集成到Safari浏览器中,以减少对谷歌搜索的依赖。
此举可能对谷歌的广告收入构成威胁。
苹果的这一战略转变可能重塑搜索引擎市场格局,为用户提供更多选择,并推动搜索技术的创新。

网络安全公司CrowdStrike宣布裁员500人,占其员工总数的约5%,以适应由人工智能驱动的业务转型,同时计划在产品工程和客户服务等领域继续招聘。
AI技术的快速发展正在重塑就业市场,企业和员工需积极应对技能转型的挑战。

欧洲时尚零售商Zalando正在采用生成式AI技术来加速营销内容的制作过程,将图像制作时间从6-8周缩短至3-4天,成本降低了90%,以更快地响应社交媒体上的时尚趋势。
AI技术的应用提高了营销效率,使零售商能够更迅速地适应市场变化,提升竞争力。
只需一张照片、一段脚本和自己的语音,即可生成一个非常逼真数字人 - 新模型基于“扩散式音频驱动表情引擎”,能根据语音的节奏、语调、情绪合成真实的面部表情和动作。 - 支持侧脸图像与角度变化,带来更具电影感的画面。 - 支持唱歌同步(节奏匹配) - 不仅同步声音,还能“理解”语义与情感,表现出暂停、点头、语调起伏等微动作。 - 支持 30 秒音频/脚本:最多上传 30 秒的语音或文本脚本生成动画。
可以直接在工作流中调用主流的图像和视频模型API 直接进行统一编排生成任务 支持Google Veo2、OpenAI GPT-4o image、Stability AI、Luma、Recraft、Pika 2.2、PixVerse、Ideogram 等共 11 个模型系列、65 个节点。 现在你可以ComfyUI 的工作流并行调用图像、视频生成、文本转视频等不同模型,无需退出界面,统一编排生成任务
AI深度研究员