一、亚马逊AI视频模型Nova Reel重大升级,可生成长达两分钟的多镜头视频Nova Reel模型升级:亚马逊宣布其AI视频生成模型 Nova Reel 的最新版 Nova Reel 1.1 现已能够生成最长达2分钟的视频片段。每个视频由多个6秒镜头组成,支持保持风格一致的“多镜头(multi-shot)”结构。生成方式更灵活:用户可输入最多4000字符的文本提示,生成连续性较强的视频内容。新增的“Multishot Manual(多镜头手动模式)”允许用户上传一张图像并结合文本提示,控制视频画面的构图。分辨率与输入规范:在 Multishot Manual 模式下,系统可使用一张 1280x720 分辨率的图像 与最多 512字符的提示语,生成最多20个镜头的视频片段。来源:https://techcrunch.com/2025/04/07/amazon-says-its-ai-video-model-can-now-generate-minutes-long-clips/二、Google搜索引入AI多模态功能,整合文字与图像识别技术AI Mode 多模态搜索功能上线:Google 正在为其搜索中的 AI 模式引入多模态功能,即用户可上传图片,AI 能“看图说话”,提供综合性答案。此功能结合了 Google 自家的 Gemini 大模型 与 Google Lens 图像识别技术。具体实现方式:用户可以拍照或上传图像,AI 模式会使用“扇出式技术”同时提出多个查询,从不同角度解读图像内容。能识别图中物体、材质、颜色、摆放关系等,并基于 Google 的搜索索引生成带链接的丰富回复。使用场景举例:如果你上传一本书的照片,AI 不仅能识别该书名,还会推荐类似的高评分书籍,并回答相关问题。同样可用于识别衣物、食品、艺术品等生活中常见场景,提供背景信息或购买建议。来源:https://www.theverge.com/news/644363/google-search-ai-mode-multimodal-lens-image-recognition三、Google AI 搜索变革引发网站创作者不满Google 正在将 AI 深度整合进其搜索结果页面,尤其是通过“AI Overview”功能,在搜索结果顶部展示由人工智能总结的直接答案。这一做法减少了用户点击网站链接的需求,影响了依靠搜索流量的网站。网站创作者的担忧:许多内容创作者、媒体出版商和博客主表示,他们的访问量正在下降,因为用户越来越少点击实际来源页面。部分网站依赖广告或会员制度来盈利,流量的减少对其收入构成直接打击。来源:https://www.bloomberg.com/news/articles/2025-04-07/google-ai-search-shift-leaves-website-makers-feeling-betrayed四、OpenAI据称曾考虑收购由Altman和Jony Ive打造的AI设备初创公司OpenAI 的 CEO Sam Altman 与前苹果首席设计师 Jony Ive 合作创办了一家名为 io Products 的 AI 设备初创公司。该公司致力于研发人工智能驱动的个人设备,包括无屏幕“手机”和AI家庭设备等,产品尚处于早期设计阶段。收购传闻:据《The Information》报道,OpenAI 近期曾认真考虑以 至少5亿美元 的价格收购该初创公司。此次潜在交易也可能包括目前正参与设备开发的工程师团队。OpenAI的战略意图:此举将有助于 OpenAI