No.51

2024-05-02

AI深度研究员人工智能领域内的最新进展是什么？每日AI精选带给你

AI精选（51）-人工智能领域内的最新进展

主理人：

AI深度研究员

今日精选，深度丰富、精彩纷呈！我们诚邀大家继续关注并订阅我们内容，AI时代不落后，让每一天都充满启发和价值

一、在第74届柏林国际电影节上

Millennium Films 的总裁 Jonathan Yunger 称：新的《地狱男爵》电影使用AI进行了许多角色设计。

”我在一个小时内用人工智能制作 3000 个生物设计。我可以挑选和编辑这些设计，然后将其发送给视觉效果团队。”

Yunger 强调；“我不认为AI会取代人类，相反，使用AI的人将取代那些不使用的人。”

来源：https://motionpictures.org/2024/03/lights-camera-action-plan-a-focus-on-the-filmmakers-of-tomorrow-at-berlinale/

二、美国八家新闻机构起诉 OpenAI、微软，指控其 AI 工具侵犯版权

八家新闻机构在纽约联邦法院对 OpenAI 和微软提起诉讼，指控这两家公司未经许可使用它们的新闻作品来训练生成式人工智能。

诉状称微软的 Copilot 和 OpenAI 的 ChatGPT 非法复制数百万篇文章来培训其 AI 模型，并伪造了一些文章。

诉状还提到，某些时候微软和OpenAI的AI会逐字或近乎逐字地复制受版权保护的新闻作品，但不提供这些作品的作者、标题、版权或使用条款信息。

更可恶的是，ChatGPT还“伪造”了那些损害其声誉的文章，比如《丹佛邮报》一篇宣扬吸烟可以治疗哮喘的虚假文章。

要求 OpenAI 和微软赔偿损失，并停止侵犯版权行为。

新闻行业的律师Steven Lieberman评论称，OpenAI的巨大成功也要归功于其他人的工作，它在未经许可或付款的情况下获取了大量优质内容。

《纽约时报》本月揭露称，OpenAI、谷歌、Meta等公司为了获取训练语料，不惜修改政策条款、无视互联网信息的使用规则，违法使用了“多个来源”的数据。

这些新闻机构包括《纽约每日新闻》等，它们都属于奥尔登全球资本公司的对冲基金。

此前，《纽约时报》等也对这两家公司发起了类似诉讼。与此同时，OpenAI 已经与一些新闻机构达成了合作协议。

就在本周，英国《金融时报》(FT)宣布与OpenAI达成协议，将授权后者使用其资料库来训练AI模型。

今年1月，OpenAI表示，其正与数十家出版商洽谈文章授权协议。截至目前，除了FT外，OpenAI还和美国的美联社、德国的施普林格、法国的《世界报》和西班牙的Prisa Media达成了协议。

OpenAI每年向一些媒体公司提供100万至500万美元的授权费用，这远远低于苹果等其他公司的报价。

据报道，就在周二，谷歌同意每年向《华尔街日报》的母公司新闻集团支付500万至600万美元，用于开发新的AI相关内容和产品。

来源：https://abcnews.go.com/US/wireStory/us-newspapers-sue-chatgpt-maker-openai-microsoft-copyright-109796303

三、据报道，苹果公司从谷歌挖走了大量AI领域的专家，为加强在全球AI竞争中积极布局的决心

苹果积极从谷歌招聘AI专家，如Ruslan Salakhutdinov（苹果前AI研究主管）和Giannandrea（曾监管谷歌大脑的人物），以及其他一些在AI领域有重要贡献的专家。

这次人才引进反映了苹果在AI技术上的长远规划和业务扩展的需求，加强自身在AI领域的研发和应用能力。

通过吸纳行业顶尖人才，苹果希望在AI技术竞争中占据更有利的位置，尤其是在智能手机和其他智能设备的AI应用上。

来源：https://www.ft.com/content/87054a60-dc4d-4238-a4b9-93ab48f22f56

四、百度文心杯创业大赛第二季报名倒计时 15 天，AI 应用开发者快来报名

大赛顺应 AI 创业全球化浪潮，面向全球招募创业创新团队。参赛不限背景、不限方向、不限阶段，只要创业方向是 AI 原生应用，无论是垂直应用、智能体，或者是大模型能够解决问题、创造价值的任何领域，都可以报名参赛。

本季大赛全面升级了对创业者的支持力度，提供更丰厚的战略投资、业务资源和流量曝光。一、二、三等奖的获奖团队，将分别获得价值人民币 1000 万元、500 万元、200 万元的资金与资源投资。https://mp.weixin.qq.com/s/UZGVKSQjZOiG99brSU4Qvw

五、Play Al：一个高级对话系统，能够在实时对话中模拟人类的交流方式

包括语境理解、交替对话、应对中断以及模拟情感和语音强度，旨在提供流畅、自然且富有人情味的人机交互体验。

主要功能：

1. 处理轮流对话（Turn-taking）：这个模型能够管理和维持对话中的轮流交谈，即在何时说话和何时听取对方讲话之间进行切换，模仿真实的人类对话动态。

2.中断处理：能够处理对话中的突然中断，然后适当地恢复对话，保证交流的流畅性。

3. 声音能量和情感调节：该模型还能调整语音的能量（即声音的强弱）和情感，使得生成的语音不仅仅是机械的输出，而是能够表达类似人类的情感波动和语调变化，从而更加自然和具有说服力。

在线体验：http://play.ai

六、美国版“大众点评”Yelp 推出一款全新 AI 助手，帮助消费者与商家建立联系

这款聊天机器人用户可以直接在聊天界面描述问题，聊天机器人会提出后续问题以收集更多信息。用户随后能看到专业人士对其项目的消息，并可以自定义回复或使用应用的快速回复功能。

Yelp表示，该聊天机器人利用OpenAI的大型语言模型（LLMs）以及Yelp自己的数据来询问用户的问题，并将他们与合适的专业人员联系起来。

整合AI技术来增强其平台功能，提高用户与商家之间的互动和连接效率。

七、波士顿动力公司新视频，开始给机器狗装皮肤了，感觉装上皮肤以后确实亲和了很多

八、Meshy AI 一周年之际发布3D模型工具：Meshy-3

新版本增加了：

高多边形雕塑风格：这是一种为下一代游戏和电影设计的高多边形数的3D建模风格，可以创建更为复杂和精细的3D模型。

PBR风格：提供了更高的材质真实感和动态光照效果，使得3D模型看起来更为真实。

支持：

文本到3D转换：引入高多边形雕塑风格，适用于下一代游戏和电影；使用PBR风格增强材质真实感和动态光照。

图像到3D转换：增强了自然的形状和清晰的纹理。

还新增了如纹理修复、提示助手等功能。

试用：meshy.ai/?utm=twitter

九、Gemini 现在可以直接在 Chrome 地址栏快速对话了

今天 Chrome 上了一个新功能，可以直接在地址栏输入 @ 就会自动出现和 gemini 对话，选择之后输入提示词就会自动跳转到网页版 Gemini 并给出答案，算是一个快捷方式

实测了一下，目前只支持英文对话，中文对话是乱码，速度很快，对临时处理一些问题很方便，不用专门打开一个界面交互了

链接：gemini.google.com

十、OpenAI 的批处理 API 现在支持 Embedding 和视觉模型

Batch API 现在支持批量嵌入将每批请求数限制从 10,000 增加到 50,000，并增加了从仪表板管理批次的功能。

我们还增加了对视觉的支持，提高了速率限制，并让用户能够轻松地直接从仪表板创建批次。

请参阅入门指南： https://platform.openai.com/docs/guides/batch

十一、ZeST：改变物体材质

上传要改变材质的图片，再上传材质参考，即可修改图片中物体的材质。

在线体验：https://huggingface.co/spaces/fffiloni/ZeST…

项目地址：https://ttchengab.github.io/zest/

Github：https://github.com/ttchengab/zest_code…

该内容为专享内容

购买AI深度研究员的简报专栏即可查看全部内容