扫码打开虎嗅APP

No.73

2024-05-24

AI深度研究员 人工智能领域内的最新进展是什么?每日AI精选带给你

AI精选(73)-人工智能领域内的最新进展:Mac 客户端GPT4o实时语音和视觉功能展示

主理人:
今日精选,深度丰富、精彩纷呈!我们诚邀大家继续关注并订阅我们内容,AI时代不落后,让每一天都充满启发和价值

一、Mac 版 ChatGPT 客户端能力首次展示

 

在巴黎的 VivaTech 活动上,OpenA 法国团队展示了最新GPT 4o实时语音和视觉你能力

不过这次使用的 Mac 版客户端

展示了实时翻译能力以及通过视觉识别简笔画并观看地图进度导航引导。

非常的有意思!可以看看!

 

 

二、OpenAI 与 新闻集团 达成内容许可协议

 

可以访问News Corp刊物(如《华尔街日报》、《纽约邮报》、《巴伦周刊》等)的当前和历史存档文章,用于AI训练和回答用户问题。

新闻集团将与 OpenAI 分享新闻专业知识",以确保OpenAI内容输出保持最高的新闻标准。

据报道该协议合作金额超过2.5亿美元,包括现金和使用OpenAI技术的信用。

OpenAI可以获取的内容源包括《华尔街日报》、《巴伦周刊》、《MarketWatch》、《投资者商业日报》、《金融新闻》、《纽约邮报》、《泰晤士报》、《星期日泰晤士报》、《太阳报》、《澳大利亚人报》、《新闻网》、《每日电讯报》、《信使邮报》、《广告商报》和《先驱太阳报》等。

来源:https://openai.com/index/news-corp-and-openai-sign-landmark-multi-year-global-partnership/

 

 

 

三、NASA与IBM研究所合作开发了一种新的人工智能模型:Privthi-weather-climate,以支持多种天气和气候应用。

 

该模型使用NASA的数据(如MERRA-2)进行训练,利用AI学习能力从初始数据中提取模式,并应用于广泛的情景中。模型是与IBM研究所、橡树岭国家实验室和NASA的多个团队(包括位于阿拉巴马州亨茨维尔的马歇尔太空飞行中心的IMPACT团队)合作开发的。

应用领域:检测和改进严重天气模式或自然灾害(如飓风)的模型。

创建基于局部观测的目标预测。

提高全球气候模拟的空间分辨率,涵盖到区域水平。

改进天气和气候模型中物理过程的表示。

来源:https://science.nasa.gov/open-science/ai-model-weather-climate/

 

 

 

四、Truecaller 与微软合作 允许用户克隆自己的声音 ,来让 AI 帮你接听电话

 

Truecaller与微软的Azure AI Speech合作,让用户通过录制他们的声音,然后克隆生成一个AI版本的用户语音。

Truecaller助手能够使用你的声音自动接听电话、筛选来电、留言、代用户回复或录音。

官网:https://www.truecaller.com/

 

 

 

五、TRANSAGENTS: 一个专门用于进行文学翻译的多智能体虚拟翻译出版公司

 

腾讯 AI 实验室开发出一种名为“TRANSAGENTS”的新型多智能体框架,用于超长文学内容翻译。

它使用虚拟角色模拟真实的翻译公司,包含多个角色,比如高级编辑、初级编辑、翻译员等。

每个角色负责不同的翻译任务 通过合作完成文学作品的翻译。

每个角色都有详细的个人资料,包括语言技能、教育背景、工作经验等。

这种详细的角色设定增强了模拟的真实性,提供了一个复杂而多样的翻译环境。

使用TRANSAGENTS进行文学翻译比使用专业人类翻译员的成本低80倍。

在实际评估中,人类评估者和高级语言模型(如GPT-4)更喜欢TRANSAGENTS的翻译结果。

特别是当翻译需要领域特定知识(例如历史背景和文化细节)时,TRANSAGENTS的表现优于人类翻译。

论文地址:http://arxiv.org/abs/2405.11804

 

 

 

六、Suno进行了相关更新

 

1、自定义个性化封面

2、支持音乐标题,标签,歌词搜索

3、可以关注你喜欢的创作者

4、简化移动端操作并优化导航

5、增加热门歌单列表

 

 

 

七、Domo AI 上线了唇形同步功能,现在带面部对话特写的视频在转换风格的时候嘴部动画可以同步了

 

要使用它,只需选择一个 3.0 模型并在生成时打开“唇形同步”选项。

以下四种模型目前支持此功能:

1:浮世绘风格  2:日本动漫3.0  3:粘土卡通风格3.0   4:3D卡通风格3.0

感觉效果也好了很多,使用的话需要选一个 3.0 风格并启用“唇形同步”选项。

试用:discord.gg/domoai

 

 

八、微软推出新版 Power Automate

 

通过语音命令和演示 你可以教会 AI 帮你自动化干活 Microsoft推出新版Power Automate,带来了前所未有的AI驱动的自动化体验。

你只需要通过屏幕分享和语音描述操作步骤,AI自动学习并生成工作流程,自动帮你干活。 

自愈功能:当UI元素变化时,AI 会自动提示用户确认并修复工作流。

官网:powerautomate.microsoft.com/en-us/blog/revolutionize-the-way-you-work-with-automation-and-ai/

 

 

 

九、Dolphin Mixtral 1x22b:去除对齐和偏见 

 

没有任何审查和道德限制的模型

该模型基于Dolphin Mixtral-8x22b,数据集经过过滤以去除对齐和偏见。

它会严格按照用户的指令执行,生成文本时没有严格的限制或过滤机制。

能够自由生成各种内容,而不强制进行内容审核或过滤。

项目地址:https://huggingface.co/cognitivecomputations/dolphin-2.9.1-mixtral-1x22b/blob/main/README.md