扫码打开虎嗅APP

No.29

2024-04-03

虎视 AI AI 早报

阿里巴巴推出AI程序员“通义灵码”;微软Azure AI语音服务升级;Gemini API5月2日起开始收费

主理人:
虎嗅出品,每日推送AI领域资讯新闻,追踪AI的每一步进展。

巨头动态

1.【阿里巴巴推出AI程序员“通义灵码”】

阿里巴巴启用工号AI001的通义灵码作为AI程序员。这位7X24小时在线的AI智能编程助手能够熟练运用200种编程语言,其中更是精通16种Java、Python、Go等主流语言。其技能范畴包括实时代码续写与优化、自然语言生成代码、单元测试生成等,可做到全程数据加密、代码不落盘,确保信息安全。同时,通义灵码能为开发者提供最佳的情绪价值,还即将掌握RAG技术。据阿里发布通义灵码的简历显示,自通义灵码上线以来,其受欢迎程度持续攀升。截至四月,下载量已超过200万,每天数百万行代码被程序员采纳,每日推理次数超过2000万,成为了国内最受欢迎的AI编程工具。

 

2.【微软Azure AI语音服务升级:引入零样本学习TTS模型,推出9种全新AI语音】

微软近期对其Azure AI语音服务进行了重大升级,推出了9种新的更真实的AI语音,旨在为用户带来更加自然和沉浸式的对话体验。这次升级的核心是引入了零样本学习(Zero-shot)的文本到语音(TTS)模型,这些模型在提高合成语音自然度的同时,更好地模仿了提示语音中的特征。Azure AI语音服务的Personal Voice功能通过这些新模型,使得个性化语音的创建变得快速而简单。用户只需提供一小段语音样本,即可在几秒钟内生成能模仿其独特语音特征的AI语音。这种高度自然的语音输出,不仅流畅自然,还能精准捕捉到人类语音的细微差别,如语调、节奏和情感表达,极大地提升了合成语音的生动性和真实感。微软的这项服务支持超过400种神经语音,覆盖了140多种语言和地区。微软还特别强调了负责任的AI使用,对于Zero-shot TTS模型的使用实施了严格的指导原则和访问控制。

 

3.【Gemini API5月2日起开始收费】

Gemini API 团队陆续向开发者发送API接口即将付费的邮件。邮件通知称,Google将于2024年5月2日起更新Gemini API的附加服务条款,并开始对通过云计费账户进行的API请求收费。这项变更主要影响使用Google AI for Developers提供的Gemini API(在云控制台中称为“生成式语言API”)的用户,而不影响Vertex AI Gemini API的用户。2024年5月2日起,Gemini API和Google AI Studio使用条款将被更新。Gemini API将引入按量付费定价。如果用户使用的是已禁用计费的项目中的Gemini API,则仍然可以免费使用Gemini API,但无法享受付费计划的相关优惠;如果用户使用的是已启用计费的项目中的Gemini API,则使用将受限于按量付费定价等级,并可享受付费计划的相关优惠。

 

4.【OpenAI推出DALL·E编辑器新功能:聊天式图像编辑】

OpenAI在一篇更新文章中介绍了DALL·E编辑器界面的功能。使用这一界面,用户可以选择想要编辑的图像区域,并通过聊天来描述如何更改编辑图像,还可以在对话面板中看到所需编辑的提示,而无需使用选择工具。新功能支持在手机上使用,选择DALL·E生成的图片,在ChatGPT手机App上进入DALL·E编辑器界面。用户还可以在对话面板中提供一个提示,描述创意想法,而无需使用选择工具。要访问 DALL・E 编辑器界面,只需点击 DALL・E 生成的图像即可。

 

技术突破

1.【APUS联合新旦智能开源国内首个千亿级MoE架构大模型】

APUS与新旦智能联合训练、研发的千亿MoE(Mixture of Experts)架构大模型APUS-xDAN 大模型4.0在GitHub上正式开源。经实际测试显示,APUS-xDAN 大模型4.0数学能力的GSM8K达到79分,理解能力的MMLU达到73分,推理能力的BBH达到了66分,综合性能超过GPT3.5,逼近GPT4,在4090之类的低端算力芯片上,综合性能达到了GPT-4 的90%。

 

2.【Domo AI上新视频色度抠图功能】

Domo AI推出新功能,用户可以通过“--key”命令扣出主体人物后更换对应颜色的背景。在之前的更新中,Domo AI已经实现了图转视频的功能,而这次的新功能则进一步扩展了其应用范围,用户可以使用“--key”命令来轻松自定义后台,通过“--key [color]”来选择自己喜欢的背景颜色。此外,Domo AI还支持在用户最喜爱的视频编辑器工具中使用色度键和合成,这意味着用户可以在编辑过程中获得更多的创意可能。

 

投融资信息

1.【Clario 宣布收购人工智能软件公司 ArtiQ】

医疗保健研究和技术公司Clario宣布收购技术公司 ArtiQ。此次收购扩大了 Clario 呼吸解决方案产品组合中AI的力量,。除了收购 ArtiQ 之外,Clario 还于2023 年 11 月收购了易于使用的超声波传感器肺活量计设备制造商 Inofab Health 。Clario 首席执行官Chris Fikry表示: “自 2018 年以来,Clario 一直是应用人工智能来提高临床试验执行质量和效率的先驱。这一举措极大地推进了我们呼吸产品组合中的人工智能。借助 ArtiQ 的技术,我们正在扩大快速扩展人工智能以进行超读的能力,同时确保数据质量并简化全球患者的临床试验流程”。

 

AI安全与伦理

1.【Stability AI员工入侵Midjourney数据库并窃取图像】

据AI 爱好者 Nick St. Pierre 最近在X上 的消息,Stability AI 的员工入侵了 Midjourney 的数据库,窃取了所有的提示和图像对,这一行为还导致了长达24小时的服务中断。作为回应,据称 MJ 已经禁止了所有 Stable Diffusion 的开发人员访问其服务,这一举动在周三内部向公司披露。在 Nick 的推文评论中,Midjourney 的CEO David Holz证实了盗窃事件,并提到团队已经获得了一些信息,而Stability AI 的CEO Emad Mostaque否认指示员工从Midjourney 窃取,并承诺协助调查。