扫码打开虎嗅APP
No.46
2024-04-27
Elon Musk 的公司 xAI 即将从 Sequoia 等投资者那里筹集到 60 亿美元的资金。
xAI 的产品是一个聊天机器人,名为 Grok,该机器人的功能与 OpenAI 的 ChatGPT 相似。
此轮融资预计在未来两周内完成,将是开发人类语言写作、交流和艺术创作技术的初创公司中最大的一笔单次资金募集。
新闻来源:https://www.theinformation.com/articles/musks-xai-is-close-to-raising-6-billion-from-sequoia-others
由于人工智能(AI)推动了对云计算的需求,Microsoft 和 Alphabet 在最近的财报中显示了收入和利润的增长。
企业对 AI 的需求推动了 Microsoft 的云服务和软件销售,Alphabet 也通过云业务的增长超出了收入预期。
Snap 在第一季度显示出用户数量和收入的显著增长。
ChatGPT 的记忆功能允许AI聊天机器人存储用户在对话中分享的个人细节,并在未来的聊天中参考这些信息。
当记忆功能在付费账户中启用时,用户会收到一个弹出通知解释这个新工具的使用方法。用户可以在设置中选择启用或关闭记忆功能。
用户可以通过简单的聊天将信息添加到 ChatGPT 的记忆中,也可以通过设置界面管理和删除记忆。
新闻来源:https://openai.com/blog/memory-and-new-controls-for-chatgpt
https://www.wired.com/story/how-to-use-chatgpt-memory-feature/
SearchGPT 已经进入评估阶段,新增多项功能:- 图像搜索- 多样小工具(天气、计算器、体育、财经及时间差计算)- 可进行后续提问
此次评估采用了多个模型,包括 GPT-4 Lite(Scallion; POR)、GPT-4 和 GPT3.5(Sahara-V),并结合了多种搜索引擎,如 Bing(POR)、Sydney、Fortis 和内部搜索引擎 Labrador。
这项技术可以将文本转换为生动的视频内容,包括面部表情、语音和肢体语言等元素。
视频中的角色可以根据所表达的内容自动预测并展现出不同的情绪、表情和肢体动作,使视频更具吸引力和表现力。
主要功能:
表现力丰富:这些虚拟数字人形象能根据文本的语义表达出相应的情感和情绪变化。
自然语音:提供非常自然的语音,可与虚拟形象搭配使用或单独使用。
即时虚拟形象预览:只需几秒钟预览AI虚拟形象
多语种支持:支持130多种语言的视频制作。
广泛的虚拟形象选择:平台提供160多种多样化的AI虚拟形象
收费:22美金 120分钟
同时支持文/图生 3D 两种模式,先测试了下图生 3D 的三步走:
1)先根据图片生成一个初步的预览模型
2)选择网格参数并生成精细化 3D 模型
3)生成材质
生成效果非常酷,网格也很均匀,材质与原图匹配度也不错!
看来可以直接生成大量 3D 角色和配景,然后用与创建好玩 3D 场景或用于制作简单的动画视频!
另外,这种便捷 3D 生成对辅助图像一致性也会有帮助,可以省去大量的建模时间!
它可以模仿人类动作迅速做出学习,而且灵活性极强
演示视频为1倍速,和人类的速度几乎同步,甚至有的动作还进行了慢放
能超高速玩叠杯游戏、倒红酒、削黄瓜、操作机器、修理凳子、 自己使用吸尘器等电子产品、写毛笔字等各种人类能进行的复杂任务。
公司官网没有更多信息,只给了一组对比数据,显示全方位超越人类。
它提供了一种非常灵活的方式来创造和修改3D内容。你可以添加、移除组件来对模型进行各种组合,类似乐高搭建,还可进行可变形和刚性拖动等操作。
也可以通过文本控制。
而且用户交互的实时反馈,能够即时看到你的操作如何影响最终的效果。
项目地址:https://interactive-3d.github.io
Transformer模型中,位置编码(Positional Encoding)是一个关键组件,它为模型提供输入序列中各单元的位置信息。 PoSE通过调整这些位置编码的规模来扩展模型处理的序列长度,而不是简单地线性扩展,这有助于模型更有效地利用位置信息,改善长序列的处理能力。
该内容为专享内容
购买AI深度研究员的简报专栏即可查看全部内容