No.43

2024-04-24

AI深度研究员人工智能领域内的最新进展是什么？每日AI精选带给你

AI精选（43）-人工智能领域内的最新进展

主理人：

AI深度研究员

今日精选，深度丰富、精彩纷呈！我们诚邀大家继续关注并订阅我们内容，AI时代不落后，让每一天都充满启发和价值

一、新版Adobe Photoshop发布

Adobe Photoshop 通过集成 Adobe Firefly Image 3 Model 引入多项新的的 AI 功能，大幅提升了图像编辑的深度与灵活性。

这些功能不仅优化了图像生成的过程，还让用户能够以前所未有的控制度和精准度实现其创意构想。

关键新 AI 功能：

1、生成填充（Generative Fill）和生成扩展（Generative Expand）：这些功能允许用户基于文本提示快速生成或扩展图像，使创建或扩展场景变得更加无缝。

2、改进的提示解释：AI 现在能更好地理解和解释用户的文本提示，使生成的图像更准确、更相关。

3、参考图像：用户可以上传样本图像以引导 AI 生成更接近期望结果的内容，增强生成图像的相关性。

4、生成相似：此功能让用户能够创建他们最喜欢的生成图像的变体，提供易于调整风格和内容的选项。

5、增强背景生成：AI 能够通过解释文本提示无缝更改背景，允许用户在不进行手动编辑的情况下将主题转移到不同的设置。

6、增强细节：此功能提高了生成图像的锐度和细节，确保输出与传统摄影标准良好融合。

在这里体验Firefly Image 3：https://firefly.adobe.com/generate/images

二、最新美国人工智能就业大盘点：西雅图、旧金山、圣何塞

最新分析显示，西雅图、旧金山和圣何塞成为美国三大新兴AI就业热点。

西雅图以每10万居民74.4个新AI职位排名第二，仅次于圣何塞的142.4个职位，旧金山以49.3个职位排名第三。

尽管技术、制造和金融行业普遍裁员，西雅图地区仍然位列全国前十大就业市场之一。

调查显示，58%的美国专业人士认为人工智能将正面影响员工效率，46%的人认为它能提升组织竞争力。然而，近半数的人担心如果不能适应和学习人工智能，可能会在职业生涯中被“抛在后面”。

新闻来源：https://www.axios.com/local/seattle/2024/04/22/seattle-new-ai-job-hotspot-mapped

华盛顿邮报与弗吉尼亚理工学院合作开发人工智能阅读工具

华盛顿邮报与弗吉尼亚理工学院的桑加尼人工智能和数据分析中心合作，开发一款新的AI工具，旨在提升读者体验。

该AI工具能够根据用户的问题意图生成答案，而非仅依赖关键词。此外，这个工具还会使用一种名为“检索增强生成”（RAG）的技术，可以访问超出其初始训练数据的新信息。

华盛顿邮报还将使用能够结合文本、音频和视频报道中信息的多模态大型语言模型（LLM）技术。

新闻来源：https://technical.ly/software-development/washington-post-ai-tool-virginia-tech/

三、微软聘请前Meta高管以增强其人工智能超级计算团队

前Meta高管Jason Taylor加入微软，担任公司副首席技术官和企业副总裁，目的是帮助建设下一代系统，推动人工智能的前沿发展。

Taylor在Meta工作了约13年，负责AI、数据和隐私基础设施，以及管理公司的服务器预算。他还曾在2015至2017年间担任开放计算项目基金会（Open Compute Project Foundation）的主席，该基金会推广数据中心的开源设计。

微软还在3月宣布聘请Google DeepMind的联合创始人Mustafa Suleyman作为新的消费者AI部门的CEO，该部门监督Copilot、Bing和Edge等产品。

新闻来源：https://www.businessinsider.com/mark-zuckerberg-did-not-see-the-genai-wave-coming-2024-4

四、据报道苹果已经收购了一家位于法国巴黎的初创企业Datakalab

该企业专门从事人工智能压缩和计算机视觉技术。根据法国商业杂志《Challenges》的报道，此次收购在去年12月完成。

Datakalab 自称是“专注于低功耗、运行效率高和深度学习算法”的专家，这些技术在设备上运行

Datakalab开发的算法专用于分析公共空间中的流量，如人流量等。这些算法将捕获的图像即时转化为匿名的统计数据，用于本地处理，处理时间非常快，仅需100毫秒。

Datakalab 在2020年5月与法国政府合作，将AI工具部署到巴黎的交通系统中，检查人们是否佩戴面罩。该公司过去还与迪士尼和其他合作伙伴合作过。

在其 LinkedIn 页面上，Datakalab强调其“行业领先的压缩技术和适应部署嵌入式计算机视觉，快速、成本效益高、精确”。在被苹果收购之前，Datakalab有10到20名员工。

新闻来源：https://www.fastcompany.com/91110830/apple-datakalab-acquisition

五、软银将投资数百万美元推动人工智能发展，采用英伟达的芯片

软银计划投资9.6亿美元，用于2024年和2025年加强其计算设施，这是迄今为止任何日本公司在这一领域的最大投资。

软银的投资将用于开发一种“世界级”的日语特定生成型人工智能模型。

为了训练大型语言模型（LLM），软银计划从美国芯片巨头Nvidia购买高级图形处理单元。

这一投资将帮助日本在生成型AI领域培育强有力的国内玩家，尤其是在国际竞争者如OpenAI和微软正在进入市场的时候。

新闻来源：https://www.cnbc.com/2024/04/23/softbank-to-invest-millions-in-ai-push-tapping-nvidias-chips-nikkei.html，

六、AI正式迈向手机端：微软的这个 phi-3-mini 模型

phi-3-mini

1）参数：拥有 38 亿参数

2）性能：与Mixtral 8x7B和GPT-3.5等模型同级

3）手机端部署：足够小，且针对手机端进行了优化

4）更多模型：还提供了 70亿和 140亿的 phi-3-small 和 phi-3-medium 模型，性能远超 phi-3-mini

目前只有论文，没有模型。鉴于上次Phi-2是模型泄露后被动开源，Phi-3是否开源还不确定。

论文：https://arxiv.org/pdf/2404.14219.pdf

七、字节 lightning 团队发布了新的图像模型蒸馏算法 Hyper-SD

一个创新的框架Hyper-SD，它巧妙地结合了ODE轨迹的保持与改造的优点，同时在压缩推理步骤时保持了接近完美的性能。

首先，我们推出了分段轨迹一致性蒸馏（Trajectory Segmented Consistency Distillation），通过在预设的时间段内进行蒸馏，从而从高层次上保证了原始ODE轨迹的完整性。

其次，我们引入了人类反馈学习机制，旨在提升模型在较少推理步骤下的表现，并减少蒸馏过程中的性能损失。

最后，我们加入了分数蒸馏技术，进一步增强模型在低步推理下的生成能力，并首次尝试通过统一的LoRA机制来支持全过程的推理。

大量实验和用户研究证明，无论是在1步到8步的推理中，Hyper-SD都能为SDXL和SD1.5模型带来最优的性能表现。例如，只用一步推理，Hyper-SDXL在CLIP得分上就比SDXL-Lightning高出0.68分，在Aes得分上也高出了0.51分。

项目地址：https://hyper-sd.github.io

八、一款人工智能音乐生成工具：AI Jukebox

一个完全本地化的音乐生成工具，打开页面之后会自动加载生成模型，大概 700M，之后可以通过输入提示词选择曲风生成音乐。

试用：https://huggingface.co/spaces/enzostvs/ai-jukebox

九、Midjourney 早上发布了一个新功能，挺好玩的。

可以基于提示词生成完全随机的图像风格。

使用方式：在提示词后添加 --sref random，如果找到了喜欢的风格可以通过 --sref url 将风格迁移到新图片上。

下面是/imagine a field of flowers --sref random运行 64 次的结果。

该内容为专享内容

购买AI深度研究员的简报专栏即可查看全部内容