正确的提示信息

扫码打开虎嗅APP

从思考到创造

资讯

搜索历史

删除

完成

全部删除

数码
互联网
数码
互联网

热搜词

芯片
英伟达
经济增长
经济周期
柔宇科技
经济
网红
货币
本地生活

2023-06-25 15:48

Midjourney 5.2震撼发布，有哪些新功能？

本文来自微信公众号：新智元（ID：AI_era），作者：新智元，原文标题：《Midjourney 5.2震撼发布！原画生成3D场景，无限缩放无垠宇宙》，题图来自：Midjourney

Midjourney和Stable Diffusion，已经卷到没边了！

几乎在Stable Diffusion XL 0.9发布的同一时间，Midjourney宣布推出了5.2版本。

此次5.2版本最亮眼的更新在于zoom out功能，它可以无限扩展原始图像，同时保持跟原始图像的细节相同。

用zoom out做出的无垠宇宙动画，直接让人震惊到失语。

这个极其强大的功能，可以创造出非常神奇的图片，甚至还能被用来拍摄毫无破绽的高清变焦视频！

这个“核弹级”更新，让网友直呼：你们这个功能也太强大了，直接把我的睡眠毁了！

玩了一个小时之后，这名网友再次表示：太强大了，我要哭了……

无限缩放，像宇宙一样没有尽头：

老奶奶宇宙中有多少个老奶奶？答案是无穷个：

爱丽丝追逐着小兔子不小心掉下了“兔子洞”，便进入了仙境。

而网友用zoom out自制的这个“兔子洞”，简直如梦如幻。

还有一个AI图像设计团队——ilumine AI只用一张很小的原画，就通过Zoom Out生成了下面这个宏大的场景图片。

然后再配合自家正在开发的技术2D转3D的技术，直接做了一个3D的游戏场景。

相信等到他们的产品正式推出之后，配合Midjourney Zoom Out这种凭空扩图的功能，用一张原画直接做出3D场景。

这简直是要革了游戏行业的命了，很多游戏制作从业者应该要哭出声吧。

‍‍

一、Zoom Out誓要碾压Adobe AI和Uncrop？

此前，Adobe’s Generative Fill的填充功能，就被网友们玩疯了，它填充的周星驰电影剧照，可谓“毫无破绽”。

而Stability AI也紧接着放出大招。它联合Clipdrop推出了Uncrop Clipdrop——一个终极图像比例编辑器。

而Midjourney的V5.2的zoom out功能，也是不遑多让，甚至更加强大。

只要通过“/image”命令输入提示，Midjourney就会根据你的prompt生成四个视觉迭代图，你可以选择自己最喜欢的一个来放大，这个过程中，整个图像都会以更高的细节被渲染。

现在，所有Upscale的图像下方都有“Zoom Out”按钮，可以使用它们来重新生成图像。

先给定一张需要缩放的原图，点击下面的“缩放两倍”的按钮。

和之前我们介绍过的Uncrop一样，Midjourney会生成4张备选的图案。

缩放之后4张备选图案的风格都非常一致，只是在背景的细节上有些差别。

在选择了4个Upscale的图案中的一个之后，还可以接着选择放大两倍对照片进行持续缩放。

可以看得出进一步缩放之后的图案风格和细节依然非常一致，如果你想持续缩放下去，就可以做出本文开头效果。

你只要不停地重复这个过程，就能生成一张巨大无比的拥有无限多细节的“巨图”。

再配上热心网友的指导，就能生成文章一开头的“无限宇宙缩放动画”：

左图如梦似幻的仙境，还可以继续扩大，让艺术和梦幻的世界无限扩张……

网友们激动得觉也不睡了，直接玩疯了。

马斯克的霹雳宇宙是这样的。

这已经是大师级的艺术作品了。

墨菲斯变成绝地武士，场景扩大后，显得更厉害了。

有网友感慨道：Midjourney v5.2模拟从极近镜头到全开镜头的摄像机运动时，简直太赞了。

下一步是不是就是把速率变成每秒24-60帧，角色变成可移动的？12个月内是不是Midjourney就会有文字转视频服务了？

当然，还有紧跟时事的网友，为马老板做了八角笼对战图。

三大软件的无限缩放功能对比：

Uncrop因为是免费软件，不知道是由于官方出于节省资源的考虑还是技术上的问题，他们是不支持无限套娃缩放的。

原图：

缩放一次之后：

第二次缩放之后就会产生黑边，拒绝套娃。

而Midjourney的套娃宇宙我们在上边已经见识过它的效果了。

PS的GF，理论上只要画布能无限扩大，也可以把一张图片在空白处无限补全，达成无限缩放的效果。

只是实现起来要比Midjourney麻烦一些。

二、硬核网友手把手教你怎么做猫头鹰视频

问题来了，文章开头那段震撼的猫头鹰飞行变焦视频，是怎么做出来的？

大师级网友“歸藏”给出了手把手教我们的详细教程。

首先，生成一张猫头鹰图，然后用下面的1.5倍Zoom Out按钮。

在连续重复这个过程7次之后，得到了7张视频的关键帧图像。

把他们排序之后，登陆app.cunwayml.com，在左边导航找到创建视频这个Tab，然后找到Frame Interpolation这个功能。

然后用我们做好的这7张图，拖进左边的位置上传，检查顺序无误后就可以点击Generate生成视频了。

一段时间之后就可以看到这段视频的预览效果，不过，普通用户只能导出720P。

三、太长不看版：V5.2更新的8大功能

简而言之，这次V5.2更新，可以概括为如下8大功能。

1. 方形重构（Square Reframe）

扩大图片大小
选择制作方形

这次该更新附带的一个“制作正方形”工具，可以改变以正方形以外的纵横比制作图像的形状。

宽高比为16：9的原始图像

方形图像

使用这个工具，就可以调整任何照片的大小，重构图片，社交媒体上怎么方便展示，就怎么调整。

2. 标准变焦（Standard Zoom 1.5 - 2x）

选择缩放1.5倍或2倍。

这个功能适合短距离变焦，可以为照片添加更多细节。

3. 无限缩放“Endless Zoom (Re-Zoom a Pic) ”

这个功能可以围绕特定角色，为图片制作全新的大背景。

4. 自定义缩放重构（Custom Zoom Reframing）

无论是艺术家、设计师还是品牌，都可以自定义图像大小，让图片适应任何在线平台。

5. 风格化（Stylize）

Midjourney经过训练，可以创建具有艺术闪光和丰富视觉美感的图像，这是它与Stable Diffusion的最大区别。

以前，用户可以在提示的末尾添加“–styleize X”（图 X 的范围从 0-1000），但 V5.2采用了该模型现有的风格化功能，并在真实感和天赋方面将它们增加到11。

6. 变化模式（Variation Mode）

Midjourney V5.2还附带了一个名为“变化模式”的新功能，可以让用户反复打磨想要应用于输出的视觉细微差别。

在prompt中使用“低变化”模式，就能生成一致的角色形象，而如果选择“高变化”，就会导致与原始输出的较大的视觉差别，四张图片就会更加具有创意和艺术表现力。

7. 不同的个人照片（Vary Individual Pics）

给它一张你的原始图片，你可以选择生成好四个类似的你，或者风格变化非常大的你。

8. 更短提示（Shorten Prompts）

关于Midjourney，人们往往有一个误解：如果在prompt中使用更多单词，就会看到更好或更详细的结果。

但其实，过于冗长的提示往往会抵消每个单词的影响，从而导致输出的图片并不一定符合用户的想法。

而这次Midjourney更新的“缩短”命令功能，就可以分析prompt的成分，为我们提供了一些替代方案的建议。

通过全新的prompts，往往能让原始图片生成更惊艳的结果。

参考资料：

https://arstechnica.com/information-technology/2023/06/stunning-midjourney-update-wows-ai-artists-with-camera-like-feature/

https://the-decoder.com/midjourney-5-2-brings-zoom-out-and-integrated-prompt-analysis/

https://twitter.com/op7418/status/1672457908939014145

本文来自微信公众号：新智元（ID：AI_era），作者：新智元

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉，请联系tougao@huxiu.com

文集：

拥抱“AI”

频道：

前沿科技

支持一下

赞赏

芯片英伟达经济增长经济周期柔宇科技经济网红货币本地生活