Midjourney的更新频率是真的快,简直是AI绘画届的“卷王”。
继Zoom Out、Custom Zoom等缩放填充功能之后,就在前天,Midjourney又推出了平移扩展功能Pan。
这些新功能兼具实用性和可操作性,今天我们经过一番实测,给玩家们献上这份最全测评,希望有用。
新功能:Outpainting(扩展绘图)
此前,PS的Generative Fill(生成填充)功能一开放内测,就被网友们玩疯了。
网络上流传的一些经典梗图被扩展后,毫无违和感,堪比原图:
也有一些图被扩展后,离谱中又夹杂着合理。
Stability AI旗下的图像编辑网站Clipdrop也上线了图像外延绘制功能Uncrop,直接对标Generative Fill,被称为PS AI的免费平替。
Midjourney V5.2版本推出的Zoom Out、Custom Zoom、Pan等功能,更是不遑多让。
下面是Midjourney各个扩图功能的具体实测:
1. Zoom Out
首先在“/seetings”中将Midjourney切换为V5.2版本:
常规输入关键词生成图片,然后选择其中一张放大。
放大后的图片下方会出现Zoom Out2x和Zoom Out1.5x选项,即缩放2倍和1.5倍,这里我选择的是Zoom Out2x,来看看效果:
扩展后的图像风格、细节与原图非常统一,毫无违和感。理论上,重复以上操作,就可以无限扩展下去。
还有人将生成的扩展照片按缩放倍数排序,作为视频的关键帧图像,做出惊艳的无限宇宙效果。
不过,对于画面元素较为复杂,或主体不够突出、不易识别的图像,利用Zoom Out一键扩展可能会出现画面重复、混乱的情况。
比如下方这张扩展后的“阿尼亚工作照”,画面中出现了一群阿尼亚,就像阿尼亚来到了一家遍布“人工智能阿尼亚”的公司上班,画风透露着一丝怪异。
图源:小红书“头号AI玩家”
2. Custom Zoom
这个功能相当于Zoom Out的高级设置,允许自定义缩放倍数,并且支持在缩放图像的同时修改提示词和图片尺寸,来控制延伸场景的画面内容。
比如我生成了一张女孩的面部特写,想把它扩展为更完整的人像,就可以通过组合调整关键词、图片尺寸、缩放倍数来实现。
原图片尺寸为3:4,原关键词为:一个可爱的女孩、高清的面部特征、紧张的表情、极近特写、柔和的光线、8K画质(A cute girl, clear facial features, nervous expressions, hyper-realistic, ultra-detailed, extreme close-up, soft light,8K)。
我调整为“穿着白色蕾丝裙的可爱女孩”,并删去了高清面部特征、特写等关键词,修改图片尺寸为16:9(--ar16:9),设置缩放倍数为2倍(--zoom2)。
然后就得到了下面这两张图片:
当然,你也可以持续套娃,继续缩放,并通过修改Prompt和图片尺寸来调整画面元素,这样一张局部特写轻轻松松就能变成一副丰富完整的画面。
3. Pan
Pan算是对Zoom Out和Custom Zoom功能的补充。它可以定向扩展图片,如水平扩展或垂直扩展,而不是像Zoom Out一样按特定比例对全图进行缩放填充。
以这张猫咪拟人图为例,图片下方有⬅️➡️⬆️⬇️四个箭头,即向左、右、上、下平移扩展。
我选择了向右平移,并修改图片尺寸为16:9,于是得到了下面这张图片:
这个效果着实让人有些惊喜,Midjourney版清明上河图恐怕指日可待了。
不过该功能目前还存在一些限制:
1. 用户只能水平或垂直平移扩展图像,一旦你选择水平扩展,后续生成的图片就不再支持垂直扩展;
2. 无法控制平移程度;
3. 平移扩展后的图像不再支持Make Variations;
4. 平移过程中依然可能会出现画面重复和简单的复制拼接,为避免这种情况,最好在平移时修改Prompt,描述平移后新增的画面内容。
4. Make Square
点击生成图片下方的“Make Square”选项,可以将非正方形图像变成正方形。如果想做头像,用这个功能就很方便。
新指令:Weird
这个指令可以让生成的图片更加前卫和怪异,取值范围支持0-3000,数值越大越离谱。
下面我们以关键词“DC joker”进行测试,小丑的形象本身就已经够怪异了,我倒要看看这个Weird指令还能怪出什么新高度。
先是--weird0:
然后是--weird100:
血液、残肢、邪恶的笑容……weird数值才100,画面就已经相当阴森诡异了,很难想象weird值达到3000,生成的会是什么怪力乱神……
几个小结论:
1. weird数值建议控制在1000以内,超过1000就不太可控了。
2. 添加weird指令后绘出的图多偏卡通,有点老旧的贴图风并且缺乏细节。
3. 可以尝试和--stylize(风格化)命令一起使用,你很有可能得到一张“怪好看”的图,两者的数值一般建议相同。
新的出图模式:Turbo
这个模式的图片生成速度比Fast模式快4倍,但是会消耗2倍的Fast模式生成时间。
也就是说,在Fast模式下生成图片需要10秒,Turbo模式只需要2秒左右,但会消耗20秒的生成时长。
新的付费等级:Mega
这是Midjourney新推出的付费等级,一个月120美元,区别就是Fast模式生成时间增加至60小时,不过Turbo模式消耗的Fast时间不变,依然是2倍。
如果不具有多人、同时、大量出图的需求,60美元每月的套餐基本就够用了。
从扩展绘制图像的质量来看,Midjourney和PS的Generative Fill不相上下,无论是构图还是美学、风格,跟原图的适配程度都很高。至于哪个生成效果更强,很难一概而论。
不过Midjourney有一个明显的局限性在于,目前仅支持对MJ生成的图片进行扩展,不支持上传第三方图片,但是PS和SD都支持。
单纯从随便上传一张图就能很好地模拟风格并完成扩展这点,PS肯定是要更强大一些的,而且还有充分的自定义和修改功能。
SD的优势则在于免费和开源,而且还在迭代,但目前的生成效果次于MJ和PS,操作难度也较高。
(举报)