Home » 人工智能艺术对决: 顶级工具 MidJourney、Stable Diffusion v1.5 和 SDXL 如何傲视群雄

人工智能艺术对决: 顶级工具 MidJourney、Stable Diffusion v1.5 和 SDXL 如何傲视群雄

by Tim

人工智能生成艺术的时代已经来临,三位巨头已经成为数字创作者最喜爱的工具: Stability AI 的新工具 SDXL、老牌工具 Stable Diffusion v1.5 以及它们的主要竞争对手: MidJourney。

OpenAI 的 Dall-E 开启了这场革命,但由于其开发不足和闭源的事实,Dall-E 2 在与竞争对手的竞争中并不突出。不过,正如 TCN 几天前报道的那样,未来这种情况可能会改变,因为 openAI 正在测试新版 Dall-E,据说新版 Dall-E 可以胜任并制作出出色的作品。

在众多领先平台中,选择一款合适的工具是关键所在。让我们深入了解这些生成艺术技术在功能、要求、风格和美感方面的优势。

MidJourney:人工智能艺术的入门药物

Théâtre d'Opéra Spatial, a Midjourney image that won first prize in a digital art competition

Théâtre d’Opéra Spatial, a Midjourney image that won first prize in a digital art competition


作为三巨头中用户界面最友好的一个,MidJourney 让非技术用户也能使用人工智能艺术–只要他们会使用 Discord。该平台在 MidJourney 的服务器上私密运行,用户通过 Discord 聊天进行互动。这种封闭的方式有利有弊。好处是不需要任何专业硬件或人工智能技能。但是,由于 MidJourney 的模型和训练数据缺乏开源透明度,因此它的功能非常有限,爱好者也无法对其进行改进。

MidJourney 是这些机器人中的佼佼者,因其用户友好的 Discord 界面而深受初学者的喜爱。只需向机器人发送一个文本提示,几分钟内就能完成一个美观的杰作。缺点是什么?每年 96 美元,对于一个无法自定义或本地运行的人工智能来说,价格不菲。不过,至少在派对上你会显得很文艺(和书呆子气)!

在功能上,MidJourney 能根据文字提示快速生成图片,其美学凝聚力令人印象深刻。但如果深入研究特定主题,输出的效果就会变得更加怪异。MidJourney 喜欢在每一个创作中加入自己的元素,即使这与提示者的想象不同。因此,大多数图片的对比度可能会达到饱和状态,而且更趋向于逼真而非写实,以至于一段时间后,人们会根据其美学特征来识别用 MidJourney 创建的图片。

使用 MidJourney,你的创作自由也受到平台严格内容规则的限制。无论是在社会方面(描述裸体或暴力)还是在政治上(有争议的话题和特定领导人),它都受到严格审查。总的来说,《MidJourney》为人工智能艺术提供了一个诱人的入口,但高级用户会渴望更多的控制和自定义功能。这就是稳定扩散发挥作用的时候。

Stable Diffusion v1.5:人工智能艺术的 “老 “可靠


Untitled image created by user ThaiTvNews using a custom SD v.15 model.

Untitled image created by user ThaiTvNews using a custom SD v.15 model.


如果说 MidJourney 是一匹小马,那么 Stable Diffusion v1.5 就是可靠的主力军。作为一个已经积极开发了一年多的开源模型,Stable Diffusion v1.5 为当今许多最流行的 AI 艺术工具提供了动力,如 Leonardo AI、Lexica、Mage Space,以及现在 Google Play 商店中的所有 AI waifu 生成器。

活跃的 MidJourney 社区对基础模型进行了迭代,以创建专门的检查点、嵌入和 LoRA,重点关注从动漫风格化到复杂景观、超逼真照片等各个方面。缺点是什么?与更年轻的人工智能新手相比,它已经开始显出老态。

通过在引擎盖下进行一些调整,Stable Diffusion v1.5 可以根据你的创意视角生成清晰、细腻的图像。目前,输出分辨率的上限为 512×512,有时在质量下降前为 768×768,但快速缩放技术会有所帮助。平铺升级技术的流行也促进了该机型的普及,使其能够生成超高分辨率的图像,远远超出了 MidJourney 所能做到的。

目前,它是唯一支持内绘(改变图像内部事物)的技术。此外,它还支持外绘(让模型将图像扩展到框架之外)。它具有多向性,这意味着用户可以在纵轴和横轴上扩展图像。它还支持第三方插件,如 roop(用于创建深度伪造)、After Detailer(用于改进面部和手部)、Open Pose(用于模仿特定姿势)和区域提示。

要运行它,创作者建议你需要 Nvidia RTX 2000 系列或更高的 GPU 才能获得不错的性能,但《Stable Diffusion》v1.5 的轻量级占用空间即使在 4GB VRAM 显卡上也能流畅运行。尽管已经过时,但强大的社区支持让这款人工智能艺术 OG 始终保持着游戏的顶尖水平。

SDXL: 人工智能艺术的下一个前沿

Untitled Image created by user Buzimage using a customized SDXL model

Untitled Image created by user Buzimage using a customized SDXL model


如果说 Stable Diffusion v1.5 是可靠的工作母马,那么 SDXL 就是在赛道上飞驰的年轻纯血马。同样来自 Stability AI 的这款功能强大的机型利用双文本编码器更好地解释提示,其两阶段生成过程可在高分辨率下实现出色的图像连贯性。

这些功能听起来令人兴奋,但也让 SDXL 更难掌握。一个文本编码器喜欢简短的自然语言,而另一个则使用 SD v1.5 的风格,即用切碎的特定关键词来描述构图。

两阶段生成意味着它需要一个细化模型来将细节放到主图像中。这需要时间、内存和计算能力,但结果却非常华丽。

SDXL 已经准备好让人眼前一亮。SDXL 支持的参数几乎是稳定扩散 v1.5 版的 3 倍,因此它的性能非常强大,生成的图像分辨率比前代产品高出近 50%,而且不费吹灰之力。但是,这种出类拔萃的性能是有代价的: SDXL 需要至少 6GB VRAM 的 GPU,需要更大的模型文件,而且缺乏预训练的专业化功能。

开箱即用的输出还无法与经过精细调整的稳定扩散模型相提并论。不过,随着社区优化工作的开展,SDXL 的潜力将使当今的模型望尘莫及。

输出比较

一张图片胜过千言万语,因此我们总结了几千句话,试图用类似的提示来比较不同的输出,以便您选择最喜欢的一款。请注意,每种模式都需要不同的提示技巧,因此,即使这不是苹果与苹果之间的比较,也是一个很好的起点。

更具体地说,我们对 “稳定扩散 “使用了相当笼统的负面提示,而 “中途岛 “其实并不需要。除此之外,这些提示都是一样的,结果也不是人工挑选的。

  • 提示: 柯基犬骑车过海的肖像


评论: 这只是 SDXL 和 MidJourney 之间的风格问题。两者都击败了 Stable Diffusion v1.5,尽管它似乎是唯一一个能够创造出正确 “骑 “自行车的狗,或者至少是正确使用自行车的狗的软件。

  • 提示: 夜晚的红场


评论: MidJourney 尝试在 “红色广场 “中创建一个红色方块。SDXL v1.0 版更清晰,但 SD v.15 版(型号:Juggernaut v5)的色彩对比度更好。

  • 提示: 未来教室里的性感女教师


评论: MidJourney 因其审查规则而拒绝生成图片。SDXL 在细节处理上更加丰富,既能制作出胸部丰满的教师,也能制作出未来感十足的教室。SD v1.5 更多地关注半裸的教师(主题。 模型:Photon v1),而较少关注环境细节。

  • Prompt: a brain powering a machine, jeffrey smith and h.r. giger, highly detailed in 4k, by Nishida Shun’ei, poster, tool, highly detailed epic, epic cyberpunk, studio muti, bitmap, by Sugimura Jihei


评论: MidJourney和SDXL的结果都符合提示。SDXL 更好地再现了艺术风格,而 MidJourney 则更注重制作美观的图像,而不是再现艺术风格,它还丢失了提示中的许多细节(例如:图像中显示的不是大脑为机器提供动力,而是头骨为机器提供动力)。

生成艺术的未来


那么,你应该使用哪幅莫奈训练作品呢?坦率地说,这些选择都不会有错。MidJourney 在可用性和美观一致性方面都很出色。Stable Diffusion v1.5 提供了可定制性和社区支持。而 SDXL 则推动了逼真图像生成技术的发展。同时,请继续关注 Dall-E 的最新动态。

不要只听我们的一面之词。画笔就在你的手中,空白的画布正在等待着你。拿起你的创作工具,开始创作吧!请尽量减少对人类生存的威胁。

Related Posts

Leave a Comment