Home » 酋长队考虑向英格兰教练发出潜在邀请

酋长队考虑向英格兰教练发出潜在邀请

by v

人工智能(AI)图像生成技术正在飞速发展–不只是一方面。最近的进步使该行业从稳步发展到不断突破,现在有望实现实时、高保真图像创建。

这并不是说这些工具发展缓慢,一分钟就能 “做得更多”。但用户仍然需要更多的东西:更逼真、更多功能、更多样、更快速。而在后一点上,研究人员正在欣然满足。

SDXL踩下油门

稳定人工智能公司(Stability AI)发布了 SDXL Turbo,这可能是人工智能图像生成领域的一次巨大飞跃。我们可不是随便说说的:最近发布的这个型号可以在一秒钟内生成图像,而不是像通常的生成器那样需要 30 到 60 多秒。这几乎可以说是实时的人工智能图像生成。

SDXL Turbo 与之前所有的稳定扩散模型都不同。Adversarial Diffusion Distillation (ADD) 技术使生成高质量图像所需的步骤数量大幅减少–普通图像可能需要 30 步到 100 步,而 SDXL Turbo 只需一步。稳定人工智能公司在一份研究论文中称:”ADD 是第一种利用基础模型实现单步实时图像合成的方法,”

SDXL Turbo 采用了对抗训练和分数提炼的混合方法,优化了生成过程,确保在保持高保真的同时快速生成图像。

因此,引入 SDXL Turbo 后,几乎可以立即生成复杂的高分辨率图像。这种新方法也让人们开始关注 GAN,因为在扩散技术开始占据主导地位后,GAN 在很大程度上被人们遗忘了。

潜在一致性模型意味着效率

如果您不想告别 “传统 “的稳定扩散模型,研究人员会为您提供解决方案。

与 SDXL Turbo 的进步相辅相成的是 Latent Consistency Models (LCMs) 和 LCM-LoRA,它们都对该领域做出了独特的贡献。

LCMs 在其专门的研究论文中进行了介绍,其突出特点是能够通过在预先训练的自动编码器(如稳定扩散)的潜空间内高效运行来生成高分辨率图像。LCM 的目标是在不明显降低质量的情况下提高图像生成速度,重点是高分辨率输出。利用单级引导蒸馏法,LCM 将预训练的扩散模型转化为快速图像生成器,跳过了不必要的步骤。

在实际应用中,用户不需要改变任何其他东西。只需下载模型,并将其用作普通的 SDXL 检查点。不过,他们可以将测量仪调到最小,而不是运行大量的步骤。该模型将在几秒钟内生成具有四个步骤的良好图像,而不是计算生成每个图像的 25、50 或 75 个步骤。

现在已经有很多优秀的模型都有自己的 LCM 版本供您尝试。我们推荐 Hephaistos_NextGENXL,因为它用途广泛,但也有许多优秀的模型可供测试。

LCM-LoRAS:为任何型号提供涡轮增压


与 LCM 同步发布的 LCM-LoRA 提供了一个通用加速模块,可集成到各种稳定扩散模型中。”研究论文写道:”LCM-LoRA 可被视为具有强大通用能力的插件式神经 PF-ODE 求解器。

LCM-LoRA 旨在提高现有稳定扩散模型的效率,使其更快、更通用。它采用 LoRA(Low-Rank Adaptation)更新预训练的权重矩阵,减少了计算负荷和内存需求。

有了 LCM-LoRA,普通稳定扩散模型的图像生成速度大幅提高,使其在各种任务中都能发挥巨大作用。用户甚至不需要下载新的模型,只需激活 LCM LoRA,生成图像的速度就会和 LCM 模式一样快。

质量与速度

尽管有了这些技术飞跃,但仍然需要在速度和图像质量之间取得平衡。虽然 SDXL Turbo 和 LCM-LoRA 等快速生成工具加快了创作过程,但它们也牺牲了一些图像保真度。换句话说,用 50 步和一个好的模型生成的图像,其分辨率或图像保真度总是高于用 5 步和一个好的 LCM 模型生成的图像。

然而,在典型的工作流程中,为了找到完美的图像,需要生成大量的图像,这就减轻了这种权衡。使用图像到图像或内画等工具进行后续迭代,可以增强这些初切图像的细节,弥补最初质量上的损失。使用这些快速技术之一生成的经过适当编辑的图像,其质量不亚于使用普通稳定扩散模型生成的图像。

系好安全带,因为人工智能图像生成领域正在进入超速发展阶段–很少有人比人工智能狂热爱好者更渴望速度。

Related Posts

Leave a Comment