酋长队考虑向英格兰教练发出潜在邀请

人工智能（AI）图像生成技术正在飞速发展–不只是一方面。最近的进步使该行业从稳步发展到不断突破，现在有望实现实时、高保真图像创建。

这并不是说这些工具发展缓慢，一分钟就能 “做得更多”。但用户仍然需要更多的东西：更逼真、更多功能、更多样、更快速。而在后一点上，研究人员正在欣然满足。

SDXL踩下油门

稳定人工智能公司（Stability AI）发布了 SDXL Turbo，这可能是人工智能图像生成领域的一次巨大飞跃。我们可不是随便说说的：最近发布的这个型号可以在一秒钟内生成图像，而不是像通常的生成器那样需要 30 到 60 多秒。这几乎可以说是实时的人工智能图像生成。

SDXL Turbo 与之前所有的稳定扩散模型都不同。Adversarial Diffusion Distillation (ADD) 技术使生成高质量图像所需的步骤数量大幅减少–普通图像可能需要 30 步到 100 步，而 SDXL Turbo 只需一步。稳定人工智能公司在一份研究论文中称：”ADD 是第一种利用基础模型实现单步实时图像合成的方法，”

。

介绍 SDXL Turbo：实时文本到图像生成模型。

SDXL Turbo 采用全新的蒸馏技术，实现了最先进的性能，使单步图像生成具有前所未有的质量，将所需的步骤数从 50 步减少到仅一步。

…pic.twitter.com/0NA4aUqKkD

– Stability AI (@StabilityAI) 2023年11月28日

SDXL Turbo 采用了对抗训练和分数提炼的混合方法，优化了生成过程，确保在保持高保真的同时快速生成图像。

因此，引入 SDXL Turbo 后，几乎可以立即生成复杂的高分辨率图像。这种新方法也让人们开始关注 GAN，因为在扩散技术开始占据主导地位后，GAN 在很大程度上被人们遗忘了。

潜在一致性模型意味着效率

如果您不想告别 “传统 “的稳定扩散模型，研究人员会为您提供解决方案。

与 SDXL Turbo 的进步相辅相成的是 Latent Consistency Models (LCMs) 和 LCM-LoRA，它们都对该领域做出了独特的贡献。

LCMs 在其专门的研究论文中进行了介绍，其突出特点是能够通过在预先训练的自动编码器（如稳定扩散）的潜空间内高效运行来生成高分辨率图像。LCM 的目标是在不明显降低质量的情况下提高图像生成速度，重点是高分辨率输出。利用单级引导蒸馏法，LCM 将预训练的扩散模型转化为快速图像生成器，跳过了不必要的步骤。

在实际应用中，用户不需要改变任何其他东西。只需下载模型，并将其用作普通的 SDXL 检查点。不过，他们可以将测量仪调到最小，而不是运行大量的步骤。该模型将在几秒钟内生成具有四个步骤的良好图像，而不是计算生成每个图像的 25、50 或 75 个步骤。

现在已经有很多优秀的模型都有自己的 LCM 版本供您尝试。我们推荐 Hephaistos_NextGENXL，因为它用途广泛，但也有许多优秀的模型可供测试。

我们发布了 Pixart-alpha x LCM ！⚡️。

很高兴再次发布与皮克斯阿尔法团队的合作作品！@lawrence_cjs。

查看链接：https://t.co/9qTYKyiaQk pic.twitter.com/HPUmXYERrk

– Allen (Simian) Luo (@SimianLuo) November 30, 2023

LCM-LoRAS：为任何型号提供涡轮增压

。

与 LCM 同步发布的 LCM-LoRA 提供了一个通用加速模块，可集成到各种稳定扩散模型中。”研究论文写道：”LCM-LoRA 可被视为具有强大通用能力的插件式神经 PF-ODE 求解器。

LCM-LoRA 旨在提高现有稳定扩散模型的效率，使其更快、更通用。它采用 LoRA（Low-Rank Adaptation）更新预训练的权重矩阵，减少了计算负荷和内存需求。

有了 LCM-LoRA，普通稳定扩散模型的图像生成速度大幅提高，使其在各种任务中都能发挥巨大作用。用户甚至不需要下载新的模型，只需激活 LCM LoRA，生成图像的速度就会和 LCM 模式一样快。

质量与速度

尽管有了这些技术飞跃，但仍然需要在速度和图像质量之间取得平衡。虽然 SDXL Turbo 和 LCM-LoRA 等快速生成工具加快了创作过程，但它们也牺牲了一些图像保真度。换句话说，用 50 步和一个好的模型生成的图像，其分辨率或图像保真度总是高于用 5 步和一个好的 LCM 模型生成的图像。

然而，在典型的工作流程中，为了找到完美的图像，需要生成大量的图像，这就减轻了这种权衡。使用图像到图像或内画等工具进行后续迭代，可以增强这些初切图像的细节，弥补最初质量上的损失。使用这些快速技术之一生成的经过适当编辑的图像，其质量不亚于使用普通稳定扩散模型生成的图像。

系好安全带，因为人工智能图像生成领域正在进入超速发展阶段–很少有人比人工智能狂热爱好者更渴望速度。

酋长队考虑向英格兰教练发出潜在邀请

SDXL踩下油门

潜在一致性模型意味着效率

LCM-LoRAS：为任何型号提供涡轮增压

质量与速度

惊喜：《赛博朋克 2077》即将迎来大更新，浪漫爱情和交通选项将一应俱全

以太坊游戏 NFT 市场 Aqua 因行业增长缓慢而关闭

Related Posts

Leave a Comment Cancel Reply