由前谷歌工程师创建的人工智能图像生成器
Ideogram 发布了第一批升级,旨在使该平台功能更强大、更易用。这些升级增加了一些功能,以更好地匹配 Stable Diffusion 和 Midjourney 的产品,而且价格合理。
Ideogram 于今年 2 月首次公开发布,很快就受到了人工智能爱好者的青睐,被视为 Midjourney、Dall-E 3 和 Stable Diffusion 的强大替代品。TCN 的测试发现,与其他流行的图像生成器相比,Ideogram 在提示理解能力、文本生成能力、空间感知能力、提示遵循能力、风格多样性、人物和品牌生成能力以及整体质量方面都表现出色。
“我们很高兴发布 Ideogram 1.0 的重大升级版,这是我们最先进的文本到图像模型,同时还发布了几项新功能,包括用于图像标题的’描述’、负提示以及图像渲染质量和速度控制,”官方公告写道。
“描述 “可以分析图像并帮助添加标题;”负面提示 “可以告诉模型避免生成哪些元素;图像渲染和速度控制可以平衡输出质量和效率,适合那些喜欢快速生成而非细节的用户。后一项功能模仿了 Stable Difussion 的 Turbo 和 LCM 模型。
不过,这些升级都有一个限制:只有付费用户才能使用。免费用户可以使用该模型,但仅限于生成最多 25 批、每批 4 幅图像。
渴望尝试这些功能的用户可以升级到每月 7 美元的 “Basic “计划或 16 美元的 “Plus “计划。付费计划还能让用户获得其他特权,如私人生成、种子控制、内画功能和慢速模式下的无限生成。
“描述 “功能是一项重要的新增功能,尤其是对基本用户而言。该助手可对任何上传的图片进行详细描述,然后可用于生成更准确或描述性更强的提示,以便在后续迭代中更好地匹配参考。用户可以要求对 Ideogram feed 中的任何图片或从本地设备上传的自己的图片进行描述。
Ideogram 现在还允许用户在三种渲染选项之间切换:快速、默认和高质量。快速模式优先考虑速度,生成图像的时间约为 5 秒;优质模式优先考虑更精细的细节,生成图像的时间约为 20 秒。
同时,否定提示功能扩展了 Ideogram 的编辑功能。用户可以通过该工具指定他们不想在生成的图像中看到的内容,从而对输出结果进行更多控制。对于完善文本到图像的生成结果来说,这是一项特别有用的功能,可以在第一时间生成更准确、更相关的图像。
最后,Ideogram 表示已改进了文本渲染和逼真度。该团队表示,与最初的模型相比,升级后的文本错误率降低了 15%。Ideogram 声称,与最初发布的版本相比,审稿人对升级版模型生成的图像的偏爱程度提高了 30-50%。
上个月,Ideogram 团队在 Discord 会议上首次宣布了这些改进,在用户社区中引起了早期的积极反响。
有了这些改进,再加上每月 7 美元到 16 美元的付费级别,Ideogram 已成为图像生成 AI 工具中性价比极高的有力竞争者。相比之下,订阅 MidJourney 的年费在 96 美元到 1152 美元之间,订阅 ChatGPT Plus(可访问 Dall-E 3)的月费为 20 美元,而其他 AI 图像生成器(如 Leonardo AI 和 Maze Guru)的订阅费用在 10 美元到 25 美元之间。
同时,对于那些不愿意为高级功能付费的用户,开源的 Stable Diffusion 是免费的,并提供类似的功能,至少对于拥有更强大电脑的用户来说是这样。