Home » 新版 MidJourney V6 升级了视觉效果并解决了文本生成问题(大部分内容)

新版 MidJourney V6 升级了视觉效果并解决了文本生成问题(大部分内容)

by Thomas

在数字创意领域的激烈竞争中,

MidJourney 刚刚发布了最新的人工智能图像生成器模型 V6 基本模型。开发团队表示,V6 的特点是增强了提示准确性、提高了连贯性,而且在《MidJourney》的进化过程中首次实现了文本生成功能。

V6 在 Discord 官方论坛上发布,被定位为一次重大革新。

公告显示:”更准确的提示跟随以及更长的提示、更好的连贯性和模型知识”,强调了与 2023 年 5 月推出的 V5.1 版本相比的进步。V5 型号以其易于使用的简短提示和美观改进而著称,为更复杂、更详细的 V6 型号铺平了道路。

V6 最值得一提的组件之一就是它的文本绘制能力。虽然这并不是该模型的重点–团队称这仍然是一个 “次要 “功能–但这一功能使 MidJourney 与 Dall-E 3 和 Ideogram 等其他领先模型形成了直接竞争。然而,MidJourney 的文本生成方法是独一无二的。

Midjourney 将其描述为 “次要的文本绘制能力”。”你必须用’引号’来书写文本,–style raw 或较低的–stylize 值可能会有所帮助”。

TCN 对该模型进行了测试,并将其与以文本生成准确性著称的 Dall-E 3 进行了比较。MidJourney 似乎优先考虑了风格和美观,有时甚至牺牲了文本的准确性。大多数情况下,它生成的文本要么不准确,要么没有。但当它生成图片时,其效果与 Dall-E 3(支持 ChatGPT 和微软必应的文本到图片人工智能模型)生成的图片相当,甚至更好。

比较 MidJourney、Dall-E 3、SDXL 与 Harrlogos 和 Ideogram AI 的文本生成,一个过于简单的建议是,如果美观是优先考虑的因素,可以使用 MidJourney,Dall-E 3 则便于使用并具有卡通数字艺术美感,SDXL 适合具有 A1111 高级知识的人,而 Ideogram AI 则适合文本比美观更重要的结果。

MidJourney 和带有 ChatGPT 的 Dalle-3 目前需要付费,而 SDXL 和 Ideogram AI 则是免费的。必应的 Dall-E 3 版本可以免费使用,但它只能生成方形图片,而且人们只能修改提示,而不是 OpenAI 所采用的自然对话方式。

与 v5 相比,MidJourney V6 的速度稍慢,成本也更高,但该团队强调,他们将集中精力加快模型的速度。V6 还改进了 “微妙 “和 “创意 “模式下的升频器,将图像分辨率提高了 2 倍。

这些功能加上各种支持的参数,如–ar(改变分辨率)、–chaos(改变各代之间的变化)和–stylize(改变模型的创意程度),为用户提供了广泛的创意可能性。不过,其他功能,如内绘、外绘和图像描述,目前还不可用。据 MidJourney 称,这些功能将在下个月的更新中推出。

该公告呼吁用户 “带着快乐、好奇、责任和尊重 “使用这些 “不可思议的能力”,这也是 MidJourney 一贯的精神。但也别高兴得太早,因为他们的审查会更加严格。

公告中写道:”不要成为一个混蛋,也不要制作图片来制造戏剧性”。这很有可能会阻止创建数字腰果或政治深造的尝试

Related Posts

Leave a Comment