新版 MidJourney V6 升级了视觉效果并解决了文本生成问题（大部分内容）

by Thomas 23 1 月, 2024

written by Thomas 23 1 月, 2024

在数字创意领域的激烈竞争中，

MidJourney 刚刚发布了最新的人工智能图像生成器模型 V6 基本模型。开发团队表示，V6 的特点是增强了提示准确性、提高了连贯性，而且在《MidJourney》的进化过程中首次实现了文本生成功能。

V6 在 Discord 官方论坛上发布，被定位为一次重大革新。

公告显示：”更准确的提示跟随以及更长的提示、更好的连贯性和模型知识”，强调了与 2023 年 5 月推出的 V5.1 版本相比的进步。V5 型号以其易于使用的简短提示和美观改进而著称，为更复杂、更详细的 V6 型号铺平了道路。

V6 最值得一提的组件之一就是它的文本绘制能力。虽然这并不是该模型的重点–团队称这仍然是一个 “次要 “功能–但这一功能使 MidJourney 与 Dall-E 3 和 Ideogram 等其他领先模型形成了直接竞争。然而，MidJourney 的文本生成方法是独一无二的。

Midjourney 将其描述为 “次要的文本绘制能力”。”你必须用’引号’来书写文本，–style raw 或较低的–stylize 值可能会有所帮助”。

TCN 对该模型进行了测试，并将其与以文本生成准确性著称的 Dall-E 3 进行了比较。MidJourney 似乎优先考虑了风格和美观，有时甚至牺牲了文本的准确性。大多数情况下，它生成的文本要么不准确，要么没有。但当它生成图片时，其效果与 Dall-E 3（支持 ChatGPT 和微软必应的文本到图片人工智能模型）生成的图片相当，甚至更好。

比较 MidJourney、Dall-E 3、SDXL 与 Harrlogos 和 Ideogram AI 的文本生成，一个过于简单的建议是，如果美观是优先考虑的因素，可以使用 MidJourney，Dall-E 3 则便于使用并具有卡通数字艺术美感，SDXL 适合具有 A1111 高级知识的人，而 Ideogram AI 则适合文本比美观更重要的结果。

MidJourney 和带有 ChatGPT 的 Dalle-3 目前需要付费，而 SDXL 和 Ideogram AI 则是免费的。必应的 Dall-E 3 版本可以免费使用，但它只能生成方形图片，而且人们只能修改提示，而不是 OpenAI 所采用的自然对话方式。

与 v5 相比，MidJourney V6 的速度稍慢，成本也更高，但该团队强调，他们将集中精力加快模型的速度。V6 还改进了 “微妙 “和 “创意 “模式下的升频器，将图像分辨率提高了 2 倍。

这些功能加上各种支持的参数，如–ar（改变分辨率）、–chaos（改变各代之间的变化）和–stylize（改变模型的创意程度），为用户提供了广泛的创意可能性。不过，其他功能，如内绘、外绘和图像描述，目前还不可用。据 MidJourney 称，这些功能将在下个月的更新中推出。

该公告呼吁用户 “带着快乐、好奇、责任和尊重 “使用这些 “不可思议的能力”，这也是 MidJourney 一贯的精神。但也别高兴得太早，因为他们的审查会更加严格。

公告中写道：”不要成为一个混蛋，也不要制作图片来制造戏剧性”。这很有可能会阻止创建数字腰果或政治深造的尝试

。

新版 MidJourney V6 升级了视觉效果并解决了文本生成问题（大部分内容）

纪念币狂热助推 Solana DeFi 交易量首次超过以太坊

杰克-多西支持的海洋矿池在铭文上翻转，比特币Ordinals批评者屈服了

Related Posts

Leave a Comment Cancel Reply