Home » 新款 DALL-E 3 图像生成器大幅升级–带防护栏

新款 DALL-E 3 图像生成器大幅升级–带防护栏

by Patricia

生成式人工智能行业蓬勃发展背后的独角兽公司开放人工智能(OpenAI)发布了其图像生成器的最新迭代产品 DALL-E 3。借助 ChatGPT 控制器,该升级版可根据自然语言提示提供高质量的图像,而且在启动时还能进行道德控制。

自去年年底人工智能蓬勃发展以来,DALL-E、MidJourney 和 Stable Diffusion 等图像生成器为艺术家和普通用户开辟了新的创意领域。通过将文字提示转化为令人惊叹的视觉效果,它们让人们看到了机器对人类创造力的诠释。现在,OpenAI 的目标是通过 DALL-E 3 进一步突破界限,这种模式可能会让它重新回到与其他行业领导者的直接竞争中。

今天早些时候亮相的 DALL-E 3 展示了在准确描绘详细文字描述方面的巨大进步。与之前的迭代产品不同的是,它能紧贴复杂的提示,而不需要对提示工程进行巨大的调整,也不需要其他复杂的提示技巧。新系统还擅长捕捉物体之间的关系,并生成逼真的人体细节,如手和倒影。


将《达利 2》和《达利 3》中相同提示的输出结果进行比较,后者生成的图像明显更清晰、更精确。它可以渲染极其逼真的场景,同时还能正确处理纹理、光照和背景。而且,它似乎很有能力生成文字并将其融入图像中–即使是迄今为止最强大的人工智能图像生成器也无法做到这一点。

DALL-E 3 建立在 ChatGPT 的基础上,允许用户通过对话交流迭代完善提示。早期泄露的样本暗示了极快的迭代能力。据 TCN 此前报道,YouTuber MattVidPro 称 DALL-E 3 的早期测试版 “疯狂”,并断言甚至连 MidJourney 即将推出的版本也无法与之匹敌。

不过,该版本的可用性仍严格限制在 400 名左右的测试者,OpenAI 表示其新版模型将 “很快 “发布。

使用 DALL-E 3 创建的图像以及在此过程中使用的提示语言。来源:OpenAI OpenAI

使用 DALL-E 3 创建的图像以及在此过程中使用的提示语言。来源:OpenAI OpenAI


目前,用户可以使用 ChatGPT Plus 插件使用 DALL-E 2 创建图像。那些没有付费订阅的用户将不得不面对这样的限制:


这一路走来并非一帆风顺。在测试阶段,该模型因其未经审查的性质而备受关注,能够生成从裸体到血腥和暴力的内容。这引起了人们的关注,并引发了对此类技术潜在滥用的担忧。不过,OpenAI 似乎已经将这些担忧放在心上,在《达利3》中实施了一些功能,防止生成可能被视为暴力、成人或仇恨的内容,确保更安全的用户体验。

其中一项措施是组建一个专家团队,”帮助我们在宣传和错误信息等领域进行风险评估和缓解工作”。

人们对人工智能艺术的担忧依然存在,尤其是对不当或不道德内容的担忧。虽然 OpenAI 在测试过程中移除了过滤器,但该公司仍在探索防止公共版本滥用的策略。它还将更容易地识别用其工具生成的图像。这可以防止 deepfake 的传播,并在有人绕过模型的原生审查时识别图片的来源。

OpenAI 也意识到了人们对合法使用人类艺术品来训练其模型的担忧,并提出了一个更符合道德规范的生成器的答案。当被要求模仿在世的艺术家时,DALL-E 3 不会复制内容,OpenAI 将允许创作者选择退出。这解决了格雷格-鲁特科夫斯基(Greg Rutkowski)等艺术家的反弹,他们认为人工智能未经同意复制他们的风格是不道德的。

此外,包括作家乔治-R-R-马丁(George R.R. Martin)在内的一些人还提起了重大诉讼,指控 OpenAI 不当使用受版权保护的材料。

OpenAI 没有立即回应 TCN.

的评论请求。

Related Posts

Leave a Comment