OpenAI 推出支持 ChatGPT 的 Dall-E 3 艺术生成器
该公司声称 Dall-E 3 可以比以前的系统理解更多的细微差别和细节,尽管围绕人工智能生成的艺术仍然存在版权问题。
继其他生成式 AI 产品取得成功之后,OpenAI 推出了最新的文本到图像生成器 Dall-E 3。
该公司表示,这种升级后的模型能够比以前的系统理解“更多的细微差别和细节”,以便将文本提示转换为准确的图像。最新模型目前处于“研究预览”阶段,但将于下个月向 ChatGPT Plus 和企业客户提供。
市场上有各种文本转图像生成器,例如 Midjourney、Stable Diffiusion 和 OpenAI 自己的 DALL-E 模型。但该公司声称当前的系统往往会忽略某些词语或描述。
该公司在一篇博文中表示:“Dall-E 3 代表了我们生成完全符合您提供的文本的图像的能力的飞跃。”
该 AI 模型还与 OpenAI 流行的聊天机器人 ChatGPT 集成。该公司表示,用户可以使用 ChatGPT 对 Dall-E 3 生成的图像进行微调。
文本到图像的问题
OpenAI 进军文本转图像领域始于 2021 年 Dall-E 的创建。但该公司去年推出了后继产品 Dall-E 2,从而获得了极大关注,该产品可以生成“更真实、更准确的图像”四倍的分辨率”。
OpenAI 表示,到 2022 年 9 月,该工具拥有超过 150 万活跃用户,每天创建超过 200 万张图像。在 Dall-E 2同月全面上市后,这一数字可能会显着增长。
然而,过去人们对文本到图像生成器的使用提出了一些担忧,例如它们创建可能用于错误信息的逼真图像的能力。
OpenAI 表示,它已采取措施限制 Dall-E 3 生成暴力、成人或仇恨内容的能力,其过程与早期模型类似。这包括提高“风险领域的安全绩效,例如公众人物的产生以及与视觉过度/代表性不足相关的有害偏见”。
文本到图像生成器过去也受到艺术家的批评,因为声称他们中的许多人使用他们的作品作为训练数据来生成新内容。
OpenAI 表示,Dall-E 3 旨在拒绝要求“具有在世艺术家风格”的图像的请求。该公司还声称,创作者可以“选择将他们的图像从我们未来图像生成模型的训练中剔除”。
与此同时,OpenAI 表示,用户使用 Dall-E 3 生成的图像是他们自己的,他们“不需要我们的许可即可转载、出售或销售它们”。但人工智能生成的图像和版权的法律领域充其量仍然是模糊的。
上个月,美国一家法院裁定人工智能生成的艺术品不能获得版权。美国地方法院法官贝里尔·豪厄尔补充说,版权从未被授予“缺乏人类指导”的作品,并且人类是“有效版权主张的重要组成部分”。