DALL·E 系列是由 OpenAI 开发的一系列基于大型语言模型的文本到图像生成系统。它们的核心目标是将文本描述转化为高度精确的图像。DALL·E2在2022年4月发布,但是一直没有公开使用,一年半后的2023年9月21日,OpenAI发布第三代DALL·E3,并承诺将与ChatGPT集成。
DALL·E3介绍 2021年1月份,OpenAI发布了他们的DALL·E模型,它能从文字说明中创建图像,用于表达各种可由自然语言表达的概念。一年后,OpenAI发布了第二代的DALL·E模型。相比较第一代的模型,DALL·E 2,以4倍的分辨率生成更真实和准确的图像。本次发布的DALL·E 3相较于OpenAI之前的系统更能理解更多的细微差别和细节,这使得大家能够轻松地将您的想法转化为极为准确的图像。简单来说,OpenAI此次发布的DALL·E3系列着重强调降低用户提示的负担,关注更多文本的细节。
DALL·E3与StableDiffusionXL-1.0对比 官方用一个实例描述了这种关注文本细节的图像生成模型的能力。例如,描述了一个熙熙攘攘的城市街道、一个红头发的年轻女子与一个脾气暴躁的老小贩的交互等。这些描述都被DALL·E3完美地转化为了图像,展示了其对细节的高度关注。
DALL·E3的使用 根据OpenAI的描述,DALL·E3是在ChatGPT上原生构建的,它可以让ChatGPT用作集思广益的合作伙伴和提示的细化器。只要问ChatGPT你想在任何内容中看到什么,不管是从简单的句子还是到详细的段落都可以。
DALL·E3的发布与其它资源 DALL·E 3目前正在研究预览中,将于10月通过API和今年秋季晚些时候在实验室向ChatGPT Plus和企业客户提供。需要注意的是,与之前的版本一样,OpenAI已经采取措施限制DALL·E 3生成暴力、成人或仇恨内容的能力。