作者:Joy Zhang

翻译:陈超

校对:赵茹萱

本文约3000字,建议阅读8分钟

本文介绍了作者使用DALL·E 2生成了美洲驼灌篮的逼真版图片的过程。

是的,这是一只美洲驼灌篮。一份对DALL·E 2封闭测试版试验的过程、限制以及学习内容的总结。

美洲驼打篮球,DALL·E 2生成

自从我第一次看到那幅人工生成的“柴犬便当盒”(https://twitter.com/hardmaru/status/1522166259890151424)图像时,我就一直在死磕DALL·E 2。

哇哦,现在已经是颠覆性技术了。

对于不熟悉DALL·E 2的人来说,这是一个由OpenAI创建的能够利用文本生成原创图像的系统。他现在处于封闭测试阶段。我在五月初注册了等候者名单,并在七月底获得了使用权限。在测试阶段,用户收到积分(首月免费赠送50积分,之后每月15积分)后,每次花费1积分,就可以生成3-4幅图片。你可以用15美元购买115积分。

P.S. 如果你不想等,也可以免费使用DALL·E mini版本。当然,图像的质量通常会更差(由此产生了一大批DALL·E的表情包https://www.wired.com/story/dalle-ai-meme-machine/),并且每次要花大概60秒的时间(DALL·E 2只需要5秒左右)。

或许你已经看过了许多精心挑选的在线图像表明DALL·E 2是可以的。本文中,我分享了一个如何通过主题“美洲驼打篮球”来创造一幅有用的图片的详细步骤。如果你想自己尝试使用DALL·E 2或者你只是对它能干什么感兴趣的话,你会发现它很有用。

开始

DALL·E 2是科学和艺术的结合。为了阐述这一点,以下给出了“美洲驼打篮球”的结果:

 图像由作者使用DALL·E 2通过提示“美洲驼打篮球”生成

为什么DALL·E 2倾向于生成卡通图片呢?我假设在训练过程中缺乏关于美洲驼打篮球的真实图像。

我尝试再进一步地增加“逼真图像”的关键词:

手持打造有凝聚力的场景

图像由作者使用 DALL·E 2 通过提示“美洲驼打篮球的逼真照片”生成

这张美洲驼照片看起来更写实,但是整幅图看起来像一团糟的ps作品。在这个案例当中,DALL·E 2明显需要一些手持式动作来创造一个更有粘合度的场景。

提示工程,也可以解释为明确你真正想要的东西的艺术

在DALL·E的情境中,提示工程指的是设计提示线索以给出想要结果的过程。

DALL·E 2提示书就是一个绝佳的资源。它有来源于摄影和艺术的关键词组成的详细线索灵感列表。

为什么这样的关键词是必要的呢?因为从DALL·E 2中获得有用的结果是非常挑剔的(尤其是当你不确定DALL·E 2有什么用的时候)。线索如此之多,以至于一家初创公司甚至建立了一个提示线索的市场,收费1.99美元,以此来节约你自己苦思冥想所耗费的时间和金钱。

我个人最喜欢的发现是“戏剧性的背景光”。

参考文章

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: