DALL·E 3 画图的五个实用技巧
今天花了大半天时间研究 DALL·E 3 的图片生成技巧,记录一些心得。
DALL·E 3 是 OpenAI 推出的 AI 画图工具,直接集成在 ChatGPT 里面。你不需要另外注册账号,也不需要学习新的界面,在 ChatGPT 的对话框里直接描述你想要的图片就行了。这个设计确实降低了门槛,但也容易让人低估了它的复杂性。
先说说我的使用场景。我需要用 AI 生成一些图片来配博客文章,但不想用那些免费素材网站上的通用图片。AI 生成的图片至少是独一无二的,而且可以精确控制内容。但实际操作下来,我才发现「精确控制」这四个字有多难。
第一个重要的经验:提示词的结构决定一切。
一开始我随便写提示词,比如「一只猫在城市里」,出来的图片完全不是我想要的。后来我学会了用结构化的提示词:
「主体:一只黑猫。风格:赛博朋克插画。环境:霓虹灯照亮的雨夜街道。光线:从左上方打过来的粉紫色霓虹灯。构图:低角度仰拍。」
这种结构化的方式效果明显好很多。AI 能更准确地理解你想要什么,出来的图片也更接近预期。
第二个经验:风格化的图片比写实图片容易做得好。
我尝试过生成「真实的风景照片」,结果出来的图片总有一种「不真实」的感觉。天空的颜色太完美,光影太均匀,看起来像是渲染出来的3D场景而不是真实照片。但如果你要求「油画风格」「水彩风格」「赛博朋克风格」之类的艺术化效果,DALL·E 3 的表现就好得多。
我猜这可能是因为写实照片需要的细节太多了——皮肤的质感、环境的不完美、随机的瑕疵……这些东西人类一眼就能看出来,但 AI 很难生成得自然。而艺术风格本身就允许一定程度的夸张和不完美,所以 AI 在这个范围内更容易做得好。
第三个经验:文字是大忌。
AI 生成的图片如果包含文字,基本上都是乱码。我试过很多次,不管是英文还是中文,只要提示词里要求画面中有文字,出来的结果都很荒诞。所以如果你需要在图片上加文字,还是老老实实用 PS 或 Canva 吧。
第四个经验:多生成几次。
DALL·E 3 每次生成的结果都不一样,有时候第一次生成的不好,换个提示词或者多试几次就好了。我通常会生成四到五张,然后选最好的一张。这也是为什么我建议不要在 AI 图片上花太多时间——因为你的时间成本是不固定的,可能一次就出好图,也可能试十次都不满意。
第五个经验:后期处理很重要。
AI 生成的图片很少能直接用。我通常还需要在 Canva 里做一些调整——裁剪、调色、加文字。把 AI 生成的图片当成「素材」而不是「成品」,心态会好很多。
跟 Midjourney 的比较:Midjourney 生成的图片整体质量更高,尤其是人物和场景的细节。但它需要通过 Discord 操作,门槛比 DALL·E 3 高。如果你只是偶尔需要生成一些图片,DALL·E 3 够用了;如果你需要高质量的商业图片,Midjourney 更合适。
最后一点思考:AI 画图工具的发展速度真的很惊人。去年还觉得 AI 画的东西很粗糙,今年已经接近专业水平了。再过一年,可能很难分辨哪些图片是 AI 生成的,哪些是人画的。这对插画师和设计师来说可能不是什么好消息,但对我们普通人来说,创作的门槛在大幅降低。