DALL·E 3 畫圖的五個實用技巧

Written by

今天花了大半天時間研究 DALL·E 3 的圖片生成技巧，記錄一些心得。

DALL·E 3 是 OpenAI 推出的 AI 畫圖工具，直接集成在 ChatGPT 裡面。你不需要另外註冊賬號，也不需要學習新的界面，在 ChatGPT 的對話框裡直接描述你想要的圖片就行了。這個設計確實降低了門檻，但也容易讓人低估了它的複雜性。

先說說我的使用場景。我需要用 AI 生成一些圖片來配博客文章，但不想用那些免費素材網站上的通用圖片。AI 生成的圖片至少是獨一無二的，而且可以精確控制內容。但實際操作下來，我才發現「精確控制」這四個字有多難。

第一個重要的經驗：提示詞的結構決定一切。

一開始我隨便寫提示詞，比如「一隻貓在城市裡」，出來的圖片完全不是我想要的。後來我學會了用結構化的提示詞：

「主體：一隻黑貓。風格：賽博朋克插畫。環境：霓虹燈照亮的雨夜街道。光線：從左上方打過來的粉紫色霓虹燈。構圖：低角度仰拍。」

這種結構化的方式效果明顯好很多。AI 能更準確地理解你想要什麼，出來的圖片也更接近預期。

第二個經驗：風格化的圖片比寫實圖片容易做得好。

我嘗試過生成「真實的風景照片」，結果出來的圖片總有一種「不真實」的感覺。天空的顏色太完美，光影太均勻，看起來像是渲染出來的3D場景而不是真實照片。但如果你要求「油畫風格」「水彩風格」「賽博朋克風格」之類的藝術化效果，DALL·E 3 的表現就好得多。

我猜這可能是因為寫實照片需要的細節太多了——皮膚的質感、環境的不完美、隨機的瑕疵……這些東西人類一眼就能看出來，但 AI 很難生成得自然。而藝術風格本身就允許一定程度的誇張和不完美，所以 AI 在這個範圍內更容易做得好。

第三個經驗：文字是大忌。

AI 生成的圖片如果包含文字，基本上都是亂碼。我試過很多次，不管是英文還是中文，只要提示詞裡要求畫面中有文字，出來的結果都很荒誕。所以如果你需要在圖片上加文字，還是老老實實用 PS 或 Canva 吧。

第四個經驗：多生成幾次。

DALL·E 3 每次生成的結果都不一樣，有時候第一次生成的不好，換個提示詞或者多試幾次就好了。我通常會生成四到五張，然後選最好的一張。這也是為什麼我建議不要在 AI 圖片上花太多時間——因為你的時間成本是不固定的，可能一次就出好圖，也可能試十次都不滿意。

第五個經驗：後期處理很重要。

AI 生成的圖片很少能直接用。我通常還需要在 Canva 裡做一些調整——裁剪、調色、加文字。把 AI 生成的圖片當成「素材」而不是「成品」，心態會好很多。

跟 Midjourney 的比較：Midjourney 生成的圖片整體質量更高，尤其是人物和場景的細節。但它需要通過 Discord 操作，門檻比 DALL·E 3 高。如果你只是偶爾需要生成一些圖片，DALL·E 3 夠用了；如果你需要高質量的商業圖片，Midjourney 更合適。

最後一點思考：AI 畫圖工具的發展速度真的很驚人。去年還覺得 AI 畫的東西很粗糙，今年已經接近專業水平了。再過一年，可能很難分辨哪些圖片是 AI 生成的，哪些是人畫的。這對插畫師和設計師來說可能不是什麼好消息，但對我們普通人來說，創作的門檻在大幅降低。

Comments