DALL·E 3 畫圖的五個實用技巧

Written by

in

今天花了大半天時間研究 DALL·E 3 的圖片生成技巧,記錄一些心得。

DALL·E 3 是 OpenAI 推出的 AI 畫圖工具,直接集成在 ChatGPT 裡面。你不需要另外註冊賬號,也不需要學習新的界面,在 ChatGPT 的對話框裡直接描述你想要的圖片就行了。這個設計確實降低了門檻,但也容易讓人低估了它的複雜性。

先說說我的使用場景。我需要用 AI 生成一些圖片來配博客文章,但不想用那些免費素材網站上的通用圖片。AI 生成的圖片至少是獨一無二的,而且可以精確控制內容。但實際操作下來,我才發現「精確控制」這四個字有多難。

第一個重要的經驗:提示詞的結構決定一切。

一開始我隨便寫提示詞,比如「一隻貓在城市裡」,出來的圖片完全不是我想要的。後來我學會了用結構化的提示詞:

「主體:一隻黑貓。風格:賽博朋克插畫。環境:霓虹燈照亮的雨夜街道。光線:從左上方打過來的粉紫色霓虹燈。構圖:低角度仰拍。」

這種結構化的方式效果明顯好很多。AI 能更準確地理解你想要什麼,出來的圖片也更接近預期。

第二個經驗:風格化的圖片比寫實圖片容易做得好。

我嘗試過生成「真實的風景照片」,結果出來的圖片總有一種「不真實」的感覺。天空的顏色太完美,光影太均勻,看起來像是渲染出來的3D場景而不是真實照片。但如果你要求「油畫風格」「水彩風格」「賽博朋克風格」之類的藝術化效果,DALL·E 3 的表現就好得多。

我猜這可能是因為寫實照片需要的細節太多了——皮膚的質感、環境的不完美、隨機的瑕疵……這些東西人類一眼就能看出來,但 AI 很難生成得自然。而藝術風格本身就允許一定程度的誇張和不完美,所以 AI 在這個範圍內更容易做得好。

第三個經驗:文字是大忌。

AI 生成的圖片如果包含文字,基本上都是亂碼。我試過很多次,不管是英文還是中文,只要提示詞裡要求畫面中有文字,出來的結果都很荒誕。所以如果你需要在圖片上加文字,還是老老實實用 PS 或 Canva 吧。

第四個經驗:多生成幾次。

DALL·E 3 每次生成的結果都不一樣,有時候第一次生成的不好,換個提示詞或者多試幾次就好了。我通常會生成四到五張,然後選最好的一張。這也是為什麼我建議不要在 AI 圖片上花太多時間——因為你的時間成本是不固定的,可能一次就出好圖,也可能試十次都不滿意。

第五個經驗:後期處理很重要。

AI 生成的圖片很少能直接用。我通常還需要在 Canva 裡做一些調整——裁剪、調色、加文字。把 AI 生成的圖片當成「素材」而不是「成品」,心態會好很多。

跟 Midjourney 的比較:Midjourney 生成的圖片整體質量更高,尤其是人物和場景的細節。但它需要通過 Discord 操作,門檻比 DALL·E 3 高。如果你只是偶爾需要生成一些圖片,DALL·E 3 夠用了;如果你需要高質量的商業圖片,Midjourney 更合適。

最後一點思考:AI 畫圖工具的發展速度真的很驚人。去年還覺得 AI 畫的東西很粗糙,今年已經接近專業水平了。再過一年,可能很難分辨哪些圖片是 AI 生成的,哪些是人畫的。這對插畫師和設計師來說可能不是什麼好消息,但對我們普通人來說,創作的門檻在大幅降低。

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *