DALL·E 3 画图的五个实用技巧

Share

今天花了大半天时间研究 DALL·E 3 的图片生成技巧,记录一些心得。

DALL·E 3 是 OpenAI 推出的 AI 画图工具,直接集成在 ChatGPT 里面。你不需要另外注册账号,也不需要学习新的界面,在 ChatGPT 的对话框里直接描述你想要的图片就行了。这个设计确实降低了门槛,但也容易让人低估了它的复杂性。

先说说我的使用场景。我需要用 AI 生成一些图片来配博客文章,但不想用那些免费素材网站上的通用图片。AI 生成的图片至少是独一无二的,而且可以精确控制内容。但实际操作下来,我才发现「精确控制」这四个字有多难。

第一个重要的经验:提示词的结构决定一切。

一开始我随便写提示词,比如「一只猫在城市里」,出来的图片完全不是我想要的。后来我学会了用结构化的提示词:

「主体:一只黑猫。风格:赛博朋克插画。环境:霓虹灯照亮的雨夜街道。光线:从左上方打过来的粉紫色霓虹灯。构图:低角度仰拍。」

这种结构化的方式效果明显好很多。AI 能更准确地理解你想要什么,出来的图片也更接近预期。

第二个经验:风格化的图片比写实图片容易做得好。

我尝试过生成「真实的风景照片」,结果出来的图片总有一种「不真实」的感觉。天空的颜色太完美,光影太均匀,看起来像是渲染出来的3D场景而不是真实照片。但如果你要求「油画风格」「水彩风格」「赛博朋克风格」之类的艺术化效果,DALL·E 3 的表现就好得多。

我猜这可能是因为写实照片需要的细节太多了——皮肤的质感、环境的不完美、随机的瑕疵……这些东西人类一眼就能看出来,但 AI 很难生成得自然。而艺术风格本身就允许一定程度的夸张和不完美,所以 AI 在这个范围内更容易做得好。

第三个经验:文字是大忌。

AI 生成的图片如果包含文字,基本上都是乱码。我试过很多次,不管是英文还是中文,只要提示词里要求画面中有文字,出来的结果都很荒诞。所以如果你需要在图片上加文字,还是老老实实用 PS 或 Canva 吧。

第四个经验:多生成几次。

DALL·E 3 每次生成的结果都不一样,有时候第一次生成的不好,换个提示词或者多试几次就好了。我通常会生成四到五张,然后选最好的一张。这也是为什么我建议不要在 AI 图片上花太多时间——因为你的时间成本是不固定的,可能一次就出好图,也可能试十次都不满意。

第五个经验:后期处理很重要。

AI 生成的图片很少能直接用。我通常还需要在 Canva 里做一些调整——裁剪、调色、加文字。把 AI 生成的图片当成「素材」而不是「成品」,心态会好很多。

跟 Midjourney 的比较:Midjourney 生成的图片整体质量更高,尤其是人物和场景的细节。但它需要通过 Discord 操作,门槛比 DALL·E 3 高。如果你只是偶尔需要生成一些图片,DALL·E 3 够用了;如果你需要高质量的商业图片,Midjourney 更合适。

最后一点思考:AI 画图工具的发展速度真的很惊人。去年还觉得 AI 画的东西很粗糙,今年已经接近专业水平了。再过一年,可能很难分辨哪些图片是 AI 生成的,哪些是人画的。这对插画师和设计师来说可能不是什么好消息,但对我们普通人来说,创作的门槛在大幅降低。

Read more

MEV 是什么?为什么说它是区块链的暗面

如果你只是一个普通用户,在链上做了一笔兑换交易,你可能觉得这笔交易就是「发送到区块链 → 矿工处理 → 完成」。但实际上,从你发送交易到它被打包进区块的这段时间里,可能已经有一群「搜索者」在利用你的交易赚钱了。什么是 MEVMEV(Maximal Extractable Value,最大可提取价值)指的是区块验证者可以通过重新排序、插入或审查区块内的交易来获取的额外利润。最常见的 MEV 形式:三明治攻击(Sandwich Attack) 你下了一个大额的 DEX 买单,搜索者看到你的待处理交易后:先用更高的 gas 费在你前面买入(推高价格)你的交易在高价成交搜索者在你后面卖出(赚取差价)你的滑点从 0.5% 变成了 2% 多,差价被搜索者拿走了。套利(Arbitrage) 不同 DEX 之间的价格差异。搜索者同时在低价 DEX 买入、

By

稳定币战争:USDT、USDC 背后的商业逻辑

稳定币是加密世界里最被低估的基础设施。每天数百亿美元的交易量,但大多数人只把它当作「币圈的银行卡」。实际上,稳定币的运作模式比你想像的复杂得多。Tether 的赚钱模式USDT 的发行方 Tether 是全球最赚钱的公司之一,员工不到 100 人。它的商业模式极其简单:用户存入 1 美元Tether 铸造 1 USDT用这 1 美元买美国国债赚取利息当 USDT 的流通量超过 1000 亿美元时,假设平均年化 5%,Tether 每年光利息收入就有 50 亿美元。这还不算手续费和兑换差价。这就是为什么 Tether 的财报比很多上市公司还好看——它本质上是一家零成本融资的对冲基金。USDC 的不同路径Circle 的 USDC 走的是合规路线。它的储备金全部放在美国银行和短期国债里,每个月都有第三方审计。USDC 在 DeFi 生态中的使用率远高于 USDT,

By

比特币现货 ETF 通过一年后,市场格局变了多少

2024年1月美国 SEC 批准了首批比特币现货 ETF,当时整个加密圈都在庆祝——这被视为比特币走向主流的里程碑。但一年过去了,真正的影响是什么?机构资金的流入规模贝莱德的 IBIT 在批准后几个月内就超过了 100 亿美元 AUM,这在 ETF 历史上是前所未有的。富达的 FBTC 也紧随其后。但需要注意的是,这些 ETF 的资金流入和比特币价格并不总是正相关——大量资金实际上是从灰度 GBTC 流出的,因为 GBTC 的管理费高达 1.5%,而 IBIT 只收 0.25%。这说明了一个关键问题:机构化不等于牛市。资金只是换了个容器,并没有大量新增。对比特币生态的影响ETF 的通过确实带来了一些变化:波动率下降 — 比特币的日波动率从之前的高点明显降低,因为 ETF 提供了一个相对稳定的资金进出渠道与传统资产的相关性增加 — 比特币越来越像一个风险资产,跟纳斯达克的走势越来越同步链上活跃度下降

By

又折腾了一下午的排版

又折腾了一下午的排版 本来以为上午把主题搞定就行了,结果下午一看手机上的效果,完全不行。字贴著边、间距不对、评论区一片白。 问题的根源是 WordPress block theme 的机制跟我之前理解的不一样。 body padding 是 0 WP Twenty Twenty-Five 的 theme.json 里 body padding 设成了 0px。它依赖 has-global-padding 这个 CSS class 和 CSS 变量来控制间距。但那些变量的默认值就是 0px,所以如果不在 Site Editor 里手动调,内容就直接贴边了。 我的 CSS 里用 :root { --wp-

By