标签

AI 不缺生成力,缺的是世界观

发布时间:2026-05-09 14:14来源:微信阅读:7

在 AI 时代,设计师究竟还能掌控什么?

起初,我猜想答案是“工具”。

谁掌握的工具越多,谁的速度就越快。

后来发觉并非如此。

工具会日益增多,也会愈发简便。今日这个模型强大,明日那个模型更强。若设计师仅是追逐工具,便永远会被新工具所左右。

随后我又觉得,答案是“提示词”。

谁能写出更精准的提示词,谁就能获得更佳的成果。

但深究下去,提示词也不过是表象。

因为核心的问题并非:

“我如何让 AI 生成一张图?”

而是:

“我如何让 AI 持续产出符合我预期的结果?”

这两者截然不同。

如今许多 AI 生成内容最大的短板,并非不够精美。

恰恰相反,它太容易达到精致了。

光影炫目,质感饱满,细节丰富,完成度极高。

但你看久了便会察觉:

许多画面缺乏真正的判断力。

它会把所有元素都填满。它不懂得何处应当克制。不晓得什么该舍弃。不明白为何留白比堆砌元素更高级。不了解某些品牌为何不能过于喧闹。也不清楚一个画面究竟该服务于何种情绪。

AI 懂得生成,但它未必知晓何物值得被生成。

这也是我近来愈发强烈的感触:

未来稀缺的并非生成能力,而是判断能力。

我如今构建工作流、设计系统、控制层,其实都在做同一件事:

将 AI 从“随机生成器”转变为“可控生产系统”。

工作流是在把控过程。设计系统是在约束规则。提示词结构是在规范表达。视觉规则建模是在主导判断。控制层是在界定 AI 的行为边界。

但控制并非是向 AI 下达绝对指令。

AI 不同于传统软件,它更像是一个概率系统。

所以我们真正能做的,是提升优质结果出现的概率,降低错误结果出现的概率,将其随机性收窄在一个相对稳定的区间内。

这便是控制。

并非让 AI 唯命是从,而是让 AI 逐步融入你的审美体系。

但最近我又意识到,控制仍非终点。

更深的一层,在于世界观。

若仅给 AI 规则,它能学会“如何做”。

但若不赋予它世界观,它便难以理解“为何这样做”。

这便是许多 AI 图看似精美,却缺乏灵魂的缘由。

因为它仅有风格,而无立场。只有形式,而无价值观。只有符号,而无文化底蕴。只有结果,而无取舍逻辑。

我曾做过一项测试。

同样让 AI 生成一张咖啡的产品图,仅更换“我赋予它的世界”。

第一张:不提供任何背景。

提示词大致是:a cup of coffee, product photography, high quality。

生成的图很漂亮。光线打得专业,木桌、绿植、拉花、自然光斑,完成度极高。

但你看完只会说一句:“嗯,一杯咖啡。”

它不属于任何人。

第二张:我赋予它一个“克制者”的世界观。

我不告知 AI 这是哪个品牌,仅告知它:

立场:该品牌反对喧哗,信奉“少即是多”,将饮品视为器物而非商品。

情绪:静谧、近乎宗教感、不允许出现温暖讨好的氛围。

必须没有:暖色光、笑脸、蒸汽特写、可爱字体、装饰性元素。

必须有:大面积负空间、冷调中性色、近乎实验室或药剂师气质的容器。

生成的图——咖啡宛如一件被供奉的器物,而非饮品。

它甚至有点不像在售卖咖啡。但你会记住它。

第三张:我赋予它一个“都市节奏者”的世界观。

同样不提及品牌,仅告知它:

立场:该品牌坚信“咖啡是一种生活速度”,反对慢悠悠的“咖啡仪式感”。

情绪:紧凑、清醒、属于早晨八点的城市。

必须没有:陶瓷杯、田园背景、过分讲究的摆盘、温吞的暖光。

必须有:玻璃杯、人手介入(拿、递、走)、街道或柜台元素、一种“在路上”的状态。

生成的图——咖啡化作了一种生活节奏,而非一杯饮品。

三张图,同一个 AI,同一个底层模型。

差别不在于提示词写得有多好,而在于我赋予它的世界不同。

而你大概也已经辨认出来了——

第二张的逻辑,接近伊索。第三张的逻辑,接近 Manner。第一张,是大多数尚未建立世界观的“AI 生成图”——它最像谁?

它最像被 AI 平均化后的星巴克。

并非因为它差,而是因为它没有立场,所以它会自动滑向所有人都熟知的那个最大公约数。

顺带一提,在运行这组实验时我发现了一件趣事:

第一张图,我未提任何要求——仅写了“a cup of coffee, product photography”。

但 AI 自行添加了:温暖的窗光、木桌、玻璃花瓶、绿植、精致的拉花。

这些无一是我要求的。

这意味着什么?

AI 并非“没有审美”——它有,只是其审美源自所有人都拍过的、Pinterest 上出现频率最高的那种“咖啡店日常”。

所以“无世界观”其实是个错觉。

当你未给 AI 注入立场时,它并非“中性”的——它会自动滑向数据中最常见的审美,即被无数普通用户共同塑造的、温暖的、安全的、无人反对的“平均美感”。

这才是真正的问题:

没有世界观的 AI,并非没有立场,而是被默认安装了一个最平庸的立场。

真正高级的视觉,不仅是风格问题,更是世界观问题。

为何苹果的视觉不会像淘宝?

并非因为它使用了某种字体、某种留白、某种灰白色。

而是因为它背后有一套完整的价值判断:

克制、秩序、静谧、人性化科技、情绪降噪。

这些并非单一风格,而是一套世界观。

若 AI 仅学到“苹果风”,它只能模仿表面。但若 AI 理解了“为何苹果要这样表达”,它才有可能持续产出接近那个气质的结果。

所以我愈发觉得,未来真正重要的并非撰写提示词,而是进行背景工程。

即为 AI 建立上下文。

但这个“上下文”并非一句话能讲清——我在做项目的过程中,慢慢将其拆解为四层:

第一层:立场该品牌信奉什么、反对什么。伊索反对喧哗,苹果反对繁复,无印良品反对“被设计感”。立场决定了所有后续判断的方向。

第二层:情绪它要让人感受到何种温度。是被尊重,还是被点燃?是静谧,还是兴奋?情绪是世界观与视觉之间的翻译层。

第三层:取舍什么必须有,什么必须没有。这一层最关键,也最易被忽略。“必须没有”比“必须有”更能定义一个品牌。

第四层:表达落实到具体的视觉规则——字体、色彩、构图、材质、光线。这一层便是过去所说的“设计系统”。

过去我们构建设计系统,基本只做到第四层。

在 AI 时代,若不补上前三层,AI 便永远在第四层做表面功夫。

或许有人会问:

AI 模型一直在变强,今日它学不会世界观,明日呢?

我的回答是:

AI 能学会“风格的世界观”,但学不会“立场的世界观”。

因为风格可从数据中归纳——见过足够多的克制图,它便能复刻克制的模样。

但立场源于取舍,而取舍需由主体来承担后果。

一个品牌之所以“克制”,并非因为它见过许多克制的图,而是因为其创始人、用户、市场地位,迫使它必须克制——多说一句话便会失去某一类人,多放一个元素便会显得廉价。

这是一个有代价的选择。

而 AI 没有代价。

所以未来的剧本,大概率并非“AI 学会了世界观”,而是“人替 AI 承担世界观的代价”。

这个角色,便是设计师。

这也让我重新理解了设计师的定位。

过去的设计师,很多时候是视觉执行者。

未来的设计师,更像是:

审美导演。规则建模者。视觉系统设计者。AI 行为边界的定义者。某种意义上的世界观架构师。

他不仅是告知 AI“生成什么”。

而是告知 AI:

在何种世界里生成。依据何种价值判断生成。为了何种情绪生成。在哪些边界内生成。以及,何物不应被生成。

AI 正让生成变得愈发廉价。

但判断何物值得生成,正变得愈发昂贵。

AI 可生成无数种未来。

但人真正要做的,或许是像奇异博士一般,在无数种可能性中,看见那条真正能走下去的路径。

并非因为人比 AI 更快。

而是因为人仍需负责判断:

我们要将 AI 带向哪个世界。

最后留给你三个问题。

若你也在用 AI 做视觉,下一次出图前,试着先回答:

这张图是为谁服务的?

这张图必须没有什么?

这张图若只能保留一件事,是什么?

这三个问题若不解决,提示词再准,也只是更精致的随机。

注:本文所有配图均为 AI 生成,仅用于演示背景工程方法论,

不代表任何真实品牌的视觉。