AI 不缺生成力，缺的是世界观

发布时间：2026-05-09 14:14阅读：32

在 AI 时代，设计师究竟还能掌控什么？

起初，我猜想答案是“工具”。

谁掌握的工具越多，谁的速度就越快。

后来发觉并非如此。

工具会日益增多，也会愈发简便。今日这个模型强大，明日那个模型更强。若设计师仅是追逐工具，便永远会被新工具所左右。

随后我又觉得，答案是“提示词”。

谁能写出更精准的提示词，谁就能获得更佳的成果。

但深究下去，提示词也不过是表象。

因为核心的问题并非：

“我如何让 AI 生成一张图？”

而是：

“我如何让 AI 持续产出符合我预期的结果？”

这两者截然不同。

如今许多 AI 生成内容最大的短板，并非不够精美。

恰恰相反，它太容易达到精致了。

光影炫目，质感饱满，细节丰富，完成度极高。

但你看久了便会察觉：

许多画面缺乏真正的判断力。

它会把所有元素都填满。它不懂得何处应当克制。不晓得什么该舍弃。不明白为何留白比堆砌元素更高级。不了解某些品牌为何不能过于喧闹。也不清楚一个画面究竟该服务于何种情绪。

AI 懂得生成，但它未必知晓何物值得被生成。

这也是我近来愈发强烈的感触：

未来稀缺的并非生成能力，而是判断能力。

我如今构建工作流、设计系统、控制层，其实都在做同一件事：

将 AI 从“随机生成器”转变为“可控生产系统”。

工作流是在把控过程。设计系统是在约束规则。提示词结构是在规范表达。视觉规则建模是在主导判断。控制层是在界定 AI 的行为边界。

但控制并非是向 AI 下达绝对指令。

AI 不同于传统软件，它更像是一个概率系统。

所以我们真正能做的，是提升优质结果出现的概率，降低错误结果出现的概率，将其随机性收窄在一个相对稳定的区间内。

这便是控制。

并非让 AI 唯命是从，而是让 AI 逐步融入你的审美体系。

但最近我又意识到，控制仍非终点。

更深的一层，在于世界观。

若仅给 AI 规则，它能学会“如何做”。

但若不赋予它世界观，它便难以理解“为何这样做”。

这便是许多 AI 图看似精美，却缺乏灵魂的缘由。

因为它仅有风格，而无立场。只有形式，而无价值观。只有符号，而无文化底蕴。只有结果，而无取舍逻辑。

我曾做过一项测试。

同样让 AI 生成一张咖啡的产品图，仅更换“我赋予它的世界”。

第一张：不提供任何背景。

提示词大致是：a cup of coffee, product photography, high quality。

生成的图很漂亮。光线打得专业，木桌、绿植、拉花、自然光斑，完成度极高。

但你看完只会说一句：“嗯，一杯咖啡。”

它不属于任何人。

第二张：我赋予它一个“克制者”的世界观。

我不告知 AI 这是哪个品牌，仅告知它：

立场：该品牌反对喧哗，信奉“少即是多”，将饮品视为器物而非商品。

情绪：静谧、近乎宗教感、不允许出现温暖讨好的氛围。

必须没有：暖色光、笑脸、蒸汽特写、可爱字体、装饰性元素。

必须有：大面积负空间、冷调中性色、近乎实验室或药剂师气质的容器。

生成的图——咖啡宛如一件被供奉的器物，而非饮品。

它甚至有点不像在售卖咖啡。但你会记住它。

第三张：我赋予它一个“都市节奏者”的世界观。

同样不提及品牌，仅告知它：

立场：该品牌坚信“咖啡是一种生活速度”，反对慢悠悠的“咖啡仪式感”。

情绪：紧凑、清醒、属于早晨八点的城市。

必须没有：陶瓷杯、田园背景、过分讲究的摆盘、温吞的暖光。

必须有：玻璃杯、人手介入（拿、递、走）、街道或柜台元素、一种“在路上”的状态。

生成的图——咖啡化作了一种生活节奏，而非一杯饮品。

三张图，同一个 AI，同一个底层模型。

差别不在于提示词写得有多好，而在于我赋予它的世界不同。

而你大概也已经辨认出来了——

第二张的逻辑，接近伊索。第三张的逻辑，接近 Manner。第一张，是大多数尚未建立世界观的“AI 生成图”——它最像谁？

它最像被 AI 平均化后的星巴克。

并非因为它差，而是因为它没有立场，所以它会自动滑向所有人都熟知的那个最大公约数。

顺带一提，在运行这组实验时我发现了一件趣事：

第一张图，我未提任何要求——仅写了“a cup of coffee, product photography”。

但 AI 自行添加了：温暖的窗光、木桌、玻璃花瓶、绿植、精致的拉花。

这些无一是我要求的。

这意味着什么？

AI 并非“没有审美”——它有，只是其审美源自所有人都拍过的、Pinterest 上出现频率最高的那种“咖啡店日常”。

所以“无世界观”其实是个错觉。

当你未给 AI 注入立场时，它并非“中性”的——它会自动滑向数据中最常见的审美，即被无数普通用户共同塑造的、温暖的、安全的、无人反对的“平均美感”。

这才是真正的问题：

没有世界观的 AI，并非没有立场，而是被默认安装了一个最平庸的立场。

真正高级的视觉，不仅是风格问题，更是世界观问题。

为何苹果的视觉不会像淘宝？

并非因为它使用了某种字体、某种留白、某种灰白色。

而是因为它背后有一套完整的价值判断：

克制、秩序、静谧、人性化科技、情绪降噪。

这些并非单一风格，而是一套世界观。

若 AI 仅学到“苹果风”，它只能模仿表面。但若 AI 理解了“为何苹果要这样表达”，它才有可能持续产出接近那个气质的结果。

所以我愈发觉得，未来真正重要的并非撰写提示词，而是进行背景工程。

即为 AI 建立上下文。

但这个“上下文”并非一句话能讲清——我在做项目的过程中，慢慢将其拆解为四层：

第一层：立场该品牌信奉什么、反对什么。伊索反对喧哗，苹果反对繁复，无印良品反对“被设计感”。立场决定了所有后续判断的方向。

第二层：情绪它要让人感受到何种温度。是被尊重，还是被点燃？是静谧，还是兴奋？情绪是世界观与视觉之间的翻译层。

第三层：取舍什么必须有，什么必须没有。这一层最关键，也最易被忽略。“必须没有”比“必须有”更能定义一个品牌。

第四层：表达落实到具体的视觉规则——字体、色彩、构图、材质、光线。这一层便是过去所说的“设计系统”。

过去我们构建设计系统，基本只做到第四层。

在 AI 时代，若不补上前三层，AI 便永远在第四层做表面功夫。

或许有人会问：

AI 模型一直在变强，今日它学不会世界观，明日呢？

我的回答是：

AI 能学会“风格的世界观”，但学不会“立场的世界观”。

因为风格可从数据中归纳——见过足够多的克制图，它便能复刻克制的模样。

但立场源于取舍，而取舍需由主体来承担后果。

一个品牌之所以“克制”，并非因为它见过许多克制的图，而是因为其创始人、用户、市场地位，迫使它必须克制——多说一句话便会失去某一类人，多放一个元素便会显得廉价。

这是一个有代价的选择。

而 AI 没有代价。

所以未来的剧本，大概率并非“AI 学会了世界观”，而是“人替 AI 承担世界观的代价”。

这个角色，便是设计师。

这也让我重新理解了设计师的定位。

过去的设计师，很多时候是视觉执行者。

未来的设计师，更像是：

审美导演。规则建模者。视觉系统设计者。AI 行为边界的定义者。某种意义上的世界观架构师。

他不仅是告知 AI“生成什么”。

而是告知 AI：

在何种世界里生成。依据何种价值判断生成。为了何种情绪生成。在哪些边界内生成。以及，何物不应被生成。

AI 正让生成变得愈发廉价。

但判断何物值得生成，正变得愈发昂贵。

AI 可生成无数种未来。

但人真正要做的，或许是像奇异博士一般，在无数种可能性中，看见那条真正能走下去的路径。

并非因为人比 AI 更快。

而是因为人仍需负责判断：

我们要将 AI 带向哪个世界。

最后留给你三个问题。

若你也在用 AI 做视觉，下一次出图前，试着先回答：

这张图是为谁服务的？

这张图必须没有什么？

这张图若只能保留一件事，是什么？

这三个问题若不解决，提示词再准，也只是更精致的随机。

注：本文所有配图均为 AI 生成，仅用于演示背景工程方法论，

不代表任何真实品牌的视觉。

← 上一篇：AI黑科技惊艳！网图秒变高级写真，细节美到窒息下一篇：新款带摄像功能的AirPods Pro研发接近完成即将进入量产阶段 →