AI 不缺生成力,缺的是世界观
在 AI 时代,设计师究竟还能掌控什么?
起初,我猜想答案是“工具”。
谁掌握的工具越多,谁的速度就越快。
后来发觉并非如此。
工具会日益增多,也会愈发简便。今日这个模型强大,明日那个模型更强。若设计师仅是追逐工具,便永远会被新工具所左右。
随后我又觉得,答案是“提示词”。
谁能写出更精准的提示词,谁就能获得更佳的成果。
但深究下去,提示词也不过是表象。
因为核心的问题并非:
“我如何让 AI 生成一张图?”
而是:
“我如何让 AI 持续产出符合我预期的结果?”
这两者截然不同。
如今许多 AI 生成内容最大的短板,并非不够精美。
恰恰相反,它太容易达到精致了。
光影炫目,质感饱满,细节丰富,完成度极高。
但你看久了便会察觉:
许多画面缺乏真正的判断力。
它会把所有元素都填满。它不懂得何处应当克制。不晓得什么该舍弃。不明白为何留白比堆砌元素更高级。不了解某些品牌为何不能过于喧闹。也不清楚一个画面究竟该服务于何种情绪。
AI 懂得生成,但它未必知晓何物值得被生成。
这也是我近来愈发强烈的感触:
未来稀缺的并非生成能力,而是判断能力。
我如今构建工作流、设计系统、控制层,其实都在做同一件事:
将 AI 从“随机生成器”转变为“可控生产系统”。
工作流是在把控过程。设计系统是在约束规则。提示词结构是在规范表达。视觉规则建模是在主导判断。控制层是在界定 AI 的行为边界。
但控制并非是向 AI 下达绝对指令。
AI 不同于传统软件,它更像是一个概率系统。
所以我们真正能做的,是提升优质结果出现的概率,降低错误结果出现的概率,将其随机性收窄在一个相对稳定的区间内。
这便是控制。
并非让 AI 唯命是从,而是让 AI 逐步融入你的审美体系。
但最近我又意识到,控制仍非终点。
更深的一层,在于世界观。
若仅给 AI 规则,它能学会“如何做”。
但若不赋予它世界观,它便难以理解“为何这样做”。
这便是许多 AI 图看似精美,却缺乏灵魂的缘由。
因为它仅有风格,而无立场。只有形式,而无价值观。只有符号,而无文化底蕴。只有结果,而无取舍逻辑。
我曾做过一项测试。
同样让 AI 生成一张咖啡的产品图,仅更换“我赋予它的世界”。
第一张:不提供任何背景。
提示词大致是:a cup of coffee, product photography, high quality。
生成的图很漂亮。光线打得专业,木桌、绿植、拉花、自然光斑,完成度极高。
但你看完只会说一句:“嗯,一杯咖啡。”
它不属于任何人。
第二张:我赋予它一个“克制者”的世界观。
我不告知 AI 这是哪个品牌,仅告知它:
立场:该品牌反对喧哗,信奉“少即是多”,将饮品视为器物而非商品。
情绪:静谧、近乎宗教感、不允许出现温暖讨好的氛围。
必须没有:暖色光、笑脸、蒸汽特写、可爱字体、装饰性元素。
必须有:大面积负空间、冷调中性色、近乎实验室或药剂师气质的容器。
生成的图——咖啡宛如一件被供奉的器物,而非饮品。
它甚至有点不像在售卖咖啡。但你会记住它。
第三张:我赋予它一个“都市节奏者”的世界观。
同样不提及品牌,仅告知它:
立场:该品牌坚信“咖啡是一种生活速度”,反对慢悠悠的“咖啡仪式感”。
情绪:紧凑、清醒、属于早晨八点的城市。
必须没有:陶瓷杯、田园背景、过分讲究的摆盘、温吞的暖光。
必须有:玻璃杯、人手介入(拿、递、走)、街道或柜台元素、一种“在路上”的状态。
生成的图——咖啡化作了一种生活节奏,而非一杯饮品。
三张图,同一个 AI,同一个底层模型。
差别不在于提示词写得有多好,而在于我赋予它的世界不同。
而你大概也已经辨认出来了——
第二张的逻辑,接近伊索。第三张的逻辑,接近 Manner。第一张,是大多数尚未建立世界观的“AI 生成图”——它最像谁?
它最像被 AI 平均化后的星巴克。
并非因为它差,而是因为它没有立场,所以它会自动滑向所有人都熟知的那个最大公约数。
顺带一提,在运行这组实验时我发现了一件趣事:
第一张图,我未提任何要求——仅写了“a cup of coffee, product photography”。
但 AI 自行添加了:温暖的窗光、木桌、玻璃花瓶、绿植、精致的拉花。
这些无一是我要求的。
这意味着什么?
AI 并非“没有审美”——它有,只是其审美源自所有人都拍过的、Pinterest 上出现频率最高的那种“咖啡店日常”。
所以“无世界观”其实是个错觉。
当你未给 AI 注入立场时,它并非“中性”的——它会自动滑向数据中最常见的审美,即被无数普通用户共同塑造的、温暖的、安全的、无人反对的“平均美感”。
这才是真正的问题:
没有世界观的 AI,并非没有立场,而是被默认安装了一个最平庸的立场。
真正高级的视觉,不仅是风格问题,更是世界观问题。
为何苹果的视觉不会像淘宝?
并非因为它使用了某种字体、某种留白、某种灰白色。
而是因为它背后有一套完整的价值判断:
克制、秩序、静谧、人性化科技、情绪降噪。
这些并非单一风格,而是一套世界观。
若 AI 仅学到“苹果风”,它只能模仿表面。但若 AI 理解了“为何苹果要这样表达”,它才有可能持续产出接近那个气质的结果。
所以我愈发觉得,未来真正重要的并非撰写提示词,而是进行背景工程。
即为 AI 建立上下文。
但这个“上下文”并非一句话能讲清——我在做项目的过程中,慢慢将其拆解为四层:
第一层:立场该品牌信奉什么、反对什么。伊索反对喧哗,苹果反对繁复,无印良品反对“被设计感”。立场决定了所有后续判断的方向。
第二层:情绪它要让人感受到何种温度。是被尊重,还是被点燃?是静谧,还是兴奋?情绪是世界观与视觉之间的翻译层。
第三层:取舍什么必须有,什么必须没有。这一层最关键,也最易被忽略。“必须没有”比“必须有”更能定义一个品牌。
第四层:表达落实到具体的视觉规则——字体、色彩、构图、材质、光线。这一层便是过去所说的“设计系统”。
过去我们构建设计系统,基本只做到第四层。
在 AI 时代,若不补上前三层,AI 便永远在第四层做表面功夫。
或许有人会问:
AI 模型一直在变强,今日它学不会世界观,明日呢?
我的回答是:
AI 能学会“风格的世界观”,但学不会“立场的世界观”。
因为风格可从数据中归纳——见过足够多的克制图,它便能复刻克制的模样。
但立场源于取舍,而取舍需由主体来承担后果。
一个品牌之所以“克制”,并非因为它见过许多克制的图,而是因为其创始人、用户、市场地位,迫使它必须克制——多说一句话便会失去某一类人,多放一个元素便会显得廉价。
这是一个有代价的选择。
而 AI 没有代价。
所以未来的剧本,大概率并非“AI 学会了世界观”,而是“人替 AI 承担世界观的代价”。
这个角色,便是设计师。
这也让我重新理解了设计师的定位。
过去的设计师,很多时候是视觉执行者。
未来的设计师,更像是:
审美导演。规则建模者。视觉系统设计者。AI 行为边界的定义者。某种意义上的世界观架构师。
他不仅是告知 AI“生成什么”。
而是告知 AI:
在何种世界里生成。依据何种价值判断生成。为了何种情绪生成。在哪些边界内生成。以及,何物不应被生成。
AI 正让生成变得愈发廉价。
但判断何物值得生成,正变得愈发昂贵。
AI 可生成无数种未来。
但人真正要做的,或许是像奇异博士一般,在无数种可能性中,看见那条真正能走下去的路径。
并非因为人比 AI 更快。
而是因为人仍需负责判断:
我们要将 AI 带向哪个世界。
最后留给你三个问题。
若你也在用 AI 做视觉,下一次出图前,试着先回答:
这张图是为谁服务的?
这张图必须没有什么?
这张图若只能保留一件事,是什么?
这三个问题若不解决,提示词再准,也只是更精致的随机。
注:本文所有配图均为 AI 生成,仅用于演示背景工程方法论,
不代表任何真实品牌的视觉。