赵小丁说“人”的底层：AI拿不走、学不会

发布时间：2026-05-06 00:41阅读：19

此刻，AI浪潮正以势不可挡的力量向全球推进。影视领域作为文化与技术交汇的前沿地带，也正处在这场变革的深度重塑之中，因而成为业内外持续讨论的焦点。

“AI教父”辛顿在2024年提出警示：人工智能可能在未来三十年内引发人类灭绝，风险最高可达20%。然而“AI教母”李飞飞则持相反看法，她认为AI缺少人类那种突破性的创造力与抽象思维，未来路径必须以人类为核心。她强调，“AI本质上是工具，工具天然是双刃剑。我们对工具的期待从不包含让它替我们自行行动，这份责任始终属于人类。”同时，北师大张清华教授也指出：“即便AI未来能够把人类创作近乎完全模拟出来，作品也因为缺少‘生命一次性’的体验而难以真正成立。人类文化的意义始终扎根于人的主体性，文明的积累，恰是无数个体凭借各自独一无二的人生历程完成的那一次性创作。导演斯皮尔伯格同样态度鲜明：AI不该取代那些承担叙事任务、进行艺术表达的创作者。”

总体而言，行业内部交织着两种声音：一边有人为“AI一人就能拍电影”而欢呼，另一边也有人担心“电影人会因此失业”。对每一位电影从业者来说，他们既期待技术带来的革新，又对行业走向产生难以消散的迷惘。

不可否认，AI确实会改写当下乃至未来的影视形态。我始终相信，AI只是基于既有技术路线的革命性升级与优化，它是工具而不是替代者，是增效器而非颠覆者。被AI加持后的影视艺术，最终依旧要落到“人”这一核心——落到那些拥有艺术思维与创新精神的艺术家身上。需要留意的是：对愿意敞开胸怀拥抱AI的艺术家而言，AI可能成为创作的助推器，让光影更具光彩；而对难以接纳AI的人来说，创作空间或将被逐渐压缩，最终只能成为时代的旁观者。

接下来，我将从三个方面，和诸位共同讨论AI与影视行业如何走向共生。

首先，AI的本质属性是“工具”。这与影视行业发展史上每一次技术迭代所体现的方向完全一致：从胶片摄影机到数字摄影机，从手动对焦到AI辅助对焦——每一次更新，本质上都是让创作者获得更先进的“笔”、更高效的“颜料”、更精准的“尺”。这类能够充当笔、颜料与尺的工具，正在为艺术创作与影像生成带来更显著的效率提升，并在电影制作的基础环节中被广泛使用，形成更高效的制作产出：

高效生成场景概念图。过去需要摄影师、美术师熬夜投入数日才能做出的成果，AI可以在几分钟内完成初版迭代，从而显著压缩前期筹备周期。

自动修复影像瑕疵。以往后期里逐帧擦除威亚、修正穿帮等繁琐操作，如今可通过AI实现自动化处理，进而大幅降低人工成本。

高效管理与处理海量数字资产。从剧本策划、定稿梳理到拍摄反馈的修改，AI能够更快检索数据库、理顺文本逻辑，并依据剧本文字生成拍摄前的虚拟预览，从而压缩剧本落地的周期。

提升制作效率。早期实体搭景阶段里，场景几乎等同于实景，修改往往就意味着推倒重来，整个制作周期更可能以“年”为计时单位。随着数字技术普及，“后期工作前置”成为第一次效能革命：预可视化（Previs）让导演在开机前就能看到整部电影的动态分镜；技术预览（Techvis）则把虚拟镜头与真实拍摄设备进行匹配模拟，让问题在虚拟环境中提前被解决，而不是在现场手忙脚乱。

随后，实时抠像让绿幕拍摄能做到“所见即所得”，但发丝边缘的擦除、绿色溢色的校正等环节仍需要大量人工参与。以一个十几秒的镜头为例，从三维建模、灯光匹配、质感调试到最终渲染合成，常常需要数十人团队耗费两周左右的时间。

紧接着出现的虚拟拍摄（LED巨幕+实时渲染引擎），把镜头内视效（ICVFX）真正落在“现场一次性合成”。也就是说，场景的光影、反射与透视关系在现场被同步完成，传统绿幕抠像由此可以告别。当然，这也对现场布光和虚拟场景的光影匹配、物理透视匹配提出了更高要求。但好处在于：演员不再需要对着绿色幕布去做“信念感表演”，他们可以直接看到更接近真实的场景，比如雪山的凛冽、宫殿的恢弘、仙境的奇异。这样的“虚拟真实”会更容易激发演员的情绪反应。同时，导演在监视器里看到的就是最终成片效果，不必再依赖“脑补”或“后期再说”。

接下来，当AI深度介入时，传统影视的生产路径会不断被推翻。它会把从物理介质到数据流程的方式进行系统性重构，大幅压缩时间与经济成本，从而带来近乎指数级的效能跃迁：

过去拍摄传统战争片的大场面，需要提前埋设炸点、布置线缆，并反复校验安全边界，整体准备工作量非常庞大，通常要花2到3天。如今借助AI介入后的Previs预可视化，半小时就能预览炸点效果并对布置方案进行优化。更进一步的是，AI甚至已经具备在大型战争场景中实现背景层自动化合成的能力：只要提供一张气氛图，再结合真人实拍前景表演，模型推理即可实时生成包含烟火、爆炸、弹道轨迹等复杂视效元素的动态战争画面。

从AI辅助下的绿幕抠像，到面向任意实拍场景的“无绿幕”智能分割与擦除，AI能够把传统流程中需要数十人耗时两周的十几秒复杂镜头，压缩到五六人一天内就能交付。这意味着原本繁重的物理模拟与解算步骤被显著简化，渲染等待以及跨环节协同带来的时间成本也被大幅削减，整体制作效率因此呈现指数级上升。在虚拟拍摄（VP）现场，AI还能实时增强画面、智能优化布光；而AI驱动的后期自动化——智能剪辑、自动调色匹配、智能音频处理——也在进一步把创作者从重复劳动中解放出来。

对比一下：从卡梅隆拍摄《阿凡达》系列那种耗时二十年的长周期创作，到AI技术赋能下同类高品质影像的创作周期明显缩短；从《流浪地球》剧组可能动辄千余人、投入一年以上的高成本拍摄，到未来在AI辅助下由小型团队完成高水准作品。AI并不是“颠覆一切的新神”，而是提升创作效能、重构影视生产模式的前沿“利器”，持续实现“减员、提效、降本、提质”的多重价值。

如今的影视制作，正在从实体搭景的“人海战术”迈向AI赋能后的“人机协同”效率跃迁；逐步完成从“纯人力”到“自动化”再到“智能化”的深层效能革命。

当然，当前AI技术仍有清晰的短板。AI并不具备自主意识，它本质上是依靠海量数据训练而成的一套概率运算模型。当面对训练集中覆盖不够充分的“难题”——比如非标的镜头语言、非常规的情绪表达，或未被标注的物理交互——AI往往难以给出逻辑自洽的推断。它能够在已知答案范围内高效执行，却无法像人类创作者那样凭借直觉与共情做出举一反三的判断。

例如在技术层面，现有模型虽能拟合外观，却难以真正复刻物理真实与人性深度。从物理层面看，AI生成的爆炸、流体等影像有时会违背动量守恒与碰撞规律，缺少对真实世界因果链条的理解。就表演层面而言，AI演员很难传递细腻的微表情，也难以形成连贯的情绪推进；更难在与真人对戏时激发灵感与创作共振。其“制式化情感输出”在与真人同框时，往往会带来明显的视觉割裂。

此外，角色在多镜头间的一致性漂移、生成分辨率难以对标影院级标准，以及版权与肖像权仍存在的法律灰区，再加上平台对AI内容不断趋严的审核政策，都在不同程度上限制着AI直接进入核心影视制作流程。而更深层的问题在于：工具迭代速度远快于行业的消化与适配能力——团队刚把工作流磨合成熟，模型升级就可能让旧流程失效；同时算力资源的不稳定也会进一步提高交付风险。

因此，从适配性角度看，当前AI更适合承担预演辅助、背景生成（可替代部分传统绿幕抠像）等“非表演性、高重复性”的环节。至于涉及情感传递、物理真实与审美把控的关键创作部分，仍必须牢牢由人类创作者掌握。

AI生成影像的关键逻辑，是基于百年来的摄影美学、亿万级影像数据，以及一代代电影人的光影经验。它依靠大数据学习、碎片化拼接与概率式输出，来对既有视觉语言进行模仿与复刻。

每一套AI大模型背后，都离不开庞大的数字资产库。AI能够按指令生成影像，根源在于对这套数字资产库的系统化训练，以及可编程算力的大规模支撑。不过，有个容易被忽视的事实是：用于AI训练的可编程数字算力，与那些海量影像数据的数字化存储，本身同样是数字技术革命的产物。

数字技术让影像的获取、存储与传播效率在胶片时代之后实现了质的跃升；而生成式人工智能的兴起，则站在数字技术的基础之上，把效能革命推向更彻底的层面。

数字技术在社会层面的革命性意义，可与电与计算机的发明相提并论。影像里光、声、色等元素极其复杂，正因为数字技术让影像的记录与存储摆脱了胶片时代的高昂成本与物理限制，海量资料才得以高效保存、加工，并被转化为可用于机器学习的结构化数据。可以说，没有数字技术，就没有AI大模型运行所需的数据底座，也就谈不上今天按指令生成影像的人工智能。

自1895年世界电影诞生、1905年中国电影起步以来，一百三十余年的影视发展历程，本质上就是一部不断迭代的技术史。从黑白到彩色，从无声到有声，从胶片到数字，每一次媒介跃迁都会带来制作体系的阵痛，但行业总能通过流程重构与人才转型快速适配。然而AI突然出现，正在把这种阵痛的烈度与持续周期推到前所未有的高度，甚至诱发“创作者会被替代”的深层焦虑。客观来看，AI仍只是影视工业这条技术迭代链条中的最新一环，它依赖数字时代的影像资产，目标依旧是“赋能与提效”而非“消灭与替代”真人影像制作。

当然，基于数字资产的AI技术同样面临天然的版权难题。当前相关法律相对滞后，AI对前人版权资产的碎片式重组与模仿，在某种程度上可被视作“碎片式侵权”。因此，如何在技术效率与权利保护之间建立更合理的平衡，依旧是行业急需回答的课题。

AI永远无法替代核心艺术家，本质原因在于其“无灵魂、无情感、无原创、无感受力”的局限。因为影像的质感、审美层次与艺术价值的呈现，始终无法脱离艺术家的深度参与与主体性判断，而这恰恰正是影视艺术的核心。

（一）在艺术领域，AI依赖人类（艺术家）的高质量指令与方向引导

AI确实能改变工作流程、提升生产效率，但它无法改变电影的艺术本质：人对世界的观察、对情感的表达、对美的创造。AI不会自主决定光影冷暖，不会真正共情故事情绪，也不会凭空产生原创表达，更难形成独立的审美判断与价值取向。它可以模拟影像生成，但却没有人类那种“感受力”与“原创力”，无法复刻艺术创作中最核心的情感共鸣与价值表达。

我们都知道，影视创作中“一千个摄影师有一千种光影”。同样一场夜戏，有人更爱用高反差去强化戏剧张力，也有人选择柔光来营造朦胧诗意。这类审美选择来自创作者的专业训练、人生阅历、情感认知与世界观——这些主观判断并不是AI能够真正复制的。

AI所谓的“才华”，并不源自自身的艺术自觉，而是来自对人类影像作品的系统性学习与海量数据喂养。通过持续训练，AI会不断迭代参数与生成能力，逐步构建起庞大的数字资产参照系。因此它的生成逻辑决定了它所谓的“创作”更多是对前人成果的拼合与集成，而缺少真正的主观创作意识。它的每一次输出，都需要依附于光、色、明暗关系、构图与叙事等影视创作底层语法，更依赖那些非算力所能凭空发明的前人艺术家的审美沉淀与创作积累。

即便AI能一键生成影像内容，它的质量评判标准（动画类作品除外）仍通常以“尽可能接近高质量实拍”为唯一衡量尺度。而实拍之所以关键，恰恰在于人类（艺术家）的创新与取舍。AI更像是一台高性能渲染器——渲染什么、如何渲染，始终需要人类（艺术家）给出清晰指令与方向；影像的景别、角度、镜头运动以及视听语言的组合，同样依赖核心艺术家的判断与操作。

因此我认为，未来影视行业将出现两类关键人才：第一类是“专家型创作者”——具备深厚电影专业素养并同时拥有AI工程化思维的导演、摄影、美术等。AI生成内容越多，这类专家对指令精度、审美判断与品控能力的要求也反而会更高。行业的核心原创力仍会牢牢掌握在拥有专业底蕴与艺术追求的人手中；第二类是“AI技术专才”——聚焦模型训练、工作流搭建的理工科人才。而介于两者之间、偏纯执行的岗位，比如前期的大规模人工搭景、大量群演，以及群演群众调度，后期的擦除、合成、建模等高度重复性劳动，将逐步被AI所替代。行业人才结构也会朝“高创意、高审美、高专业”的方向持续升级。

（二）AI解放双手，让高端审美与创意更加稀缺。

不少人说，“普通人用AI也能制作大片”。我认为这句话同时误解了AI与影视创作。普通人借助AI做短视频、满足娱乐需求当然无可厚非，但能经得起院线级检验、在大银幕上呈现并打动人心的高品质光影表达，以及具有穿透力的视听语言，依然离不开专业创作者扎实的技术底座、深厚的审美品味、崇高的艺术良知与极致的追求。

影视出品人、制片人郑林曾在其文章《当造梦成本归零｜影视行业的未来五年》中写道：“AI带来的，是创作平权，不是创意平权。任何人都能生成一段精美画面，但‘精美’因此失去了原本的定价权。当所有人都能一键生成电影级画面，精美就变成了新的零点。”这段话准确揭示了AI时代的行业逻辑：AI可以很快达到七十五分的及格水平，但从七十五分迈向一百分、从“精美画面”到“有灵魂的作品”，关键仍在于创作者的技术实力与审美品味。AI可以是更先进的画笔，而作品的水准，始终取决于执笔人的能力。

当然，在这个观点基础上，我也想补充一个前提：AI所带来的创作平权，只适用于普通人记录美好生活这一类层面的创作平权。除非AI未来真的能让审美差异消失，否则艺术创作永远难以实现真正意义上的平权，因为在更高层级的艺术创作里，不同艺术家都会拥有各自不可被质疑的主导权与独特审美判断。

郑林在2026年4月26日发布的最新文章《叙事3.0:回到第一帧》中也多次提到：“钱可以买来规模，买不来审美聚焦”，“把电影的所有约束剥掉，剩下的只有一件事：一个人替另一个人用画面、声音和叙事做了审美判断”，“AI拿走的是重活，不是判断”，“创作者手里最后剩下的是审美判断”。

所以，高品质的艺术作品仍

← 上一篇：AI新阶段：紧握＂制约AI发展＂的命脉下一篇：AI应用测试：与传统测试的关键不同 →