新手速上手：AI视频从提示词到剪辑

发布时间：2026-04-28 20:59阅读：41

先把重点记牢。

整体流程可以一句话概括：优化文字→写图片提示词→生成图片→再生成视频提示词→生成视频→最后剪辑优化。

整个过程都围绕豆包来做，免去开通会员，也不用折腾复杂软件或任何专业技巧，按步骤来就行。

下面我们把工作流程拆开讲清楚：

核心要求：围绕分镜来组织内容，保证每一个分镜头都对应一段文字，并且每句话都能落到一个明确、独立的画面里。比如，“小人在厨房忙碌”是一镜，“他端出一盘糖醋排骨”又是另一镜。

文字表达保持朴实简洁就好，不要堆太多修饰词，也别做抒情描写，只要把“主体+动作+场景”说清楚就能减少AI理解偏差。比如别写“可爱的小人开心地准备糖醋排骨食材”，直接写“小人准备糖醋排骨食材”。

具体做法：先把你准备的原始文字整理好，按分镜头把段落拆开，每段对应一个镜头画面，并把它标记出来（方便后续生成提示词对上）。如下图所示。

#身份：你是一位知名动画电影导演。

#技能：你擅长卡通动画脚本的撰写，并且对AI绘画提示词生成有丰富经验。

#要求：收到我提供的分镜文字素材后，生成对应的图片提示词；输出语言为中文。每个分镜头文字要生成一条图片提示词，提示词要覆盖【主体+动作+场景+风格+镜头+负面提示+生成效果】，并且每条提示词末尾都必须补充“中国古代漫画风格”。另外，所有分镜的提示词需要保证人物与物品的一致性，表达要简单好读，不使用复杂描述、形容词堆叠或抒情内容；最终只输出文生图提示词，不要附加多余内容。

#补充要求：多彩卡通风格，8K品质，画幅16:9，细节丰富，光线自然。

小技巧：同一段分镜文字可以同时发给豆包、元宝、deepseek等AI工具，对比它们生成的提示词，多方取长再微调，最后定稿。

示例：

你给的文案：一个小女孩，提着大红礼盒，开心地走在去姥姥家的巷口。

豆包生成的提示词：一个小女孩，手提红色中式礼盒，行走在贴有春联的巷口，开心笑，春节氛围，皮克斯动画风格，中国古代漫画风格，多彩卡通风格，8K品质，16:9，细节丰富，光线自然。

如下图所示

操作：把上一步确认好的图片提示词，按分镜头“一条一条”发给豆包，避免一次性混着多个提示词，减少AI跑偏。

优化：图片出来后如果不够理想（例如主体不够清晰、风格偏离），就回到第二步重写提示词。重点从主体、风格或场景描述入手，再生成一次，直到你满意为止，最终确定“图片+对应提示词”。

操作：当第三步的图片提示词都确定后，再逐条发给豆包，同时把下面要求一起带上，就能生成对应的视频提示词。

根据你提供的图片提示词，生成分镜视频提示词：每个分镜头对应一条视频提示词。提示词只需要用简洁语言说明【摄像机位、肢体动作、运镜要求】，每个镜头时长5秒，保证高清且不出现模糊；同时要贴合图片风格，并维持画面前后衔接。

如下图所示。

操作：将第四步生成的视频提示词与第三步确认的图片配对，一起发给豆包，等待生成视频即可。

亮点：豆包新模型（Seedance 2.0已接入豆包）生成的视频运镜更成熟、画面更细腻，而且还能自动适配配乐，省去你再去单独找音乐的时间。

拼接：按顺序把各个片段排列好。加字幕：把文案整理成字幕，结合字幕字数和视频时长做微调，通常可以按5个字每秒来估算。AI配音：根据字幕加入AI配音。调色加滤镜：统一整段画面的色调，让整体更有质感。导出：选高清分辨率导出。

做AI视频就像当导演。最难的其实是你和AI之间的沟通，也就是提示词的写法；另外还有个人审美能力。但我建议一开始别过度追求创新，先简单模仿、照着做也完全可以。而且AI迭代很快，它更新速度往往超过我们的学习节奏，所以就大胆去玩、去拥抱AI时代吧！

← 上一篇：华为蒲公英人才计划启动，数智国际助力解锁AI职业新机遇下一篇：AI重构领导力管理系统：实战36工具 →