标签

新手速上手:AI视频从提示词到剪辑

发布时间:2026-04-28 20:59来源:微信阅读:6

先把重点记牢。

整体流程可以一句话概括:优化文字→写图片提示词→生成图片→再生成视频提示词→生成视频→最后剪辑优化。

整个过程都围绕豆包来做,免去开通会员,也不用折腾复杂软件或任何专业技巧,按步骤来就行。

下面我们把工作流程拆开讲清楚:

核心要求:围绕分镜来组织内容,保证每一个分镜头都对应一段文字,并且每句话都能落到一个明确、独立的画面里。比如,“小人在厨房忙碌”是一镜,“他端出一盘糖醋排骨”又是另一镜。

文字表达保持朴实简洁就好,不要堆太多修饰词,也别做抒情描写,只要把“主体+动作+场景”说清楚就能减少AI理解偏差。比如别写“可爱的小人开心地准备糖醋排骨食材”,直接写“小人准备糖醋排骨食材”。

具体做法:先把你准备的原始文字整理好,按分镜头把段落拆开,每段对应一个镜头画面,并把它标记出来(方便后续生成提示词对上)。如下图所示。

#身份:你是一位知名动画电影导演。

#技能:你擅长卡通动画脚本的撰写,并且对AI绘画提示词生成有丰富经验。

#要求:收到我提供的分镜文字素材后,生成对应的图片提示词;输出语言为中文。每个分镜头文字要生成一条图片提示词,提示词要覆盖【主体+动作+场景+风格+镜头+负面提示+生成效果】,并且每条提示词末尾都必须补充“中国古代漫画风格”。另外,所有分镜的提示词需要保证人物与物品的一致性,表达要简单好读,不使用复杂描述、形容词堆叠或抒情内容;最终只输出文生图提示词,不要附加多余内容。

#补充要求:多彩卡通风格,8K品质,画幅16:9,细节丰富,光线自然。

小技巧:同一段分镜文字可以同时发给豆包、元宝、deepseek等AI工具,对比它们生成的提示词,多方取长再微调,最后定稿。

示例:

你给的文案:一个小女孩,提着大红礼盒,开心地走在去姥姥家的巷口。

豆包生成的提示词:一个小女孩,手提红色中式礼盒,行走在贴有春联的巷口,开心笑,春节氛围,皮克斯动画风格,中国古代漫画风格,多彩卡通风格,8K品质,16:9,细节丰富,光线自然。

如下图所示

操作:把上一步确认好的图片提示词,按分镜头“一条一条”发给豆包,避免一次性混着多个提示词,减少AI跑偏。

优化:图片出来后如果不够理想(例如主体不够清晰、风格偏离),就回到第二步重写提示词。重点从主体、风格或场景描述入手,再生成一次,直到你满意为止,最终确定“图片+对应提示词”。

操作:当第三步的图片提示词都确定后,再逐条发给豆包,同时把下面要求一起带上,就能生成对应的视频提示词。

根据你提供的图片提示词,生成分镜视频提示词:每个分镜头对应一条视频提示词。提示词只需要用简洁语言说明【摄像机位、肢体动作、运镜要求】,每个镜头时长5秒,保证高清且不出现模糊;同时要贴合图片风格,并维持画面前后衔接。

如下图所示。

操作:将第四步生成的视频提示词与第三步确认的图片配对,一起发给豆包,等待生成视频即可。

亮点:豆包新模型(Seedance 2.0已接入豆包)生成的视频运镜更成熟、画面更细腻,而且还能自动适配配乐,省去你再去单独找音乐的时间。

拼接:按顺序把各个片段排列好。加字幕:把文案整理成字幕,结合字幕字数和视频时长做微调,通常可以按5个字每秒来估算。AI配音:根据字幕加入AI配音。调色加滤镜:统一整段画面的色调,让整体更有质感。导出:选高清分辨率导出。

做AI视频就像当导演。最难的其实是你和AI之间的沟通,也就是提示词的写法;另外还有个人审美能力。但我建议一开始别过度追求创新,先简单模仿、照着做也完全可以。而且AI迭代很快,它更新速度往往超过我们的学习节奏,所以就大胆去玩、去拥抱AI时代吧!