前言

大家学习 AI 视频也有一段时间了。

但是，不少小伙伴都感觉到，同样是 AI 视频，为什么觉得别人做得特别好，而自己做的显得很普通。

首先，我们需要明确一点，我们制作 AI 视频，其实更多的是视听语言，该怎么理解呢？

视觉便是我们看到的画面，所以画面的构成就很重要，如何让画面更贴合主题，这个是我们努力的方向，后面我也会讲如何优化。

而听觉则是我们听到的声音，同时也是更好的融入主角的场景中非常重要的一点，就像一些恐怖片，除了画面的恐怖，但是其实声音更是灵魂，就像画面展现一个破烂的寺庙，你感觉可能没什么，顶多觉得确实荒凉，有危险感。但是，一旦添加上 huhuhu~~的风声以及诡异的音调，你就会瞬间觉得害怕，下一秒出现恐怖的东西。

而在这一节中，我们更偏向于视觉的优化。

故事构造（叙事类）

信息收集

当我们制作一个剧本的时候，一开始很容易卡壳，就会觉得，无从下手。

在这个时候，其实很大的一部分原因是你收集的信息不够多。

就像之前的广州全运会 AI 视频比赛，假如你想参加，那你就必须先了解广州的资料，广州有什么特色建筑，有什么理念是区别于其它城市。

或者说，这期的全运会为什么会落在广州，而不是其它地方，这里我就不举例的，避免容易出现地域黑。

而全运会的信息也是如此，要了解清楚今年的全运会是口号是什么，有吉祥物是什么，它代表的寓意又是什么？

具体信息也可以参考官方提供的内容：https://www.gz.gov.cn/zt/qltjygadwqjsxsdzgzlfzdf/mtjj/content/post_9967250.html

当你把这些信息都收集完，你大致就会有感兴趣的点，然后你再抓住这些点跟 AI 进行沟通，从而获取更详细的内容，同时，也能确定你大致的剧本。

例如：

吉祥物头顶有三朵小水花。三个小水花代表了三个地方不同的颜色。包括广州的木棉红、香港的紫荆花的紫，以及澳门莲花的绿色。

小说与剧本的区别

首先，大家要先明确一点，AI 视频的剧本和小说是不一样的。

在小说中，更多是通过文字让你去深入了解里面的故事情节，以及人物的当前状态。因此，对于人物的感觉，或者是心理的想法是写得非常细致的，下面是我截取的《斗罗大陆》的开篇第二小节内容：

大家可以看到，从最开始的萧炎咀嚼青草，到举手又放下，再到自呢喃，再到心理的想法，都写得非常清楚。

但是，若我们真正去拍摄，很难去一比一进行复刻主角的这种体感和心理。

因此，我们在写剧本的时候，要刻意避免出现类似的情况，我们更应该去抓住主心骨，并且在设计内容的时候，更偏向于画面的展示。

例如同样是上面的内容，我们可以这样书写：

在一个漆黑的夜晚，萧炎躺在山坡上看着月亮，嘴里叼着一根青草。萤火虫在他身边环绕着，远处的树林里不断发出蝉声。

相比于小说，我们就会更在注重于整体的环境描写，以及有可能附带的声音，因为这些就是我们后续会真正转化成图片和音频的。

故事结构

三幕式

在清楚我们的剧本描述风格后，那我们如何进行构造一个故事？

其实，这里也非常简单。总结来说就是三幕式。

开始–>对抗–>结束

最近不是高考嘛，我就以这个作为一个例子。

首先，我们的主人公是一个即将高考的学生。

作为开始部分，我们就要像清楚，这个学生是男是女，是复读还是第一次考高考，ta 的学校是在一线城市还是偏远山区，家庭是富裕还是贫困。

在这些选项中，只要我们选择了其一，都会对后面的对抗和结束有着非常大的影响的。

而在对抗部分，自然就是人物发生了一些不一样的冲突，假如 ta 都是平平无奇，那观众自然不会想去看了。

因此，我们要在这里加上不一样的点。例如，ta 发现考题居然跟模拟考的题目一模一样，又例如，路上堵车了，ta 迟到赶不上考场，又例如，由于睡眠不好，ta 发挥失常了。

这些都是一些对抗点，是基于我们开始部分的发展，也可以理解为打破日常生活常规的引爆点。

而结束部分自然是开始的人物对于对抗部分是如何解决，例如 ta 克服了各种困难，赶到考场并超常发挥，获得全国第一，又例如，由于没赶上考场，错过了高考，ta 选择了回去继承家业，并成为新一代商业巨子。

代入感

当我们通过三幕式确认了故事的大致情节，剩下就是我们需要给这些框架加上血肉，而其中有一点非常重要，也就是让角色活起来！

至于如何活起来，有个非常简单的一点，那就是代入角色，你得会想象，假如你是这个角色，在身处这个环境中，同时，你又有这些性格以及历史包袱，你下一步会做什么？你是如何思考的？

就像刚刚举例的高考落选的例子，当高考不再是唯一的选项，而各种资源和信息又十分充足，那追求自我，追求爱好是不是更显得尤为重要。所以，假如我是他，我就会不断去追求 AI 视频的制作，学习各种影视知识，学习各种 AI 平台的技巧，因为沉浸在自己的爱好中，本身就是一件十分幸福的事情。

分镜

如何拆解分镜与多景别的意义

当我们拆解完分镜后，有个非常大的难点，也是很多人都困惑，我们怎么拆解分镜？

大多数人可能都是直接把画面内容 copy 一下直接发给提示词优化器，或者直接丢给可灵、或者即梦直接生成。

但是这样就出现一个非常严重的问题，也就是景别都是中景或者近景，像爆款短视频是非常明显了：

可以看到，基本每一幕都是熊猫的全身照，而为什么会出现这个原因也非常简单，因为是竖屏，展示的画面是垂直方向，自然都是全身照，多了，很容易审美疲劳。

这也就是为什么我们制作短片，基本都要使用横屏的原因。

而为了避免出现相同景别出现，因此，我们需要学会使用多个景别去描述同一个件事情。

这个是我在网上找的图：

就像一个喝水的动作，我们可以像左边一样，直接一个中景，展示完全部内容，也可以先特写瓶子，再近景描述喝水的动作，再中景把水瓶放回去。

假如你是矿泉水的品牌方，你会选哪个？

无疑一定是选右边这个，那为什么呢？除了是特写瓶子的 logo，还有非常重要的一点，那就是可以通过不同景别的切换，不断刷新人的大脑的感知，从而使得同样是喝水的事情，在不同景别的切换过程中，大脑会觉得不同画面有不同的关注点，自然就更加感兴趣的看下去！

景别的分类

远景：定格壮阔

远景就像是站在高处俯瞰，画面中的人物显得很小，但能看到广阔的环境。

比如电影开场经常会用远景展示整座城市的面貌，或者展现人物在沙漠、大海中的渺小感。

这种景别最适合用来渲染气氛，营造宏大的场面。

全景：人景合一

全景会把人物的全身和周围环境都拍进去。

这种景别特别适合拍舞蹈或武打动作，因为能完整展现人物的动作，同时又不会失去环境感。

中景：日常视角

中景拍摄范围从膝盖以上到头顶，这个视角最接近我们平时社交的距离。

拍摄对话场景时经常会用到中景，因为既能看清人物表情，又不会让画面太过压迫。

近景：情感交流

近景主要拍摄胸部以上的画面，这时候环境已经不太重要了，重点是展现人物的表情变化。

想要表达人物的心理活动，近景是个很好的选择。

特写：内心世界

特写就是只拍脸部，或者某个重要的物品细节。

当你想让观众关注人物的情感变化，比如悲伤、愤怒的瞬间，特写能让这些情绪更具冲击力。

大特写：细节致胜

大特写更极端，可能只拍一双眼睛，或是嘴角的一抹微笑。

这种景别最适合展现关键细节，比如戒指上的刻字，或是人物眼中闪烁的泪光。

视角

1. 鸟瞰视角（Bird’s-eye View）

视角特点：从高处俯瞰整个画面，视野开阔，能很好地展现场景布局和角色之间的关系。

适用场景：自然风光、大规模场景描绘、强调孤独或渺小的氛围。

Prompt 示例：

A vast golden wheat field with a small wooden house in the center, bird's-eye view, cinematic lighting, detailed landscape, ultra-realistic --ar 16:9

效果图：

关键词：bird’s-eye view, cinematic lighting, detailed landscape

2. 仰视视角（Worm’s-eye View）

视角特点：从地面往上看，给人强烈的冲击感和压迫感，用来凸显物体的威严或震撼效果。

适用场景：摩天大楼、巨型生物、未来科技的场景。

Prompt 示例：

A giant futuristic skyscraper viewed from the ground, worm's-eye view, dramatic perspective, glowing neon lights, cyberpunk theme --ar 16:9

效果图：

关键词：worm’s-eye view, dramatic perspective, cyberpunk theme

3. 主观视角（First-person Perspective）

视角特点：模拟角色眼中的世界，让观众从第一人称视角感受画面，增强代入感。

适用场景：冒险故事、角色互动、生活片段。

Prompt 示例：

A first-person view of hands holding a steaming cup of coffee in a cozy café, first-person perspective, sunlight streaming through the window, warm tones --ar 16:9

效果图：

关键词：first-person perspective, cozy café, warm tones

4. 对角视角（Dutch Angle）

视角特点：画面略微倾斜，打破平衡感，常用于营造不安、悬疑或动感的氛围。

适用场景：恐怖场景、灾难片段、动态事件。

Prompt 示例：

A tilted angle of a dark forest with twisted trees, eerie fog swirling, mysterious glowing eyes in the distance, dutch angle, cinematic horror style --ar 16:9

效果图：

关键词：dutch angle, tilted perspective, cinematic horror style

5. 动态视角（Dynamic View）

视角特点：通过夸张的透视和动作线，表现画面中的剧烈运动和动态效果。

适用场景：战斗场景、追逐片段、飞行镜头。

Prompt 示例：

A superhero flying towards the camera with one fist extended, city skyline in the background, dynamic perspective, intense motion blur --ar 16:9

效果图：

关键词：dynamic perspective, motion blur, cinematic

摄影师风格

在上面的景别和视角上，我们能够很清晰的介绍整个画面的内容构造了。但是，除了画面的物体元素，还有一个很重要的一点，那就是画面的质感。

在这里我们可以偷下懒，直接采用一些比较有名的摄影师的风格，这样就能直接将其画面的质感移植到我们的图片上了。

1. 人像篇：质感直接拉满！

要说人像摄影，Annie Leibovitz 绝对是顶级大师。试试这个 prompt：

elegant portrait in style of Annie Leibovitz, dramatic lighting, intimate mood, editorial quality, professional color grading --ar 4:5

效果太绝了！那种细腻的光影过渡，还有标志性的电影感气质，简直就是在复刻她的作品风格。

还有一位黑白人像大师 Peter Lindbergh，他的作品特别有味道：

fashion portrait in style of Peter Lindbergh, black and white, raw emotion, natural beauty, film grain, high contrast --ar 4:5

纯粹、真实，完全不做作，特别适合想要复古文艺范的朋友！

2. 街拍故事感：让照片会说话

说到街拍，我特别推荐 Steve McCurry 的风格。没错，就是拍出《阿富汗少女》的那位：

street portrait in style of Steve McCurry, vibrant colors, environmental storytelling, golden hour lighting, cultural elements --ar 4:5

色彩张力太强了！而且重点是，画面里每个细节都在讲故事。

3. 玩点疯狂的：超现实主义风格

如果你想玩点不一样的，David LaChapelle 就是最佳选择了：

surreal scene in style of David LaChapelle, hyper-saturated colors, fantasy elements, bold artificial lighting, pop culture --ar 4:5

这个真的太好玩了！色彩疯狂，构图大胆，完全解放你的想象力。

风格特点

Annie: 戏剧光影、质感细腻
Peter: 黑白质感、真实情感
Steve: 人文故事、色彩饱满
David: 超现实、色彩大胆

1. 可以混搭使用，但别贪多：

portrait with Annie Leibovitz lighting and Peter Lindbergh emotion, professional retouching --ar 4:5

2. 根据场景选择合适的风格：

人像写真 → Annie Leibovitz
街拍人文 → Steve McCurry
时尚黑白 → Peter Lindbergh
创意合成 → David LaChapelle

3. 风格叠加公式：

[场景] in style of [摄影师A] lighting with [摄影师B] composition, [具体效果描述] --ar 4:5

影视风格的参考

在这里推荐一个网站：https://shotdeck.com/welcome/trial

登录使用后，能够免费使用两周：

当我们点击浏览照片的时候，我们能看到很多照片，并且能够对其进行分类选择：

我们直接点击其中一个，就能看到里面的详细描述，我们也可以提取这些关键词放到提示词中进行使用，或者，直接下载图片进行风格参考即可。

在即梦中“参考风格”：

分镜拆解

很多小伙伴都有一个共性问题，就是看了很多拉片，也学习过了各种景别，但是，在实际的 AI 视频的制作流程中，总是忽视之前所学的所有内容，依旧是画面直接出图出视频。

这里有很大的一程度原因是因为对于景别的构思还没印到脑海里。

而另外还有一个原因是因为懂了景别，但是不懂如何进行拆解。

这时，我们也可以尝试借助 AI 帮我分解。

例如，我们有一张图片，是一个小男孩在教室的课桌上认真写作业：

即梦：https://jimeng.jianying.com/

写实风格，近景，教室里，一个小男孩在认真写作业。

然后我们打开豆包：

豆包：https://www.doubao.com/chat/

我们把图片上传上去，并填写提示词：

我有这样的一张图，我想分四个镜头进行描述男孩认真写作业的样子，可以有不同景别的切换，但是景别的切换要自然，镜头语言也要丰富，像电影那样。麻烦罗列出这四个镜头的描述。

全景镜头：教室全景入画，明亮光线透过窗户洒入，课桌椅整齐排列。男孩坐在其中一张课桌前，身姿端正，周围环境安静，黑板、其他空桌椅作为背景，勾勒出校园学习场景，让观众知晓事件发生的空间全貌 。

中景镜头：镜头推进至中景，聚焦男孩上半身。他穿着简约衣物，双臂自然搭在桌上，手握笔，目光紧锁作业本，笔触在纸面移动，肩膀偶尔因书写微微颤动，展现专注状态，传递认真写作业的行为信息 。

近景镜头：进一步推成近景，特写手部与作业本互动。笔在指间灵活运转，字迹在纸上逐渐成型，作业本上的线条、文字清晰可见，男孩手部细微的发力、移动，凸显书写动作，强化认真的细节 。

特写镜头：最后切为特写，锁定男孩面部。眉眼低垂，眼神专注且透着执着，睫毛偶尔轻颤，嘴唇抿起，将认真投入的神态放大，让观众共情这份专注，以人物神情收尾，深化画面情绪 。

然后我们再把这些提示词进行复制，放到即梦中生成视频即可：

感谢大家能看到这里！

爆肝了 5000 字，无偿分享给大家，若对你有所帮助，还请礼貌留痕支持下，谢谢大家！

文章版权归作者所有，未经允许请勿转载。

THE END

AI笔记

爆肝 5000 字！无偿带你提升 AI 视频创作能力！

前言

故事构造（叙事类）

信息收集

小说与剧本的区别

故事结构

三幕式

代入感

分镜

如何拆解分镜与多景别的意义

景别的分类

远景：定格壮阔

全景：人景合一

中景：日常视角

近景：情感交流

特写：内心世界

大特写：细节致胜

视角

1. 鸟瞰视角（Bird’s-eye View）

2. 仰视视角（Worm’s-eye View）

3. 主观视角（First-person Perspective）

4. 对角视角（Dutch Angle）

5. 动态视角（Dynamic View）

摄影师风格

1. 人像篇：质感直接拉满！

2. 街拍故事感：让照片会说话

3. 玩点疯狂的：超现实主义风格

风格特点

影视风格的参考

分镜拆解