爆肝 5000 字!无偿带你提升 AI 视频创作能力!

前言

大家学习 AI 视频也有一段时间了。

但是,不少小伙伴都感觉到,同样是 AI 视频,为什么觉得别人做得特别好,而自己做的显得很普通。

首先,我们需要明确一点,我们制作 AI 视频,其实更多的是视听语言,该怎么理解呢?

视觉便是我们看到的画面,所以画面的构成就很重要,如何让画面更贴合主题,这个是我们努力的方向,后面我也会讲如何优化。

而听觉则是我们听到的声音,同时也是更好的融入主角的场景中非常重要的一点,就像一些恐怖片,除了画面的恐怖,但是其实声音更是灵魂,就像画面展现一个破烂的寺庙,你感觉可能没什么,顶多觉得确实荒凉,有危险感。但是,一旦添加上 huhuhu~~的风声以及诡异的音调,你就会瞬间觉得害怕,下一秒出现恐怖的东西。

而在这一节中,我们更偏向于视觉的优化。

故事构造(叙事类)

信息收集

当我们制作一个剧本的时候,一开始很容易卡壳,就会觉得,无从下手。

在这个时候,其实很大的一部分原因是你收集的信息不够多。

就像之前的广州全运会 AI 视频比赛,假如你想参加,那你就必须先了解广州的资料,广州有什么特色建筑,有什么理念是区别于其它城市。

或者说,这期的全运会为什么会落在广州,而不是其它地方,这里我就不举例的,避免容易出现地域黑。

而全运会的信息也是如此,要了解清楚今年的全运会是口号是什么,有吉祥物是什么,它代表的寓意又是什么?

具体信息也可以参考官方提供的内容:https://www.gz.gov.cn/zt/qltjygadwqjsxsdzgzlfzdf/mtjj/content/post_9967250.html

当你把这些信息都收集完,你大致就会有感兴趣的点,然后你再抓住这些点跟 AI 进行沟通,从而获取更详细的内容,同时,也能确定你大致的剧本。

例如:

吉祥物头顶有三朵小水花。三个小水花代表了三个地方不同的颜色。包括广州的木棉红、香港的紫荆花的紫,以及澳门莲花的绿色。
Image

小说与剧本的区别

首先,大家要先明确一点,AI 视频的剧本和小说是不一样的。

在小说中,更多是通过文字让你去深入了解里面的故事情节,以及人物的当前状态。因此,对于人物的感觉,或者是心理的想法是写得非常细致的,下面是我截取的《斗罗大陆》的开篇第二小节内容:

Image

大家可以看到,从最开始的萧炎咀嚼青草,到举手又放下,再到自呢喃,再到心理的想法,都写得非常清楚。

但是,若我们真正去拍摄,很难去一比一进行复刻主角的这种体感和心理。

因此,我们在写剧本的时候,要刻意避免出现类似的情况,我们更应该去抓住主心骨,并且在设计内容的时候,更偏向于画面的展示。

例如同样是上面的内容,我们可以这样书写:

在一个漆黑的夜晚,萧炎躺在山坡上看着月亮,嘴里叼着一根青草。萤火虫在他身边环绕着,远处的树林里不断发出蝉声。

相比于小说,我们就会更在注重于整体的环境描写,以及有可能附带的声音,因为这些就是我们后续会真正转化成图片和音频的。

故事结构

三幕式

在清楚我们的剧本描述风格后,那我们如何进行构造一个故事?

其实,这里也非常简单。总结来说就是三幕式。

开始–>对抗–>结束

最近不是高考嘛,我就以这个作为一个例子。

首先,我们的主人公是一个即将高考的学生。

作为开始部分,我们就要像清楚,这个学生是男是女,是复读还是第一次考高考,ta 的学校是在一线城市还是偏远山区,家庭是富裕还是贫困。

在这些选项中,只要我们选择了其一,都会对后面的对抗和结束有着非常大的影响的。

而在对抗部分,自然就是人物发生了一些不一样的冲突,假如 ta 都是平平无奇,那观众自然不会想去看了。

因此,我们要在这里加上不一样的点。例如,ta 发现考题居然跟模拟考的题目一模一样,又例如,路上堵车了,ta 迟到赶不上考场,又例如,由于睡眠不好,ta 发挥失常了。

这些都是一些对抗点,是基于我们开始部分的发展,也可以理解为打破日常生活常规的引爆点。

而结束部分自然是开始的人物对于对抗部分是如何解决,例如 ta 克服了各种困难,赶到考场并超常发挥,获得全国第一,又例如,由于没赶上考场,错过了高考,ta 选择了回去继承家业,并成为新一代商业巨子。

代入感

当我们通过三幕式确认了故事的大致情节,剩下就是我们需要给这些框架加上血肉,而其中有一点非常重要,也就是让角色活起来!

至于如何活起来,有个非常简单的一点,那就是代入角色,你得会想象,假如你是这个角色,在身处这个环境中,同时,你又有这些性格以及历史包袱,你下一步会做什么?你是如何思考的?

就像刚刚举例的高考落选的例子,当高考不再是唯一的选项,而各种资源和信息又十分充足,那追求自我,追求爱好是不是更显得尤为重要。所以,假如我是他,我就会不断去追求 AI 视频的制作,学习各种影视知识,学习各种 AI 平台的技巧,因为沉浸在自己的爱好中,本身就是一件十分幸福的事情。

分镜

如何拆解分镜与多景别的意义

当我们拆解完分镜后,有个非常大的难点,也是很多人都困惑,我们怎么拆解分镜?

大多数人可能都是直接把画面内容 copy 一下直接发给提示词优化器,或者直接丢给可灵、或者即梦直接生成。

但是这样就出现一个非常严重的问题,也就是景别都是中景或者近景,像爆款短视频是非常明显了:

可以看到,基本每一幕都是熊猫的全身照,而为什么会出现这个原因也非常简单,因为是竖屏,展示的画面是垂直方向,自然都是全身照,多了,很容易审美疲劳。

这也就是为什么我们制作短片,基本都要使用横屏的原因。

而为了避免出现相同景别出现,因此,我们需要学会使用多个景别去描述同一个件事情。

这个是我在网上找的图:

Image

就像一个喝水的动作,我们可以像左边一样,直接一个中景,展示完全部内容,也可以先特写瓶子,再近景描述喝水的动作,再中景把水瓶放回去。

假如你是矿泉水的品牌方,你会选哪个?

无疑一定是选右边这个,那为什么呢?除了是特写瓶子的 logo,还有非常重要的一点,那就是可以通过不同景别的切换,不断刷新人的大脑的感知,从而使得同样是喝水的事情,在不同景别的切换过程中,大脑会觉得不同画面有不同的关注点,自然就更加感兴趣的看下去!

景别的分类

远景:定格壮阔

远景就像是站在高处俯瞰,画面中的人物显得很小,但能看到广阔的环境。

比如电影开场经常会用远景展示整座城市的面貌,或者展现人物在沙漠、大海中的渺小感。

这种景别最适合用来渲染气氛,营造宏大的场面。

Image

全景:人景合一

全景会把人物的全身和周围环境都拍进去。

这种景别特别适合拍舞蹈或武打动作,因为能完整展现人物的动作,同时又不会失去环境感。

Image

中景:日常视角

中景拍摄范围从膝盖以上到头顶,这个视角最接近我们平时社交的距离。

拍摄对话场景时经常会用到中景,因为既能看清人物表情,又不会让画面太过压迫。

Image

近景:情感交流

近景主要拍摄胸部以上的画面,这时候环境已经不太重要了,重点是展现人物的表情变化。

想要表达人物的心理活动,近景是个很好的选择。

Image

特写:内心世界

特写就是只拍脸部,或者某个重要的物品细节。

当你想让观众关注人物的情感变化,比如悲伤、愤怒的瞬间,特写能让这些情绪更具冲击力。

Image

大特写:细节致胜

大特写更极端,可能只拍一双眼睛,或是嘴角的一抹微笑。

这种景别最适合展现关键细节,比如戒指上的刻字,或是人物眼中闪烁的泪光。

Image

视角

1. 鸟瞰视角(Bird’s-eye View)

视角特点:从高处俯瞰整个画面,视野开阔,能很好地展现场景布局和角色之间的关系。

适用场景:自然风光、大规模场景描绘、强调孤独或渺小的氛围。

Prompt 示例:

A vast golden wheat field with a small wooden house in the center, bird's-eye view, cinematic lighting, detailed landscape, ultra-realistic --ar 16:9

效果图:

Image

关键词:bird’s-eye view, cinematic lighting, detailed landscape

2. 仰视视角(Worm’s-eye View)

视角特点:从地面往上看,给人强烈的冲击感和压迫感,用来凸显物体的威严或震撼效果。

适用场景:摩天大楼、巨型生物、未来科技的场景。

Prompt 示例:

A giant futuristic skyscraper viewed from the ground, worm's-eye view, dramatic perspective, glowing neon lights, cyberpunk theme --ar 16:9

效果图:

Image

关键词:worm’s-eye view, dramatic perspective, cyberpunk theme

3. 主观视角(First-person Perspective)

视角特点:模拟角色眼中的世界,让观众从第一人称视角感受画面,增强代入感。

适用场景:冒险故事、角色互动、生活片段。

Prompt 示例:

A first-person view of hands holding a steaming cup of coffee in a cozy café, first-person perspective, sunlight streaming through the window, warm tones --ar 16:9

效果图:

Image

关键词:first-person perspective, cozy café, warm tones

4. 对角视角(Dutch Angle)

视角特点:画面略微倾斜,打破平衡感,常用于营造不安、悬疑或动感的氛围。

适用场景:恐怖场景、灾难片段、动态事件。

Prompt 示例:

A tilted angle of a dark forest with twisted trees, eerie fog swirling, mysterious glowing eyes in the distance, dutch angle, cinematic horror style --ar 16:9

效果图:

Image

关键词:dutch angle, tilted perspective, cinematic horror style

5. 动态视角(Dynamic View)

视角特点:通过夸张的透视和动作线,表现画面中的剧烈运动和动态效果。

适用场景:战斗场景、追逐片段、飞行镜头。

Prompt 示例:

A superhero flying towards the camera with one fist extended, city skyline in the background, dynamic perspective, intense motion blur --ar 16:9

效果图:

Image

关键词:dynamic perspective, motion blur, cinematic

摄影师风格

在上面的景别和视角上,我们能够很清晰的介绍整个画面的内容构造了。但是,除了画面的物体元素,还有一个很重要的一点,那就是画面的质感。

在这里我们可以偷下懒,直接采用一些比较有名的摄影师的风格,这样就能直接将其画面的质感移植到我们的图片上了。

1. 人像篇:质感直接拉满!

要说人像摄影,Annie Leibovitz 绝对是顶级大师。试试这个 prompt:

elegant portrait in style of Annie Leibovitz, dramatic lighting, intimate mood, editorial quality, professional color grading --ar 4:5
Image

效果太绝了!那种细腻的光影过渡,还有标志性的电影感气质,简直就是在复刻她的作品风格。

还有一位黑白人像大师 Peter Lindbergh,他的作品特别有味道:

fashion portrait in style of Peter Lindbergh, black and white, raw emotion, natural beauty, film grain, high contrast --ar 4:5
Image

纯粹、真实,完全不做作,特别适合想要复古文艺范的朋友!

2. 街拍故事感:让照片会说话

说到街拍,我特别推荐 Steve McCurry 的风格。没错,就是拍出《阿富汗少女》的那位:

street portrait in style of Steve McCurry, vibrant colors, environmental storytelling, golden hour lighting, cultural elements --ar 4:5
Image

色彩张力太强了!而且重点是,画面里每个细节都在讲故事。

3. 玩点疯狂的:超现实主义风格

如果你想玩点不一样的,David LaChapelle 就是最佳选择了:

surreal scene in style of David LaChapelle, hyper-saturated colors, fantasy elements, bold artificial lighting, pop culture --ar 4:5

这个真的太好玩了!色彩疯狂,构图大胆,完全解放你的想象力。

Image

风格特点

  • Annie: 戏剧光影、质感细腻
  • Peter: 黑白质感、真实情感
  • Steve: 人文故事、色彩饱满
  • David: 超现实、色彩大胆
  1. 1. 可以混搭使用,但别贪多:
portrait with Annie Leibovitz lighting and Peter Lindbergh emotion, professional retouching --ar 4:5
Image
  1. 2. 根据场景选择合适的风格:
  • 人像写真 → Annie Leibovitz
  • 街拍人文 → Steve McCurry
  • 时尚黑白 → Peter Lindbergh
  • 创意合成 → David LaChapelle
  1. 3. 风格叠加公式:
[场景] in style of [摄影师A] lighting with [摄影师B] composition, [具体效果描述] --ar 4:5

影视风格的参考

在这里推荐一个网站:https://shotdeck.com/welcome/trial

登录使用后,能够免费使用两周:

Image

当我们点击浏览照片的时候,我们能看到很多照片,并且能够对其进行分类选择:

Image

我们直接点击其中一个,就能看到里面的详细描述,我们也可以提取这些关键词放到提示词中进行使用,或者,直接下载图片进行风格参考即可。

Image

在即梦中“参考风格”:

Image

分镜拆解

很多小伙伴都有一个共性问题,就是看了很多拉片,也学习过了各种景别,但是,在实际的 AI 视频的制作流程中,总是忽视之前所学的所有内容,依旧是画面直接出图出视频。

这里有很大的一程度原因是因为对于景别的构思还没印到脑海里。

而另外还有一个原因是因为懂了景别,但是不懂如何进行拆解。

这时,我们也可以尝试借助 AI 帮我分解。

例如,我们有一张图片,是一个小男孩在教室的课桌上认真写作业:

即梦:https://jimeng.jianying.com/
写实风格,近景,教室里,一个小男孩在认真写作业。
Image

Image

然后我们打开豆包:

豆包:https://www.doubao.com/chat/

我们把图片上传上去,并填写提示词:

我有这样的一张图,我想分四个镜头进行描述男孩认真写作业的样子,可以有不同景别的切换,但是景别的切换要自然,镜头语言也要丰富,像电影那样。麻烦罗列出这四个镜头的描述。
Image
Image
全景镜头:教室全景入画,明亮光线透过窗户洒入,课桌椅整齐排列。男孩坐在其中一张课桌前,身姿端正,周围环境安静,黑板、其他空桌椅作为背景,勾勒出校园学习场景,让观众知晓事件发生的空间全貌 。
中景镜头:镜头推进至中景,聚焦男孩上半身。他穿着简约衣物,双臂自然搭在桌上,手握笔,目光紧锁作业本,笔触在纸面移动,肩膀偶尔因书写微微颤动,展现专注状态,传递认真写作业的行为信息 。
近景镜头:进一步推成近景,特写手部与作业本互动。笔在指间灵活运转,字迹在纸上逐渐成型,作业本上的线条、文字清晰可见,男孩手部细微的发力、移动,凸显书写动作,强化认真的细节 。
特写镜头:最后切为特写,锁定男孩面部。眉眼低垂,眼神专注且透着执着,睫毛偶尔轻颤,嘴唇抿起,将认真投入的神态放大,让观众共情这份专注,以人物神情收尾,深化画面情绪 。

然后我们再把这些提示词进行复制,放到即梦中生成视频即可:

Image


感谢大家能看到这里!

爆肝了 5000 字,无偿分享给大家,若对你有所帮助,还请礼貌留痕支持下,谢谢大家!

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

    暂无评论内容