氪金测试了通义新模型wan2.2,分享下提示词

昨晚通义来了个炸弹,

大家都知道了,通义万相wan2.2发布

因为太晚,雪佬要睡觉,就没有测试

(其实是雪佬懒)

今天早上起来,就赶紧爬起来打开万相国内版,

网址如下:

中文官网:https://tongyi.aliyun.com/wanxiang

图片
图片

然后国内版是每天签到得100积分(限时三天)

我就框框一顿测试,

很明显,100积分,对于雪佬这种测试狂人来说,

完全不够,这才哪到哪,

但是,国内版官网又没有付费入口,

无奈,雪佬只能转战国外,

网址如下:

英文官网:https://wan.video

图片

打开官网如上图,

怎么开始?

点网站最下面中间的这里就行

图片

选择图生视频或者文生视频,

雪佬今天测试的都是文生视频。

也是回到了梦开始的地方,

话不多说,咱们直接上干货,

3 2 1

第一个视频的第一个镜头提示词:

风格化: 写实科幻,冷灰色调,美剧质感,高对比度,数字锐化,电影级颗粒。主体: “诺亚”,最后幸存者。第一人称POV。视觉锚点: 磨损的飞行员手套,布满划痕的驾驶舱玻璃,仪表盘上褪色的家庭照片。场景: 黄昏。无垠的灰色沙漠。巨大的城市遗迹骨架林立。核心叙事与运动:[第一人称POV],驾驶废料拼接飞行器,在死寂城市上空[平稳飞行]。头部视角[缓慢左移],扫视下方废墟。[J-CUT: 声音先行],一声刺耳的[金属断裂声]从下方“峡谷”传来。头部视角[猛然右下转],双手[瞬间攥紧操纵杆]。[情感节拍: 危机爆发],两栋大楼残骸间,一个由起重机与钢缆构成的巨型结构[崩塌]。飞行器执行[90度侧翻俯冲],镜头[剧烈晃动+动态模糊]。在狭窄空间内进行[S型高速穿梭],躲避坠落的钢筋与横扫的钢缆。一块混凝土块[重击驾驶舱玻璃],产生蛛网裂痕。[情感节拍: 劫后余生],飞行器[冲出崩塌区],回到开阔空域。镜头因急促呼吸而[规律性起伏],双手[微弱颤抖]。视线透过裂痕,回望身后被尘埃吞没的混乱。美学控制与音效设计:镜头: 全程POV。危机时采用[手持感剧烈晃动]。结尾采用[呼吸感镜头起伏]。光线: 低饱和度冷光源,硬朗的阴影,强调金属和玻璃的冰冷反光。

第二个视频的第一个镜头提示词:

风格化: 极致写实,超高清摄影,模拟真实体育赛事转播,高饱和度,高速摄影。负面提示词: 动画,CG,卡通,3D渲染,皮克斯风格,拟人化服装。

主体: 一只形态完全写实的欧洲刺猬。锚点: 眼神专注,动作模仿专业跳水运动员。

场景: 一个照片级真实的国际跳水锦标赛场馆。灯光明亮,蓝色泳池有真实光影和波纹。观众席为动态模糊的真实人群背景。

核心叙事与运动:

[长焦镜头],一只写实的刺猬站在十米跳台尽头,背景是电子计分牌。它身体紧绷,展现运动员的预备姿态。

[面部特写],它鼻尖微动,调整呼吸,眼神锁定水面。

声音提示: 一声[弹簧音]。

[起跳特写],跳板弯曲、弹起。刺猬向上跃出,动作精准。

[高速摄影机镜头 – 1000fps慢动作],从水下仰拍。刺猬在空中模仿人类运动员翻腾动作:[蜷缩成球形]完成向前翻腾三周半,旋转稳定,姿态标准。

[慢动作结束],切换至水面平视。入水前,身体[瞬间伸展],以背部尖刺为入水点,模仿“压水花”技巧,[垂直入水]。

[极致特写],水面被切开,几乎没有水花,只有一串气泡升起。

[CUT TO:],观众席爆发出[掌声与欢呼声]。镜头扫过真实人群的兴奋面孔。计分牌显示一排“10.00”分。

美学控制与音效设计:

镜头: 模拟真实体育转播机位,运用[长焦]、[特写]、[高速慢动作]和[水下镜头]。

光线: 模拟场馆专业照明,强调水面反射和刺猬皮毛质感。

音效: 关键音效包括:赛场观众的期待低语和爆发性欢呼;跳板弹起声;干净无声的入水声;刺猬细微的鼻息声。

剪辑: 动静结合,用入水前后的声效反差制造高潮。

第三个视频的第一个镜头提示词:

风格化: 美剧质感,冷灰色调,高对比度,手持纪实感。负面提示词: 慢动作,舞蹈感,夸张的动作设计。

主体:

A特工: 精悍,冷静。锚点: 战术背心,使用高效近身格斗术。

B特工: 高大,力量型。锚点: 黑色风衣,使用流畅的防御反击技巧。

场景: 狭窄、灯光明暗交替的酒店走廊。混凝土墙壁。

核心叙事与运动:

[手持过肩镜头],从A特工背后开始。B特工挥拳,A特工[侧身闪避],同时[肘击]其肋部。

[镜头跟随A特工的出拳方向 – 轨道运镜],A特工直拳打向B特工面门,镜头被拳风[向前猛推]。B特工[后仰]躲过。

[360°环绕格斗镜头],两人近身缠斗。镜头围绕他们[快速旋转],捕捉肌肉紧绷的细节。

[第一人称POV切换 – A特工视角],被B特工[猛推向墙壁]。[J-CUT: 声音先行],一声闷响。镜头[剧烈震动],瞬间失焦后恢复。

B特工摆拳挥来,A特工[低头闪躲],同时从腰间装备中取出一个金属物体。

[极致特写],这个金属物体在灯光下反射出寒光,A特工反手握住它[向上划去]。

[CUT TO:],B特工后退一步,按住手臂,脸上露出痛苦的表情。两人重新拉开距离,紧张对峙,只剩喘息声。

美学控制与音效设计:

镜头: 全程手持,运用[跟随运动镜头]、[POV]、[360°环绕]。

光线: 利用走廊灯光的明暗交替制造节奏感。

音效:

环境音: 安静走廊的电流嗡鸣声。

核心音: 拳拳到肉、短促有力的击打和格挡声;身体撞击硬质墙壁的沉闷声音。

动作音: 物体从装备中快速取出的摩擦声;尖锐物体划破空气的声音。

生理音: 激烈格斗中的喘息与闷哼声。

剪辑: 快速、凌厉的短镜头剪辑,用[J-CUT]打乱节奏。

好了,以上就是第一个视频的全部提示词,

接下来,咱们继续贴出第二个视频的11个镜头提示词。

第一个镜头提示词:

(0.0 – 1.0秒): 溶解的序曲[情感节拍: 标志性的酝酿]

[感官指令:

V: [固定机位,中景] 纯黑虚空中,一个完美的金色“M”字Logo。它的表面[迅速出现流光],仿佛固态金属在1秒内被激活。

A: [Lib: Abs/Tension/Shimmering_Hum_Buildup] (光泽感嗡鸣声同步增强)。

(1.0 – 4.0秒): 高速流体创世 (核心镜头)

[情感节拍: 丝滑的魔法重构]

[感官指令:

V: “M”字Logo**[无缝地、极快速地溶解]**成一滩旋转的“熔融芝士”金色液体。**这个溶解过程必须丝滑、没有停顿。**

紧接着,这滩金色流体**[不再是狂野的漩涡,而是在一个控制下高速变形]**,如同一位书法家在挥毫:

它先是向上[拉伸],分化出一股深棕色流体,这股流体在空中[瞬间凝固]成两片完美的牛肉饼。

同时,一股绿色流体从中[抽出并编织]成生菜。

金色主体则[优雅地覆盖]在肉饼上,形成融化的芝士和酱汁。

最后,整个流体团的顶部和底部[快速膨胀、定型],变成面包胚,将所有东西完美包裹。

整个过程**一气呵成**,如同一个高速播放的、充满魔力的食谱演示,充满了**丝滑的流动感**。

A: [Signature Sound Design]开始播放:

[流体声]贯穿整个变形过程。

每当一种新食材(牛肉、生菜、芝士)清晰成型时,都会伴随一声[反向魔法风铃声]的点缀。

在牛肉饼最终就位时,加入一声画龙点睛的[短促炙烤声]。

运镜: 摄影机在这3秒内,完成一次[快速但平滑的弧形推近 (Arc Push-in)],从“M”的全景,最终聚焦到正在形成的汉堡的特写。

(4.0 – 5.0秒): 完美的定格

[情感节拍: 终极食欲与品牌印记]

[感官指令:

V: 在第4秒,一个完美的、超写实的巨无霸汉堡[精确地定格]在画面中央,还带着一缕蒸汽。麦当劳Logo

第二个镜头提示词:

[镜头一:建立关系 (过肩镜头)][情感节拍: 隔绝的对峙]

[感官指令: V: [从男主角里奥身后,越过他肩膀的过肩镜头(Over-the-Shoulder)] 我们看到女主角克莱尔的脸。她站在对面,站台的风吹动了她的头发和围巾。她只是静静地看着里奥,没有说话。 | A: [环境基底] + [声音指纹: 一阵冷风吹过]。

[剪辑指令: 镜头稳定,时长约2-3秒,建立场景和人物关系。]

[镜头二:女主角的压抑 (正打-特写)]

[情感节拍: 无声的挽留]

[感官指令: V: [切换至克莱尔的正脸特写(Close-up)] 镜头聚焦于她的眼睛。我们能清晰地看到,她的眼眶泛红,泪水在里面【不停地打转、积聚】,但她的下眼睑肌肉紧绷,努力不让眼泪掉下来。一滴泪珠在眼角凝结,像一颗微小的钻石,在站台灯光下闪烁。 | A: [情感音效: 极其微弱的、缓慢而痛苦的心跳声开始响起]。

[剪辑指令: 浅景深,背景中的男主角和站台完全虚化。]

[镜头三:男主角的冷漠 (反打-特写)]

[情感节拍: 残酷的伪装]

[感官指令: V: [切换至里奥的正脸特写(Close-up)] 他的脸上没有任何表情,下颌线紧绷,眼神【刻意地、冷漠地看向别处】,避开了克莱尔的视线。一列火车从他身后的轨道上[呼啸而过],灯光在他的脸上快速掠过,短暂地照亮了他眼中一闪而过的、隐藏极深的痛苦。 | A: [心跳声消失] + [SFX: Lib: Foley/Vehicle/Train_Pass_By_Fast_Whoosh] (火车高速通过的巨大呼啸声,瞬间打破宁静,也象征着他决绝的态度)。`

[剪辑指令: 火车经过时,可以加入轻微的镜头晃动。]

[镜头四:最后的对视 (回到过肩镜头)]

[情感节拍: 终成定局]

[感官指令: V: [切回到最初的、从里奥身后的过肩镜头] 火车驶过,克莱尔依然站在原地。她似乎终于放弃

第三个镜头提示词:

1. 核心设定 (Core Concept):角色描述: 主角:一位名叫“安娜”的顶尖花样体操运动员,身材修长、肌肉线条明显,眼神中充满了绝对的专注与力量。

道具描述: 一条鲜红色的、质地轻盈的体操彩带;体操场地中央蓝色的、有弹性的地毯。

场景描述: 一个灯火通明的奥运会体操比赛场馆,背景是虚化的、坐满观众的看台和闪烁的裁判席灯光。

2. 视听风格 (Audio-Visual Style):

视觉风格: 写实, 电影感, 体育竞技, 力量与美的视觉诗, 慢动作与正常速度的交替, 高饱和度。

音效设计: 一段节奏极快、充满爆发力的古典交响乐(如《野蜂飞舞》或现代改编版),运动员完成高难度动作时急促而有力的呼吸声,彩带在空中高速挥舞时发出的“咻咻”破风声,身体与地毯接触时发出的沉稳、有弹性的“砰”声。

3. 摄影执行 (Cinematography):

光线设计: 顶光, 聚光灯 (Spotlight) 牢牢锁定在运动员身上,形成强烈的主体光,边缘光勾勒出肌肉线条。

镜头语言: 低角度仰拍, 特写, 全景。

时间环境: 室内比赛,夜晚。

4. 动态设计 (Dynamics):

核心运动: 安娜完成一个极其高难度的连续动作序列:从一个高速的[原地旋转(Pivot)]开始,无缝衔接一个需要惊人腰腹力量的[后手翻接前空翻],在空中时,她手中的红色带子形成一个完美的螺旋形状。

镜头运动: 一个复杂的[复合运镜]开始:以[低角度]跟随她的旋转,当她起跳时,镜头[猛地向上抬升并做弧形运动(Arcing Pedestal Up)],在空中切换为[极致慢动作],环绕着她和彩带,捕捉肌肉的颤动和彩带的形态。当她落地时,镜头恢复正常速度并切换为[稳固的正面全景],展现她稳稳落地的完美姿态。

第四个镜头提示词:

1. 核心设定 (Core Concept):角色描述: 主角:一个穿着休闲夹克、身手敏捷的普通人,表情是“害怕但不得不跳”的滑稽混合体。

道具描述: 老旧、参差不齐的空调外机;一辆装满纸箱的货车。

场景描述: 一栋普通城市居民楼的外墙,背景是晴朗的蓝天。

2. 视听风格 (Audio-Visual Style):

视觉风格: 写实, 动作喜剧, 强调连续性的视觉冲击力, 广角镜头。

音效设计: 一段节奏超快的喜剧追逐音乐贯穿始终;伴随着连续的、与画面同步的金属被踩踏的“哐当”声和主角滑稽的“哇啊啊”叫声;最后以一声巨大的、沉闷的“噗”声收尾。

3. 摄影执行 (Cinematography):

光线设计: 日光, 顺光, 保证所有动作清晰可见。

镜头语言: 广角, 俯拍。

时间环境: 白天, 晴天。

4. 动态设计 (Dynamics):

核心运动: 主角从五楼跃下,以极快的速度,交替踩着四楼、三楼、二楼的空调外机,一路连续下坠。过程中,他因为踩滑而有一次身体失去平衡的滑稽摆动,但手忙脚乱地抓住旁边的管道后立刻继续。最后,他从二楼的外机纵身一跃,落入下方的货车纸箱堆中。

镜头运动: 一个【从顶楼开始、垂直向下的高速俯拍跟随镜头 (High-Angle Top-Down Tracking Shot)】,一镜到底,紧紧跟随主角完成整个速降过程。

第五个镜头提示词:

1. 核心设定 (Core Concept):角色描述: 赛车A (主角车): 一辆红色的、线条流畅的GT赛车,车身有轻微的划痕;赛车B (对手车): 一辆黑色的、更具肌肉感的同级别赛车,风格更具侵略性。

道具描述: 飞溅的火花,因碰撞而变形的侧门金属板,震动的后视镜。

场景描述: 一条专业的赛道,正处于一个高速的长弯道。傍晚时分,赛道旁的轮胎墙和广告牌在高速中变得模糊。

2. 视听风格 (Audio-Visual Style):

视觉风格: 写实, 电影感, 赛车大片, 动态模糊, 低角度拍摄带来的速度感, 高对比度。

音效设计: 两台赛车引擎在高转速下的持续轰鸣声, 轮胎与地面摩擦的尖啸声, 紧张的、心跳般的电子节拍音乐, 金属碰撞时发出的刺耳、沉重的刮擦声和撞击声。

3. 摄影执行 (Cinematography):

光线设计: 日落, 暖色调, 镜头光晕, 侧光照射在车身上形成流动的光带。

镜头语言: 车内驾驶员视角的特写, 紧贴车轮的低角度镜头, 两车并排的中景。

时间环境: 黄昏, 晴天。

4. 动态设计 (Dynamics):

核心运动: 两车高速并排过弯, 赛车B持续向赛车A进行侧面挤压和撞击, 赛车A驾驶员奋力稳住方向盘。

镜头运动: 快速剪辑, 镜头在[车内特写]、[车外低角度]和[航拍中景]之间切换,最后以一个[慢动作]特写结束。

第六个镜头提示词:

(0.0s – 1.5s) // 异常的预兆[情感节拍: 困惑与不安]

[感官指令: V: [固定机位,中景] 亚瑟站在一条普通的城市街道中央,他困惑地停下脚步,抬头望向天空。他周围的世界一切正常。 | A: [环境基底: 正常的城市音效] + [声音指纹: 那种沉重的、不祥的低频共振声开始极微弱地响起,并逐渐增强]。

[剪辑指令: 镜头稳定,营造一种暴风雨前的宁静。]

(1.5s – 3.5s) // 天空坠落

[情感节拍: 现实的崩塌]

[感官指令: V: [镜头切换至亚瑟的过肩视角,跟随他的视线向上看] 天空不是天空。另一条一模一样的街道,被【90度垂直翻转】,如同一个巨大的“盖子”,正在缓缓地向他所在的街道压下。

【关键视觉细节】 上方街道的重力开始失效,汽车、路灯、甚至行人,都如同瀑布般,开始剥离、变形、并向下方(也就是亚瑟的方向)【成片地坠落】。

亚瑟的表情瞬间从困惑变为极度的惊恐,他转身就开始向着镜头方向狂奔。 | A: [声音指指纹: 共振声达到顶峰] + [情感音效: 上方物体坠落的巨大风啸声和人群的恐慌尖叫声开始响起]。

[剪辑指令: 镜头从固定切换为跟随,预示着逃亡的开始。]

(3.5s – 6.0s) // 无尽的卷曲

[情感节拍: 求生的狂奔]

[感官指令: V: [一个紧紧跟随在亚瑟身后的第二人称奔跑镜头] 亚瑟用尽全力、不顾一切地狂奔。

【关键视觉细节】 在他身后,他刚刚站立的街道,如同被一只无形巨手卷起的地毯,开始**【向上、向内卷曲、折叠】**,吞噬着所有的建筑和车辆。柏油路面像布一样被撕裂。

上方坠落的汽车在他身边不远处砸出巨大的坑洞,爆炸的火焰照亮了他惊恐的侧脸。 | A: [情感音效: 所有的声音——共振声、撕裂声、爆炸声、尖叫声——混合成一片震耳欲聋的、世界末日般的噪音交响]。

[剪辑指令: 【斯坦尼康稳定器效果】

第七个镜头提示词:

1. 核心设定 (Core Concept):角色描述: 主角:一位名叫“ Lara”的果敢女探险家,穿着卡其色探险服,脸上沾有灰尘,眼神充满好奇与警惕。

道具描述: 一根由木棍和浸油破布制成的、燃烧着熊熊火焰的简易火把;墙壁上覆盖着厚厚灰尘的巨大石刻壁画。

场景描述: 一个巨大、幽深、完全黑暗的古代墓室,空气中弥漫着尘土和霉味,石壁上布满看不清的雕刻。

2. 视听风格 (Audio-Visual Style):

视觉风格: 写实, 电影感, 冒险片, 氛围感, 高对比度, 胶片颗粒感

音效设计: 火把燃烧时发出的“噼啪”声, Lara谨慎的脚步声在空旷墓室中的回响, 碎石从墙壁上滑落的细微声音, 当壁画被照亮时响起的、带有神秘感的、悠长的圣咏音乐

3. 摄影执行 (Cinematography):

光线设计: 火光 (作为唯一动态光源), 硬光, 暖色调, 极致的明暗对比 (Chiaroscuro)

镜头语言: 中近景, 仰视角度拍摄, 中心构图

时间环境: 无特定时间,处于与世隔绝的地下空间

4. 动态设计 (Dynamics):

核心运动: Lara小心翼翼地行走, 划燃火柴, 点燃火把, 将火把缓缓举起并靠近墙壁

镜头运动: 固定镜头 (强调空间的压迫感), 缓慢的镜头上摇 (Tilt Up) (跟随火把的光芒移动)

第八个镜头提示词:

1. 核心设定 (Core Concept):角色描述: 主角:一位身披重甲、头戴铁盔(仅露出坚毅的下半张脸)的中世纪骑士。他单手持缰,另一只手紧握一把沾满血迹的巨大重剑(Greatsword)。他的战马是一匹覆盖着少量护甲的、神情彪悍的黑色战马。

道具描述: 骑士身后飘扬的、印有家族徽章的破旧披风;被重剑砍中后,敌人盔甲上迸溅的火花和裂痕;战场上散落的断裂长矛和盾牌。

场景描述: 一个广阔、泥泞、尸横遍野的巨大平原战场。天空阴沉,远处有攻城器械投掷的火球划过天际,形成拖着黑烟的轨迹。数千名士兵在背景中进行着混乱的厮杀。

2. 视听风格 (Audio-Visual Style):

视觉风格: 写实, 史诗战争片, 肮脏美学 (Grimy Aesthetic), 强调物理冲击力, 动态模糊, 慢动作与正常速度的交替。

音效设计: 史诗级的、由管弦乐和战鼓组成的宏大配乐;马蹄踩在泥泞土地上的沉重“噗嗤”声;骑士自己的、透过头盔传出的沉重呼吸声;重剑挥舞时的低沉风啸声和砍中敌人时,金属与骨骼一同碎裂的可怕声响;战场上远处传来的、混杂在一起的喊杀声、惨叫声和兵器碰撞声。

3. 摄影执行 (Cinematography):

光线设计: 阴天光, 自然光, 光线被战场上的硝烟和尘土所散射,形成一种压抑、混沌的氛围。远处火球是唯一的光源点缀。

镜头语言: 广角镜头 (核心), 第二人称跟随视角 (核心)。

时间环境: 白天, 阴天, 战争进行时。

4. 动态设计 (Dynamics):

核心运动: 骑士骑马在混乱的战场中进行一次高速、致命的冲锋,并在移动中连续完成数次砍杀。

镜头运动: 一个关键的、复杂的、模拟无人机飞行的【第二人称复合运镜】。

第九个镜头提示词:

(0.0s – 1.5s) // 左手的防御[情感节拍: 本能的格挡]

[感官指令: V: [第一人称POV视角,广角镜头] 一个长着利爪的、皮肤苍白的怪物猛地从画面左侧扑来。我的左臂[本能地、肌肉紧绷地向上格挡],粗壮的前臂直接撞上怪物的下颚,将其撞得向后踉跄。 | A: [声音指纹: 一声短促的野兽般低吼] + [SFX: Lib: Foley/Combat/Impact_Flesh_On_Bone_Brutal] (血肉撞击骨骼的野蛮闷响)。`

[剪辑指令: 无剪辑,手持镜头剧烈晃动]

(1.5s – 3.5s) // 右手的毁灭

[情感节拍: 狂怒的挥砍]

[感官指令: V: [镜头随着身体猛地向右旋转] 我的右手紧握着巨斧,以一个从上至下的【毁灭性纵劈】,狠狠地砍在另一个试图从正面攻击的、体型更大的怪物头顶。 [慢动作500%] 斧刃破开头骨,深入躯干,深绿色的粘稠血液和破碎的骨片、脑浆【爆炸般地溅射开来】,瞬间糊满了我的整个视野。 | A: [SFX: Lib: Foley/Combat/Axe_Impact_Flesh_Bone_Gore] (斧头劈入血肉与骨骼的、极其恐怖的复合碎裂声) + [SFX: 怪物临死前被截断的、高频的嘶鸣声]。

[剪辑指令: 慢动作开始时,所有背景音消失,只留下击碎声和嘶鸣声。]

(3.5s – 5.0s) // 视野的清理

[情感节拍: 狂怒的延续]

[感官指令: V: [恢复正常速度] 我的左手[粗暴地抬起],用护腕将视野中粘稠的怪物血液一把抹去,留下一道模糊的血痕。透过血痕,我看到更多扭曲的怪物身影正在从黑暗中涌来。 | A: [SFX: Lib: Foley/Liquid/Wipe_Viscous_Liquid] (擦去粘稠液体的声音) + [情感音效: 失真的心跳声再次变得清晰、急促] + [远处怪物群的咆哮声越来越近

第十个镜头提示词:

(0.0 – 2.5秒): 混沌的思维宇宙[情感节拍: 瓶颈期的混乱]

[感官指令:

V: [Extreme close-up] 镜头是程序员[布满血丝的眼睛]的特写。瞳孔中,无数行混乱、破碎、快速滚动的代码和故障图形[高速闪现、叠加],形成一个令人眩晕的数字漩涡。整个画面[高频抖动+Glitch故障特效]。

A: [Lib: Abs/Tension/Digital_Glitch_Overload] (混乱的数字音效达到顶峰)。

(2.5 – 3.0秒): 冰霜的介入

[情感节拍: 秩序的奇点]

[MATCH CUT: 眼睛中混乱的代码漩涡 → 一杯瑞幸冰咖啡中,冰块与咖啡形成的漩涡]

[感官指令:

V: [极致微距+慢动作1000%] 镜头聚焦于一杯晶莹剔透的瑞幸冰咖啡。一颗冰块[缓慢旋转],咖啡液在它周围形成优美的、有序的棕色流体。杯壁上凝结着细密的[冰霜水珠]。画面极致稳定、干净。

A: [J-CUT: 声音先行] 在画面切换前0.1秒,所有混乱音效**[瞬间切断]**,进入[Lib: Abs/Epiphany/Silence_Sudden_Deep] (绝对寂静)。

(3.0 – 4.5秒): 宇宙的重启

[情感节拍: 瞬间的清醒]

[感官指令:

V: 镜头[Slow Zoom out],展现那只干净、修长的手优雅地拿起这杯咖啡,凑到嘴边。背景是纯黑或纯白,极简主义。

A: (持续的绝对寂静)。

(4.5 – 5.0秒): 品牌印记

[感官指令:

V: 画面中央出现瑞幸咖啡的Logo和Slogan:“luckin coffee”。简洁、有力。

A: [SFX: Lib: Foley/Human/Sip_Crisp_Ice_Coffee] (一声极其清脆、充满质感的吸入声,与Logo同时出现)。

第十一个镜头提示词:

(0.0 – 2.0秒): 灰色的现实[情感节拍: 日常的压抑]

[感官指令:

V: [固定机位,中景] 镜头位于一个极简但色调冰冷、压抑的灰色空间(象征办公室或地铁站)。一个穿着灰色西装的上班族,[面无表情地、机械地向前行走]。整个画面的饱和度极低。

A: [Lib: Abs/Tension/Silence_Oppressive] (压抑的寂静,只有[Lib: Foley/Human/Footsteps_Heavy_Dull]沉闷的脚步声)。

(2.0 – 4.5秒): 穿越光之门

[情感节拍: 瞬间的释放与治愈]

[感官指令:

V: 当他走到画面中央时,他[径直穿过]一个由纯粹金色光芒构成的、巨大的麦当劳“M”字拱门。**[这是一个关键的特效镜头]**。在他穿过“M”门的瞬间,发生以下**同步**变化:

他身上的灰色西装,[瞬间色彩反转]变为色彩鲜艳的休闲装。

他空洞的表情,[瞬间绽放出灿烂、真实的笑容]。

他手中凭空出现一个麦当劳餐盘,上面放着汉堡和薯条。

背景的灰色空间,[瞬间被一个温暖、热闹、坐满欢笑人群的麦当劳餐厅场景所取代]。

整个画面的饱和度和色温[瞬间提升],变得明亮、温暖。

A: [J-CUT] 在他身体接触到“M”门的瞬间,压抑的寂静被**[瞬间爆发]**的欢乐声音所取代:[温暖的背景音乐] + [人群的欢笑声] + [滋滋作响的烹饪声].

(4.5 – 5.0秒): 品牌印记

[感官指令:

V: 画面定格在他灿烂笑容的特写上,背景是温暖的麦当劳餐厅。右下角出现麦当劳Logo和Slogan。

A: 所有背景音淡出,只留下麦当劳经典的“ba da ba ba ba”音效,作为声音图章。

好了,以上是两个视频的全部提示词,已经发送完毕。

最后说下雪佬的测试感想,

1、大家应该能从视频里看到,

通义万相wan2.2这个新模型,

运动这块已经非常不错了,

可以看第二个视频那个艺术体操动作,

人物旋转的动作非常的丝滑,完成的很完美,

而且人物肢体没有崩掉,

相信测试过很多的老司机们一定深有体会,

武打动作和这种艺术体操或者杂技动作,是最难的。

这里我在单独的贴一下这个艺术体操镜头,

大家可以再看下

在5秒钟这么短的时间内,完成的很丝滑和完美,

这个镜头一出来是震撼到我了。

还有一个镜头,我觉得也不错,

老司机们应该会了解,

正反打镜头也是AI视频的重灾区,

因为大多数情况下,好多模型表现不出来,

属于死磕你会死的更惨的镜头,

但是,wan2.2这条,我个人认为还很不错,

我也贴在下面

还有一个镜头,是有点瑕疵,

但是,我个人感觉运镜这块,也很不错,

当然,众所周知,通义运镜一直很顶,

我也贴在下面

还有一个镜头,营造的氛围我觉得最牛逼,

我也贴在下面,大家看一下

还有一个赛车镜头我觉得也不错,虽然也是有瑕疵,

视频如下:

总体来说,通义这次更新,在动作这块,是蛮惊喜的,

一个开源模型,能做到可以和闭园模型打一打的程度,

很牛逼了已经,

当然,不足和提升空间还是有的,

比如音效目前还不是原生音效,

配的音效也聊胜于无,

人物不能说话,

当然这些都是对标的VEO3,

但是,这肯定是个时间问题,

希望下次更新可以解决,

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

    暂无评论内容