昨晚通义来了个炸弹,
大家都知道了,通义万相wan2.2发布
因为太晚,雪佬要睡觉,就没有测试
(其实是雪佬懒)
今天早上起来,就赶紧爬起来打开万相国内版,
网址如下:
中文官网:https://tongyi.aliyun.com/wanxiang


然后国内版是每天签到得100积分(限时三天)
我就框框一顿测试,
很明显,100积分,对于雪佬这种测试狂人来说,
完全不够,这才哪到哪,
但是,国内版官网又没有付费入口,
无奈,雪佬只能转战国外,
网址如下:
英文官网:https://wan.video

打开官网如上图,
怎么开始?
点网站最下面中间的这里就行

选择图生视频或者文生视频,
雪佬今天测试的都是文生视频。
也是回到了梦开始的地方,
话不多说,咱们直接上干货,
3 2 1
第一个视频的第一个镜头提示词:
第二个视频的第一个镜头提示词:
主体: 一只形态完全写实的欧洲刺猬。锚点: 眼神专注,动作模仿专业跳水运动员。
场景: 一个照片级真实的国际跳水锦标赛场馆。灯光明亮,蓝色泳池有真实光影和波纹。观众席为动态模糊的真实人群背景。
核心叙事与运动:
[长焦镜头],一只写实的刺猬站在十米跳台尽头,背景是电子计分牌。它身体紧绷,展现运动员的预备姿态。
[面部特写],它鼻尖微动,调整呼吸,眼神锁定水面。
声音提示: 一声[弹簧音]。
[起跳特写],跳板弯曲、弹起。刺猬向上跃出,动作精准。
[高速摄影机镜头 – 1000fps慢动作],从水下仰拍。刺猬在空中模仿人类运动员翻腾动作:[蜷缩成球形]完成向前翻腾三周半,旋转稳定,姿态标准。
[慢动作结束],切换至水面平视。入水前,身体[瞬间伸展],以背部尖刺为入水点,模仿“压水花”技巧,[垂直入水]。
[极致特写],水面被切开,几乎没有水花,只有一串气泡升起。
[CUT TO:],观众席爆发出[掌声与欢呼声]。镜头扫过真实人群的兴奋面孔。计分牌显示一排“10.00”分。
美学控制与音效设计:
镜头: 模拟真实体育转播机位,运用[长焦]、[特写]、[高速慢动作]和[水下镜头]。
光线: 模拟场馆专业照明,强调水面反射和刺猬皮毛质感。
音效: 关键音效包括:赛场观众的期待低语和爆发性欢呼;跳板弹起声;干净无声的入水声;刺猬细微的鼻息声。
剪辑: 动静结合,用入水前后的声效反差制造高潮。
第三个视频的第一个镜头提示词:
主体:
A特工: 精悍,冷静。锚点: 战术背心,使用高效近身格斗术。
B特工: 高大,力量型。锚点: 黑色风衣,使用流畅的防御反击技巧。
场景: 狭窄、灯光明暗交替的酒店走廊。混凝土墙壁。
核心叙事与运动:
[手持过肩镜头],从A特工背后开始。B特工挥拳,A特工[侧身闪避],同时[肘击]其肋部。
[镜头跟随A特工的出拳方向 – 轨道运镜],A特工直拳打向B特工面门,镜头被拳风[向前猛推]。B特工[后仰]躲过。
[360°环绕格斗镜头],两人近身缠斗。镜头围绕他们[快速旋转],捕捉肌肉紧绷的细节。
[第一人称POV切换 – A特工视角],被B特工[猛推向墙壁]。[J-CUT: 声音先行],一声闷响。镜头[剧烈震动],瞬间失焦后恢复。
B特工摆拳挥来,A特工[低头闪躲],同时从腰间装备中取出一个金属物体。
[极致特写],这个金属物体在灯光下反射出寒光,A特工反手握住它[向上划去]。
[CUT TO:],B特工后退一步,按住手臂,脸上露出痛苦的表情。两人重新拉开距离,紧张对峙,只剩喘息声。
美学控制与音效设计:
镜头: 全程手持,运用[跟随运动镜头]、[POV]、[360°环绕]。
光线: 利用走廊灯光的明暗交替制造节奏感。
音效:
环境音: 安静走廊的电流嗡鸣声。
核心音: 拳拳到肉、短促有力的击打和格挡声;身体撞击硬质墙壁的沉闷声音。
动作音: 物体从装备中快速取出的摩擦声;尖锐物体划破空气的声音。
生理音: 激烈格斗中的喘息与闷哼声。
剪辑: 快速、凌厉的短镜头剪辑,用[J-CUT]打乱节奏。
好了,以上就是第一个视频的全部提示词,
接下来,咱们继续贴出第二个视频的11个镜头提示词。
第一个镜头提示词:
[感官指令:
V: [固定机位,中景] 纯黑虚空中,一个完美的金色“M”字Logo。它的表面[迅速出现流光],仿佛固态金属在1秒内被激活。
A: [Lib: Abs/Tension/Shimmering_Hum_Buildup] (光泽感嗡鸣声同步增强)。
(1.0 – 4.0秒): 高速流体创世 (核心镜头)
[情感节拍: 丝滑的魔法重构]
[感官指令:
V: “M”字Logo**[无缝地、极快速地溶解]**成一滩旋转的“熔融芝士”金色液体。**这个溶解过程必须丝滑、没有停顿。**
紧接着,这滩金色流体**[不再是狂野的漩涡,而是在一个控制下高速变形]**,如同一位书法家在挥毫:
它先是向上[拉伸],分化出一股深棕色流体,这股流体在空中[瞬间凝固]成两片完美的牛肉饼。
同时,一股绿色流体从中[抽出并编织]成生菜。
金色主体则[优雅地覆盖]在肉饼上,形成融化的芝士和酱汁。
最后,整个流体团的顶部和底部[快速膨胀、定型],变成面包胚,将所有东西完美包裹。
整个过程**一气呵成**,如同一个高速播放的、充满魔力的食谱演示,充满了**丝滑的流动感**。
A: [Signature Sound Design]开始播放:
[流体声]贯穿整个变形过程。
每当一种新食材(牛肉、生菜、芝士)清晰成型时,都会伴随一声[反向魔法风铃声]的点缀。
在牛肉饼最终就位时,加入一声画龙点睛的[短促炙烤声]。
运镜: 摄影机在这3秒内,完成一次[快速但平滑的弧形推近 (Arc Push-in)],从“M”的全景,最终聚焦到正在形成的汉堡的特写。
(4.0 – 5.0秒): 完美的定格
[情感节拍: 终极食欲与品牌印记]
[感官指令:
V: 在第4秒,一个完美的、超写实的巨无霸汉堡[精确地定格]在画面中央,还带着一缕蒸汽。麦当劳Logo
第二个镜头提示词:
[感官指令: V: [从男主角里奥身后,越过他肩膀的过肩镜头(Over-the-Shoulder)] 我们看到女主角克莱尔的脸。她站在对面,站台的风吹动了她的头发和围巾。她只是静静地看着里奥,没有说话。 | A: [环境基底] + [声音指纹: 一阵冷风吹过]。
[剪辑指令: 镜头稳定,时长约2-3秒,建立场景和人物关系。]
[镜头二:女主角的压抑 (正打-特写)]
[情感节拍: 无声的挽留]
[感官指令: V: [切换至克莱尔的正脸特写(Close-up)] 镜头聚焦于她的眼睛。我们能清晰地看到,她的眼眶泛红,泪水在里面【不停地打转、积聚】,但她的下眼睑肌肉紧绷,努力不让眼泪掉下来。一滴泪珠在眼角凝结,像一颗微小的钻石,在站台灯光下闪烁。 | A: [情感音效: 极其微弱的、缓慢而痛苦的心跳声开始响起]。
[剪辑指令: 浅景深,背景中的男主角和站台完全虚化。]
[镜头三:男主角的冷漠 (反打-特写)]
[情感节拍: 残酷的伪装]
[感官指令: V: [切换至里奥的正脸特写(Close-up)] 他的脸上没有任何表情,下颌线紧绷,眼神【刻意地、冷漠地看向别处】,避开了克莱尔的视线。一列火车从他身后的轨道上[呼啸而过],灯光在他的脸上快速掠过,短暂地照亮了他眼中一闪而过的、隐藏极深的痛苦。 | A: [心跳声消失] + [SFX: Lib: Foley/Vehicle/Train_Pass_By_Fast_Whoosh] (火车高速通过的巨大呼啸声,瞬间打破宁静,也象征着他决绝的态度)。`
[剪辑指令: 火车经过时,可以加入轻微的镜头晃动。]
[镜头四:最后的对视 (回到过肩镜头)]
[情感节拍: 终成定局]
[感官指令: V: [切回到最初的、从里奥身后的过肩镜头] 火车驶过,克莱尔依然站在原地。她似乎终于放弃
第三个镜头提示词:
道具描述: 一条鲜红色的、质地轻盈的体操彩带;体操场地中央蓝色的、有弹性的地毯。
场景描述: 一个灯火通明的奥运会体操比赛场馆,背景是虚化的、坐满观众的看台和闪烁的裁判席灯光。
2. 视听风格 (Audio-Visual Style):
视觉风格: 写实, 电影感, 体育竞技, 力量与美的视觉诗, 慢动作与正常速度的交替, 高饱和度。
音效设计: 一段节奏极快、充满爆发力的古典交响乐(如《野蜂飞舞》或现代改编版),运动员完成高难度动作时急促而有力的呼吸声,彩带在空中高速挥舞时发出的“咻咻”破风声,身体与地毯接触时发出的沉稳、有弹性的“砰”声。
3. 摄影执行 (Cinematography):
光线设计: 顶光, 聚光灯 (Spotlight) 牢牢锁定在运动员身上,形成强烈的主体光,边缘光勾勒出肌肉线条。
镜头语言: 低角度仰拍, 特写, 全景。
时间环境: 室内比赛,夜晚。
4. 动态设计 (Dynamics):
核心运动: 安娜完成一个极其高难度的连续动作序列:从一个高速的[原地旋转(Pivot)]开始,无缝衔接一个需要惊人腰腹力量的[后手翻接前空翻],在空中时,她手中的红色带子形成一个完美的螺旋形状。
镜头运动: 一个复杂的[复合运镜]开始:以[低角度]跟随她的旋转,当她起跳时,镜头[猛地向上抬升并做弧形运动(Arcing Pedestal Up)],在空中切换为[极致慢动作],环绕着她和彩带,捕捉肌肉的颤动和彩带的形态。当她落地时,镜头恢复正常速度并切换为[稳固的正面全景],展现她稳稳落地的完美姿态。
第四个镜头提示词:
道具描述: 老旧、参差不齐的空调外机;一辆装满纸箱的货车。
场景描述: 一栋普通城市居民楼的外墙,背景是晴朗的蓝天。
2. 视听风格 (Audio-Visual Style):
视觉风格: 写实, 动作喜剧, 强调连续性的视觉冲击力, 广角镜头。
音效设计: 一段节奏超快的喜剧追逐音乐贯穿始终;伴随着连续的、与画面同步的金属被踩踏的“哐当”声和主角滑稽的“哇啊啊”叫声;最后以一声巨大的、沉闷的“噗”声收尾。
3. 摄影执行 (Cinematography):
光线设计: 日光, 顺光, 保证所有动作清晰可见。
镜头语言: 广角, 俯拍。
时间环境: 白天, 晴天。
4. 动态设计 (Dynamics):
核心运动: 主角从五楼跃下,以极快的速度,交替踩着四楼、三楼、二楼的空调外机,一路连续下坠。过程中,他因为踩滑而有一次身体失去平衡的滑稽摆动,但手忙脚乱地抓住旁边的管道后立刻继续。最后,他从二楼的外机纵身一跃,落入下方的货车纸箱堆中。
镜头运动: 一个【从顶楼开始、垂直向下的高速俯拍跟随镜头 (High-Angle Top-Down Tracking Shot)】,一镜到底,紧紧跟随主角完成整个速降过程。
第五个镜头提示词:
道具描述: 飞溅的火花,因碰撞而变形的侧门金属板,震动的后视镜。
场景描述: 一条专业的赛道,正处于一个高速的长弯道。傍晚时分,赛道旁的轮胎墙和广告牌在高速中变得模糊。
2. 视听风格 (Audio-Visual Style):
视觉风格: 写实, 电影感, 赛车大片, 动态模糊, 低角度拍摄带来的速度感, 高对比度。
音效设计: 两台赛车引擎在高转速下的持续轰鸣声, 轮胎与地面摩擦的尖啸声, 紧张的、心跳般的电子节拍音乐, 金属碰撞时发出的刺耳、沉重的刮擦声和撞击声。
3. 摄影执行 (Cinematography):
光线设计: 日落, 暖色调, 镜头光晕, 侧光照射在车身上形成流动的光带。
镜头语言: 车内驾驶员视角的特写, 紧贴车轮的低角度镜头, 两车并排的中景。
时间环境: 黄昏, 晴天。
4. 动态设计 (Dynamics):
核心运动: 两车高速并排过弯, 赛车B持续向赛车A进行侧面挤压和撞击, 赛车A驾驶员奋力稳住方向盘。
镜头运动: 快速剪辑, 镜头在[车内特写]、[车外低角度]和[航拍中景]之间切换,最后以一个[慢动作]特写结束。
第六个镜头提示词:
[感官指令: V: [固定机位,中景] 亚瑟站在一条普通的城市街道中央,他困惑地停下脚步,抬头望向天空。他周围的世界一切正常。 | A: [环境基底: 正常的城市音效] + [声音指纹: 那种沉重的、不祥的低频共振声开始极微弱地响起,并逐渐增强]。
[剪辑指令: 镜头稳定,营造一种暴风雨前的宁静。]
(1.5s – 3.5s) // 天空坠落
[情感节拍: 现实的崩塌]
[感官指令: V: [镜头切换至亚瑟的过肩视角,跟随他的视线向上看] 天空不是天空。另一条一模一样的街道,被【90度垂直翻转】,如同一个巨大的“盖子”,正在缓缓地向他所在的街道压下。
【关键视觉细节】 上方街道的重力开始失效,汽车、路灯、甚至行人,都如同瀑布般,开始剥离、变形、并向下方(也就是亚瑟的方向)【成片地坠落】。
亚瑟的表情瞬间从困惑变为极度的惊恐,他转身就开始向着镜头方向狂奔。 | A: [声音指指纹: 共振声达到顶峰] + [情感音效: 上方物体坠落的巨大风啸声和人群的恐慌尖叫声开始响起]。
[剪辑指令: 镜头从固定切换为跟随,预示着逃亡的开始。]
(3.5s – 6.0s) // 无尽的卷曲
[情感节拍: 求生的狂奔]
[感官指令: V: [一个紧紧跟随在亚瑟身后的第二人称奔跑镜头] 亚瑟用尽全力、不顾一切地狂奔。
【关键视觉细节】 在他身后,他刚刚站立的街道,如同被一只无形巨手卷起的地毯,开始**【向上、向内卷曲、折叠】**,吞噬着所有的建筑和车辆。柏油路面像布一样被撕裂。
上方坠落的汽车在他身边不远处砸出巨大的坑洞,爆炸的火焰照亮了他惊恐的侧脸。 | A: [情感音效: 所有的声音——共振声、撕裂声、爆炸声、尖叫声——混合成一片震耳欲聋的、世界末日般的噪音交响]。
[剪辑指令: 【斯坦尼康稳定器效果】
第七个镜头提示词:
道具描述: 一根由木棍和浸油破布制成的、燃烧着熊熊火焰的简易火把;墙壁上覆盖着厚厚灰尘的巨大石刻壁画。
场景描述: 一个巨大、幽深、完全黑暗的古代墓室,空气中弥漫着尘土和霉味,石壁上布满看不清的雕刻。
2. 视听风格 (Audio-Visual Style):
视觉风格: 写实, 电影感, 冒险片, 氛围感, 高对比度, 胶片颗粒感
音效设计: 火把燃烧时发出的“噼啪”声, Lara谨慎的脚步声在空旷墓室中的回响, 碎石从墙壁上滑落的细微声音, 当壁画被照亮时响起的、带有神秘感的、悠长的圣咏音乐
3. 摄影执行 (Cinematography):
光线设计: 火光 (作为唯一动态光源), 硬光, 暖色调, 极致的明暗对比 (Chiaroscuro)
镜头语言: 中近景, 仰视角度拍摄, 中心构图
时间环境: 无特定时间,处于与世隔绝的地下空间
4. 动态设计 (Dynamics):
核心运动: Lara小心翼翼地行走, 划燃火柴, 点燃火把, 将火把缓缓举起并靠近墙壁
镜头运动: 固定镜头 (强调空间的压迫感), 缓慢的镜头上摇 (Tilt Up) (跟随火把的光芒移动)
第八个镜头提示词:
道具描述: 骑士身后飘扬的、印有家族徽章的破旧披风;被重剑砍中后,敌人盔甲上迸溅的火花和裂痕;战场上散落的断裂长矛和盾牌。
场景描述: 一个广阔、泥泞、尸横遍野的巨大平原战场。天空阴沉,远处有攻城器械投掷的火球划过天际,形成拖着黑烟的轨迹。数千名士兵在背景中进行着混乱的厮杀。
2. 视听风格 (Audio-Visual Style):
视觉风格: 写实, 史诗战争片, 肮脏美学 (Grimy Aesthetic), 强调物理冲击力, 动态模糊, 慢动作与正常速度的交替。
音效设计: 史诗级的、由管弦乐和战鼓组成的宏大配乐;马蹄踩在泥泞土地上的沉重“噗嗤”声;骑士自己的、透过头盔传出的沉重呼吸声;重剑挥舞时的低沉风啸声和砍中敌人时,金属与骨骼一同碎裂的可怕声响;战场上远处传来的、混杂在一起的喊杀声、惨叫声和兵器碰撞声。
3. 摄影执行 (Cinematography):
光线设计: 阴天光, 自然光, 光线被战场上的硝烟和尘土所散射,形成一种压抑、混沌的氛围。远处火球是唯一的光源点缀。
镜头语言: 广角镜头 (核心), 第二人称跟随视角 (核心)。
时间环境: 白天, 阴天, 战争进行时。
4. 动态设计 (Dynamics):
核心运动: 骑士骑马在混乱的战场中进行一次高速、致命的冲锋,并在移动中连续完成数次砍杀。
镜头运动: 一个关键的、复杂的、模拟无人机飞行的【第二人称复合运镜】。
第九个镜头提示词:
[感官指令: V: [第一人称POV视角,广角镜头] 一个长着利爪的、皮肤苍白的怪物猛地从画面左侧扑来。我的左臂[本能地、肌肉紧绷地向上格挡],粗壮的前臂直接撞上怪物的下颚,将其撞得向后踉跄。 | A: [声音指纹: 一声短促的野兽般低吼] + [SFX: Lib: Foley/Combat/Impact_Flesh_On_Bone_Brutal] (血肉撞击骨骼的野蛮闷响)。`
[剪辑指令: 无剪辑,手持镜头剧烈晃动]
(1.5s – 3.5s) // 右手的毁灭
[情感节拍: 狂怒的挥砍]
[感官指令: V: [镜头随着身体猛地向右旋转] 我的右手紧握着巨斧,以一个从上至下的【毁灭性纵劈】,狠狠地砍在另一个试图从正面攻击的、体型更大的怪物头顶。 [慢动作500%] 斧刃破开头骨,深入躯干,深绿色的粘稠血液和破碎的骨片、脑浆【爆炸般地溅射开来】,瞬间糊满了我的整个视野。 | A: [SFX: Lib: Foley/Combat/Axe_Impact_Flesh_Bone_Gore] (斧头劈入血肉与骨骼的、极其恐怖的复合碎裂声) + [SFX: 怪物临死前被截断的、高频的嘶鸣声]。
[剪辑指令: 慢动作开始时,所有背景音消失,只留下击碎声和嘶鸣声。]
(3.5s – 5.0s) // 视野的清理
[情感节拍: 狂怒的延续]
[感官指令: V: [恢复正常速度] 我的左手[粗暴地抬起],用护腕将视野中粘稠的怪物血液一把抹去,留下一道模糊的血痕。透过血痕,我看到更多扭曲的怪物身影正在从黑暗中涌来。 | A: [SFX: Lib: Foley/Liquid/Wipe_Viscous_Liquid] (擦去粘稠液体的声音) + [情感音效: 失真的心跳声再次变得清晰、急促] + [远处怪物群的咆哮声越来越近
第十个镜头提示词:
[感官指令:
V: [Extreme close-up] 镜头是程序员[布满血丝的眼睛]的特写。瞳孔中,无数行混乱、破碎、快速滚动的代码和故障图形[高速闪现、叠加],形成一个令人眩晕的数字漩涡。整个画面[高频抖动+Glitch故障特效]。
A: [Lib: Abs/Tension/Digital_Glitch_Overload] (混乱的数字音效达到顶峰)。
(2.5 – 3.0秒): 冰霜的介入
[情感节拍: 秩序的奇点]
[MATCH CUT: 眼睛中混乱的代码漩涡 → 一杯瑞幸冰咖啡中,冰块与咖啡形成的漩涡]
[感官指令:
V: [极致微距+慢动作1000%] 镜头聚焦于一杯晶莹剔透的瑞幸冰咖啡。一颗冰块[缓慢旋转],咖啡液在它周围形成优美的、有序的棕色流体。杯壁上凝结着细密的[冰霜水珠]。画面极致稳定、干净。
A: [J-CUT: 声音先行] 在画面切换前0.1秒,所有混乱音效**[瞬间切断]**,进入[Lib: Abs/Epiphany/Silence_Sudden_Deep] (绝对寂静)。
(3.0 – 4.5秒): 宇宙的重启
[情感节拍: 瞬间的清醒]
[感官指令:
V: 镜头[Slow Zoom out],展现那只干净、修长的手优雅地拿起这杯咖啡,凑到嘴边。背景是纯黑或纯白,极简主义。
A: (持续的绝对寂静)。
(4.5 – 5.0秒): 品牌印记
[感官指令:
V: 画面中央出现瑞幸咖啡的Logo和Slogan:“luckin coffee”。简洁、有力。
A: [SFX: Lib: Foley/Human/Sip_Crisp_Ice_Coffee] (一声极其清脆、充满质感的吸入声,与Logo同时出现)。
第十一个镜头提示词:
[感官指令:
V: [固定机位,中景] 镜头位于一个极简但色调冰冷、压抑的灰色空间(象征办公室或地铁站)。一个穿着灰色西装的上班族,[面无表情地、机械地向前行走]。整个画面的饱和度极低。
A: [Lib: Abs/Tension/Silence_Oppressive] (压抑的寂静,只有[Lib: Foley/Human/Footsteps_Heavy_Dull]沉闷的脚步声)。
(2.0 – 4.5秒): 穿越光之门
[情感节拍: 瞬间的释放与治愈]
[感官指令:
V: 当他走到画面中央时,他[径直穿过]一个由纯粹金色光芒构成的、巨大的麦当劳“M”字拱门。**[这是一个关键的特效镜头]**。在他穿过“M”门的瞬间,发生以下**同步**变化:
他身上的灰色西装,[瞬间色彩反转]变为色彩鲜艳的休闲装。
他空洞的表情,[瞬间绽放出灿烂、真实的笑容]。
他手中凭空出现一个麦当劳餐盘,上面放着汉堡和薯条。
背景的灰色空间,[瞬间被一个温暖、热闹、坐满欢笑人群的麦当劳餐厅场景所取代]。
整个画面的饱和度和色温[瞬间提升],变得明亮、温暖。
A: [J-CUT] 在他身体接触到“M”门的瞬间,压抑的寂静被**[瞬间爆发]**的欢乐声音所取代:[温暖的背景音乐] + [人群的欢笑声] + [滋滋作响的烹饪声].
(4.5 – 5.0秒): 品牌印记
[感官指令:
V: 画面定格在他灿烂笑容的特写上,背景是温暖的麦当劳餐厅。右下角出现麦当劳Logo和Slogan。
A: 所有背景音淡出,只留下麦当劳经典的“ba da ba ba ba”音效,作为声音图章。
好了,以上是两个视频的全部提示词,已经发送完毕。
最后说下雪佬的测试感想,
1、大家应该能从视频里看到,
通义万相wan2.2这个新模型,
运动这块已经非常不错了,
可以看第二个视频那个艺术体操动作,
人物旋转的动作非常的丝滑,完成的很完美,
而且人物肢体没有崩掉,
相信测试过很多的老司机们一定深有体会,
武打动作和这种艺术体操或者杂技动作,是最难的。
这里我在单独的贴一下这个艺术体操镜头,
大家可以再看下
在5秒钟这么短的时间内,完成的很丝滑和完美,
这个镜头一出来是震撼到我了。
还有一个镜头,我觉得也不错,
老司机们应该会了解,
正反打镜头也是AI视频的重灾区,
因为大多数情况下,好多模型表现不出来,
属于死磕你会死的更惨的镜头,
但是,wan2.2这条,我个人认为还很不错,
我也贴在下面
还有一个镜头,是有点瑕疵,
但是,我个人感觉运镜这块,也很不错,
当然,众所周知,通义运镜一直很顶,
我也贴在下面
还有一个镜头,营造的氛围我觉得最牛逼,
我也贴在下面,大家看一下
还有一个赛车镜头我觉得也不错,虽然也是有瑕疵,
视频如下:
总体来说,通义这次更新,在动作这块,是蛮惊喜的,
一个开源模型,能做到可以和闭园模型打一打的程度,
很牛逼了已经,
当然,不足和提升空间还是有的,
比如音效目前还不是原生音效,
配的音效也聊胜于无,
人物不能说话,
当然这些都是对标的VEO3,
但是,这肯定是个时间问题,
希望下次更新可以解决,
暂无评论内容