刚忙完,刷个手机的工夫,一条消息直接把我震懵了。
通义万相又发布2.1新模型了!
![图片[1]-阿里AI视频炸裂更新!通义万相能动态书写汉字了(含实测效果)直登VBench榜首-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/1-50.jpg)
甚至以84.70%的总分登顶VBench榜首,超越了Gen-3等顶尖模型。
怎么AI视频一开年又开始卷起来了?据说这次的模型实用性直接拉满!就说处理复杂运动吧,那叫一个6,能把那些复杂的动作处理得跟真的一样。还原真实物理规律也不含糊,让画面看起来更真实,更有质感。影视质感这块儿更是提升了一大截,感觉比以前的版本高级多了。还有优化指令遵循,它现在能更精准地按照咱们的要求来,用起来贼顺手!
真的假的?这也太猛了吧!让我赶紧测一下效果。
![图片[2]-阿里AI视频炸裂更新!通义万相能动态书写汉字了(含实测效果)直登VBench榜首-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/2-41.jpg)
两种模式生成时间几乎没有区别,2.1专业在6分钟左右,2.1极速在4分钟左右选择视频音效,还可以直接帮视频配音,目前还属于玩具的状态中。同时,可以用自带的智能扩写来完成一个丰富的描述词
![图片[3]-阿里AI视频炸裂更新!通义万相能动态书写汉字了(含实测效果)直登VBench榜首-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/3-38.jpg)
实测效果
总体来说,目前一天可以免费测试用几次的话,这个质量属于不错了,抽卡情况无法避免,总体来说还是可以正确理解提示词的,专业模式出来的效果比极速模式明显好很多。
文字方面:确实可以写中文字
运动人物:四肢协调,没有特别夸张的错误,属于比较惊艳了
切开的食物:总体来说表现一般,提示词描绘的内容简单一点会好一些
提示词
猜你一定也想自己测试一下了,这套基础提示词格式直接拿去用,不要太谢我。
提示词=主体+场景+运动
主体:主体是视频内容的主要表现对象,可以是人、动物、植物、植物、物品或非物理真实存在的想象之物。
场景:场景是主体所处的环境,包含背景、前景,可以是物理存在的的真实空间或想象出来的虚构场景
运动:运动包含主体的具体运动和非主体的运动状态,可以是静止、小幅度运动、大幅度运动、局部运动或整体动势。
当然还有进阶版的
提示词=主体(主体描述)+场景(场景描述)+运动(运动描述+镜头语言+氛围词+风格化
主体描述:主体描述是对主体外观特征细节的描述,可通过形容词或短句列举,例如”一位身着少数民族服饰的黑发苗族少女”、”一位来自异世界的飞天仙子,身着破旧却华丽的服饰,背后展开一对由废墟碎片构成的奇异翅膀
场景描述:场景描述是对主体所处环境特征细节的描述,可通过形容词或短句列举
运动描述:运动描述是对运动特征细节的描述,包含运动的幅度、速率和运动作用的效果,例如”猛烈地摇摆”、”缓慢地移动”、”打碎了玻璃
镜头语言:镜头语言包含景别、视角、镜头、运镜等。
氛围词:氛围词是对预期画面氛围的描述,例如”梦幻”、”孤独”,宏伟”
风格化:风格化是对画面风格语言的描述,例如”赛博朋克”、”勾线插画”、”废土风格”
![图片[4]-阿里AI视频炸裂更新!通义万相能动态书写汉字了(含实测效果)直登VBench榜首-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/4-31.jpg)
目前来说,登录还送积分,可以生成10条专业视频,想尝试趁现在。
传送门:https://tongyi.aliyun.com/
最近几个月AI视频纯属于扎堆更新放大招的过程中,用下来目前来说最强大的还是可灵,各方面都是上乘的,只是1.6的非会员已经卡得不出视频了,我跑了一天,居然永远差1分钟,第二天才正式生成。
AI的进化速度实在是太可怕了,原来以为SORA会跑在最前沿,结果现在国产AI视频平台已经在吊打国外的效果了。
不知道之前觉得AI是场华丽骗局的人,是否现在还这么认为。
打不过就赶紧加入吧,新时代真的来了。
暂无评论内容