逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)

  开源又更新,不愧是阿里源爹。

  这次更新的是Wan2.1,且又霸榜Vbench,赶超SORA,这熟悉的感觉又来了。

图片[1]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多

图片[2]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多

  两个开源版本

  这次开源的有14b和1.3b两个版本,来看下区别。

  14B 版本(专业版)

  特点

  复杂运动与物理模拟:擅长生成复杂运动场景,如大规模肢体动作、复杂旋转、动态场景转换等,能够保持运动的流畅性和真实性。准确模拟现实世界的物理规律,如碰撞、反弹等,生成逼真的物体交互。

  多任务支持:支持文本到视频(T2V)、图像到视频(I2V)、视频编辑、文本到图像(T2I)和视频到音频(V2A)等多种任务。支持中英文文字特效生成,能够直接生成中文文字,适用于广告、短视频等领域。

  风格多样化:支持多种艺术风格,如卡通、电影风格、3D 风格、油画、古典等。

  影院级别画质:提供类似电影的视觉效果,具有丰富的纹理和多样化的风格化特效。

  适用场景

  影视制作:用于生成复杂场景和特效,降低制作成本和时间。

  广告营销:根据品牌特点定制创意广告视频。

  虚拟角色与动画制作:支持复杂角色动作和场景设计。

  1.3B 版本(极速版)

  特点

  低资源需求:仅需 8.2GB 显存即可运行,可在消费级 GPU(如 RTX 4060/4090)上生成 480P 视频。适合本地部署和消费级硬件用户,大大降低了使用门槛。

  高效推理性能:在 RTX 4090 上,生成 5 秒的 480P 视频仅需约 4 分钟。

  多功能支持:支持文生视频、图生视频、视频编辑、文生图和视频生音频等多种任务。支持中英文文字特效生成。

  高性价比:适合二次开发和学术研究,用户可以在本地低成本部署。

  语义理解和物理表现:尽管模型较小,但在语义理解、物理真实性和复杂运动的表现上依然出色。

  适用场景

  个人创作者:适合在消费级硬件上进行快速创作,适合短视频、社交媒体等领域。

  学术研究:低资源需求使其成为学术研究和二次开发的理想选择。

  教育与培训:制作生动的教学视频和动画课件。

  猜你想要的地址👇

  Huggingface:https://huggingface.co/Wan-AI

  GitHub:https://github.com/Wan-Video/Wan2.1

  测试效果

图片[3]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多

  官网地址:https://tongyi.aliyun.com/wanxiang/

  接下来做几个方向的测试,其实感觉上一代的版本也不错。

  我就直接在官网做测试了,签到登录给50积分,反馈、投稿、用APP创作都可以获得积分,做一个视频要消耗5积分。总体来说,最少可以玩10多次。

图片[4]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多

  不过目前官网,整个处于瘫痪的状态,建议3-5个小时去检查一下,是否没能顺利生成,尽快点“再次生成”试一下。我已经努力点了两天了,建议先做心理建设。

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

    暂无评论内容