逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)

开源又更新,不愧是阿里源爹。

这次更新的是Wan2.1,且又霸榜Vbench,赶超SORA,这熟悉的感觉又来了。

图片
图片

两个开源版本

这次开源的有14b和1.3b两个版本,来看下区别。

14B 版本(专业版)

特点
  1. 复杂运动与物理模拟:擅长生成复杂运动场景,如大规模肢体动作、复杂旋转、动态场景转换等,能够保持运动的流畅性和真实性。准确模拟现实世界的物理规律,如碰撞、反弹等,生成逼真的物体交互。
  2. 多任务支持:支持文本到视频(T2V)、图像到视频(I2V)、视频编辑、文本到图像(T2I)和视频到音频(V2A)等多种任务。支持中英文文字特效生成,能够直接生成中文文字,适用于广告、短视频等领域。
  3. 风格多样化:支持多种艺术风格,如卡通、电影风格、3D 风格、油画、古典等。
  4. 影院级别画质:提供类似电影的视觉效果,具有丰富的纹理和多样化的风格化特效。
适用场景
  1. 影视制作:用于生成复杂场景和特效,降低制作成本和时间。
  2. 广告营销:根据品牌特点定制创意广告视频。
  3. 虚拟角色与动画制作:支持复杂角色动作和场景设计。

1.3B 版本(极速版)

特点
  1. 低资源需求:仅需 8.2GB 显存即可运行,可在消费级 GPU(如 RTX 4060/4090)上生成 480P 视频。适合本地部署和消费级硬件用户,大大降低了使用门槛。
  2. 高效推理性能:在 RTX 4090 上,生成 5 秒的 480P 视频仅需约 4 分钟。
  3. 多功能支持:支持文生视频、图生视频、视频编辑、文生图和视频生音频等多种任务。支持中英文文字特效生成。
  4. 高性价比:适合二次开发和学术研究,用户可以在本地低成本部署。
  5. 语义理解和物理表现:尽管模型较小,但在语义理解、物理真实性和复杂运动的表现上依然出色。
适用场景
  1. 个人创作者:适合在消费级硬件上进行快速创作,适合短视频、社交媒体等领域。
  2. 学术研究:低资源需求使其成为学术研究和二次开发的理想选择。
  3. 教育与培训:制作生动的教学视频和动画课件。

猜你想要的地址👇

  • Huggingface:https://huggingface.co/Wan-AI
  • GitHub:https://github.com/Wan-Video/Wan2.1

测试效果

图片

官网地址:https://tongyi.aliyun.com/wanxiang/

接下来做几个方向的测试,其实感觉上一代的版本也不错。

我就直接在官网做测试了,签到登录给50积分,反馈、投稿、用APP创作都可以获得积分,做一个视频要消耗5积分。总体来说,最少可以玩10多次。

图片

不过目前官网,整个处于瘫痪的状态,建议3-5个小时去检查一下,是否没能顺利生成,尽快点“再次生成”试一下。我已经努力点了两天了,建议先做心理建设。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

    暂无评论内容