逆天！阿里通义万相，视频模型Wan2.1开源！登顶Vbench（含实测效果）-课多多

　　开源又更新，不愧是阿里源爹。

　　这次更新的是Wan2.1，且又霸榜Vbench，赶超SORA，这熟悉的感觉又来了。

　　两个开源版本

　　这次开源的有14b和1.3b两个版本，来看下区别。

　　14B 版本(专业版)

　　特点

　　复杂运动与物理模拟：擅长生成复杂运动场景，如大规模肢体动作、复杂旋转、动态场景转换等，能够保持运动的流畅性和真实性。准确模拟现实世界的物理规律，如碰撞、反弹等，生成逼真的物体交互。

　　多任务支持：支持文本到视频(T2V)、图像到视频(I2V)、视频编辑、文本到图像(T2I)和视频到音频(V2A)等多种任务。支持中英文文字特效生成，能够直接生成中文文字，适用于广告、短视频等领域。

　　风格多样化：支持多种艺术风格，如卡通、电影风格、3D 风格、油画、古典等。

　　影院级别画质：提供类似电影的视觉效果，具有丰富的纹理和多样化的风格化特效。

　　适用场景

　　影视制作：用于生成复杂场景和特效，降低制作成本和时间。

　　广告营销：根据品牌特点定制创意广告视频。

　　虚拟角色与动画制作：支持复杂角色动作和场景设计。

　　1.3B 版本(极速版)

　　特点

　　低资源需求：仅需 8.2GB 显存即可运行，可在消费级 GPU(如 RTX 4060/4090)上生成 480P 视频。适合本地部署和消费级硬件用户，大大降低了使用门槛。

　　高效推理性能：在 RTX 4090 上，生成 5 秒的 480P 视频仅需约 4 分钟。

　　多功能支持：支持文生视频、图生视频、视频编辑、文生图和视频生音频等多种任务。支持中英文文字特效生成。

　　高性价比：适合二次开发和学术研究，用户可以在本地低成本部署。

　　语义理解和物理表现：尽管模型较小，但在语义理解、物理真实性和复杂运动的表现上依然出色。

　　适用场景

　　个人创作者：适合在消费级硬件上进行快速创作，适合短视频、社交媒体等领域。

　　学术研究：低资源需求使其成为学术研究和二次开发的理想选择。

　　教育与培训：制作生动的教学视频和动画课件。

　　猜你想要的地址👇

　　Huggingface：https://huggingface.co/Wan-AI

　　GitHub：https://github.com/Wan-Video/Wan2.1

　　测试效果

　　官网地址：https://tongyi.aliyun.com/wanxiang/

　　接下来做几个方向的测试，其实感觉上一代的版本也不错。

　　我就直接在官网做测试了，签到登录给50积分，反馈、投稿、用APP创作都可以获得积分，做一个视频要消耗5积分。总体来说，最少可以玩10多次。

　　不过目前官网，整个处于瘫痪的状态，建议3-5个小时去检查一下，是否没能顺利生成，尽快点“再次生成”试一下。我已经努力点了两天了，建议先做心理建设。

文章版权归作者所有，未经允许请勿转载。

THE END