开源又更新,不愧是阿里源爹。
这次更新的是Wan2.1,且又霸榜Vbench,赶超SORA,这熟悉的感觉又来了。
![图片[1]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/20250516_080136_009.png)
![图片[2]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/20250516_080136_010.png)
两个开源版本
这次开源的有14b和1.3b两个版本,来看下区别。
14B 版本(专业版)
特点
复杂运动与物理模拟:擅长生成复杂运动场景,如大规模肢体动作、复杂旋转、动态场景转换等,能够保持运动的流畅性和真实性。准确模拟现实世界的物理规律,如碰撞、反弹等,生成逼真的物体交互。
多任务支持:支持文本到视频(T2V)、图像到视频(I2V)、视频编辑、文本到图像(T2I)和视频到音频(V2A)等多种任务。支持中英文文字特效生成,能够直接生成中文文字,适用于广告、短视频等领域。
风格多样化:支持多种艺术风格,如卡通、电影风格、3D 风格、油画、古典等。
影院级别画质:提供类似电影的视觉效果,具有丰富的纹理和多样化的风格化特效。
适用场景
影视制作:用于生成复杂场景和特效,降低制作成本和时间。
广告营销:根据品牌特点定制创意广告视频。
虚拟角色与动画制作:支持复杂角色动作和场景设计。
1.3B 版本(极速版)
特点
低资源需求:仅需 8.2GB 显存即可运行,可在消费级 GPU(如 RTX 4060/4090)上生成 480P 视频。适合本地部署和消费级硬件用户,大大降低了使用门槛。
高效推理性能:在 RTX 4090 上,生成 5 秒的 480P 视频仅需约 4 分钟。
多功能支持:支持文生视频、图生视频、视频编辑、文生图和视频生音频等多种任务。支持中英文文字特效生成。
高性价比:适合二次开发和学术研究,用户可以在本地低成本部署。
语义理解和物理表现:尽管模型较小,但在语义理解、物理真实性和复杂运动的表现上依然出色。
适用场景
个人创作者:适合在消费级硬件上进行快速创作,适合短视频、社交媒体等领域。
学术研究:低资源需求使其成为学术研究和二次开发的理想选择。
教育与培训:制作生动的教学视频和动画课件。
猜你想要的地址👇
Huggingface:https://huggingface.co/Wan-AI
GitHub:https://github.com/Wan-Video/Wan2.1
测试效果
![图片[3]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/20250516_080136_011.png)
官网地址:https://tongyi.aliyun.com/wanxiang/
接下来做几个方向的测试,其实感觉上一代的版本也不错。
我就直接在官网做测试了,签到登录给50积分,反馈、投稿、用APP创作都可以获得积分,做一个视频要消耗5积分。总体来说,最少可以玩10多次。
![图片[4]-逆天!阿里通义万相,视频模型Wan2.1开源!登顶Vbench(含实测效果)-课多多](https://www.kedd.cn/wp-content/uploads/2025/05/1-49.jpg)
不过目前官网,整个处于瘫痪的状态,建议3-5个小时去检查一下,是否没能顺利生成,尽快点“再次生成”试一下。我已经努力点了两天了,建议先做心理建设。
暂无评论内容