AI视频市场已变天!即梦新模型让人人都能玩得起AI大片?

最近, AI 视频圈最炸裂的新闻,毫无疑问是可灵2.0视频模型发布,其技术“大幅领先”的态势,已然压得一众竞争对手无话可说,其价格也让诸多 C 端用户望而却步,也会渐行渐远。

就在可灵2.0发布的时间前后,坊间悄然传出即梦 AI 的视频模型——Seaweed-7B(版本号待定)。

图片

下面是官方视频展示效果:

AI视频的“黄金时代”与“算力魔咒”

从 OpenAI 的 Sora 的画大饼开局,到可灵1.0的实打实落地,到 Google 的 Veo2 和 Runway Gen-4 等等,直到最新的 AI 视频模型可灵2.0的发布,AI 生成视频的惊艳效果一次次刷新我们的认知边界。

只需寥寥数语或一张图片,AI 便能“执导”出一段视觉大片,无论是宇航员漫步异星街头,还是海龟畅游碧蓝深海🐢,这无疑是草根创作者梦寐以求的“魔法棒”🪄。

然而,施展这“魔法”的代价却异常高昂 💸。顶级视频模型的训练,动辄需要调动成千上万块尖端 GPU,吞噬着海量的计算资源与能源,形成一道令人望而却步的“算力高墙”。

难道这场激动人心的技术革命,注定只是少数巨头的专属盛宴?高昂的成本是否会扼杀更广泛的创新与应用?

可灵2.0已经给出了答案,100积分=5秒视频,即:成本10元人民币。同时也意味着, AI 视频生成领域新的时代拉开帷幕。

图片

Seaweed-7B 告别算力焦虑,以“巧”破局

正当行业被“算力魔咒”所困扰时,字节跳动 Seed 团队带来了一股清新而强大的“海草”风暴——Seaweed-7B 视频生成基础模型。这里的“7B”代表其拥有约 70 亿参数,相较于业界动辄千亿参数的“巨兽”,它显得格外“小巧玲珑”。

更引人注目的是其训练成本效益。Seaweed-7B 的训练仅耗费约 66.5 万个 H100 GPU 小时。这是什么概念?相当于用 1000 块顶级 GPU 连续运行不到一个月。这虽然仍是巨大投入,但相比那些需要数倍乃至数十倍资源的庞大模型,Seaweed-7B 无疑展示了以小博大的潜力与智慧 ,证明了高效并非只能依赖无限堆料。

以“小”胜“大”

“小模型”是否意味着性能的妥协?Seaweed-7B 用官网展示的生动实例和实打实的评测数据给出了响亮的否定答案!

图生视频排名
图生视频排名

数据来源参见论文:Seaweed-7B: Cost-Effective Training of
Video Generation Foundation Model[1]

  • • 顶尖性能: 在一系列严苛的对比测试中,特别是在用户需求旺盛的“图生视频”(Image-to-Video)任务上 🖼️➡️🎥,Seaweed-7B 在权威的人类评估平台 MagicArena 上力压群雄,高居第二。即便在技术门槛更高的“文生视频”任务 ✍️➡️🎬 中,它也稳稳占据第一梯队。
  • • 视觉效果拔群: 官网[2]展示的视频,无论是天使挥舞翅膀的光影 👼,狗狗奔跑的生动姿态 🐕,还是赛车飞驰的动感 🏎️,都展现了极高的视觉保真度、美学质量和流畅自然的运动
  • • 极致推理效率: 相较于公开数据的某 14B 模型,经过优化的 Seaweed-7B 在生成视频时速度快了惊人的 62 倍 🚀⏱️!这意味着从指令输入到视频输出,用户几乎无需漫长等待,极大地提升了使用体验,为实时交互应用打开了大门。

精打细算的“四大法宝”

Seaweed-7B 在有限资源下对每个环节的精妙设计与极致优化,堪称“巧实力”的典范:

  1. 1. 高质量数据基石:“精料”胜于“海量” 💎🧹
    • • 严格的“食材筛选”与“营养搭配”。
    • • 引入“合成数据” 🤖 强化物理规律理解。
    • • 精准“语义导航” 🧭 确保精确执行用户意图。
  2. 2. 高效编解码器 VAE:“压缩艺术家”与“画质守门员” 📦✨
    • • 创新的 3D VAE 架构,兼顾效率与质量。
    • • 找到 64 倍压缩率的最佳平衡点。
    • • 混合分辨率训练 🖼️ 赋予强大的泛化能力。
  3. 3. 强劲生成引擎 DiT:“混合动力”与“全景视野” 🧠👁️
    • • 采用“混合流”(Hybrid-Stream)DiT 架构加速收敛。
    • • 优先使用“全注意力”,捕捉全局依赖。
    • • 引入多模态旋转位置编码(MM-ROPE),增强时空理解。
  4. 4. 科学训练与调优:“分段进阶”与“精雕细琢” 🌱➡️🌳
    • • 多阶段预训练,循序渐进。
    • • 通过监督微调(SFT)和直接偏好优化(DPO)进行“毕业后深造” 👨‍🏫👍👎,确保视觉效果与动作流畅。

小模型大生态

作为一款强大的基础模型,Seaweed-7B 展现了卓越的下游任务适应性。通过轻量级微调或继续训练,它可以被广泛应用于核心创作需求、高分辨率输出,并具备向可控编辑、长视频、实时合成、特定控制生成等方向拓展的潜力。

图片

结语:竞速与普及,AI视频的多元未来

AI视频生成竞赛白热化⚡️!快手可灵2.0 的发布重新确立了新标杆👑,这让字节的即梦AI Seaweed-7B 面临着差异化挑战。

面对可灵AI等强敌,即梦AI(Seaweed-7B)的策略是避开性能“军备竞赛”,聚焦将技术以更普惠、实用的方式带给大众。这不是退让,而是清晰的战略选择:让AI视频创作赋能大众,而非少数人专利。

最后,敬请期待即梦 AI 新的视频模型发布。

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发

    暂无评论内容