嘿,朋友们!前几天刚和大家显摆了用 AI 捣鼓古诗短视频的成果,效果还不错:
但马上一堆“懒癌晚期”的同学就发来灵魂拷问:“四步还是太麻烦,能不能搞个全自动的,最好是‘指令一响,黄金万两’那种?”
为了满足大家对“懒人福音”的极致追求,我可是把各种方法都试了一遍:从即梦+DeepSeek 的“传统手艺”,到 Manus,再到最近风头正劲的天工超级智能体。
讲真,目前各家 AI 视频工具在“一致性”这个老大难问题上,都还有很长的路要走。
即梦+DeepSeek 的组合,虽然可控性稍强,但人物和场景的连贯性依然是个挑战。
而天工超级智能体呢?主打一个“方便”,一条指令下去,坐等 20 分钟,一个 1 分钟的视频就出炉了。听着很美是不是?但遗憾的是,一致性问题依旧没解决,甚至……可以说还不如即梦+DeepSeek 精调的效果。Manus直接出不了结果
就看《视频王者谷歌VEO3》能否解决了
不信?这就带你瞅瞅!
“AI 牛马”天工超级智能体,视频生成初体验
可能有些同学对天工超级智能体还不熟悉,它上周刚发布,我在《天选打工人,你们的“AI 牛马”终于来了》里有过介绍。

✨ 五大智能体模式:
-
文档/PPT/表格(专家模式) -
网页模式 -
通用模式(视频生成用这个)
做 PPT 确实是一把好手,其他几个智能体也各有千秋,之后有机会再细聊。
这次咱们重点体验的是它的通用模式,用它来挑战古诗短视频制作。
想尝鲜的同学,可以复制以下链接(点击“阅读原文”直达,使用邀请码注册天工:
https://www.tiangong.cn/login?invite_code=87ca1e0b19bbfbe3bd5fd2a08f9e6239
(新用户有 7500 点体验额度,每天还会送 3000 点,凑合凑合,1 万点做一个短视频勉强够)
操作流程很简单:选定“通用模式”,然后甩出我们的指令:
"我想做一个视频介绍中国古诗,你帮我根据古诗《过故人庄》生成视频,人物、风格要统一,另外提供口播脚本用于视频解说"
天工的回应也相当自信:“你的问题已成功接收,天工即将梳理思路,为你呈现全面且精准的答案。” 听起来很靠谱!

接着,它就开始调用一堆内部模块(MCP)吭哧吭哧干活了,边干活还边给你汇报工作进度:


结果揭晓:方便是真方便,翻车也是真翻车
一番等待后,视频终于生成。喏,就是下面这个效果:
大家可以清楚地看到,单拎出每一帧画面,其实都还不错,颇有几分意境。但问题就出在“一致性”上
—人物形象、绘画风格、甚至场景元素都在不停“变脸”,说好的“人物、风格要统一”呢?
看来 AI 还没完全领会用户的“圣意”。
更让人肉疼的是价格。这短短 40 秒的视频,消耗了我 1 万 2 千点,折合人民币大概 50 块!虽然用的都是赠送的点数,不过商用起来,这成本……有点感人。
对于厂商来讲,估计这个价格还要亏钱

天工的项目有回放链接,我放到这里,大家斧正:https://tiangong.cn/share/project/1926451357335023616?sid=-YyigbGFmJ&t=
一点猜测与期待
据我猜测,天工目前视频生成可能基于开源模型 wan 进行了微调,但在画面一致性控制上,可能还没来得及做针对性的优化。
就看天工团队后续是否会针对性升级了。
写在最后
好啦,今天的“天工视频初体验”就分享到这里。虽然结果不尽如人意,但也算帮大家踩了个坑。
天工超级智能体已经算是同类中的顶流了,效果尚且如此。想一步到位实现高质量全自动 AI 做视频,梦想和现实目前看还有一段距离。
不过,未来两年肯定是类似超级智能体的天下!
暂无评论内容