我用AI三分钟生成爆款播客，电台主持人看完坐不住了-课多多

嘿，朋友们！前几天刚和大家显摆了用 AI 捣鼓古诗短视频的成果，效果还不错：

但马上一堆“懒癌晚期”的同学就发来灵魂拷问：“四步还是太麻烦，能不能搞个全自动的，最好是‘指令一响，黄金万两’那种？”

为了满足大家对“懒人福音”的极致追求，我可是把各种方法都试了一遍：从即梦+DeepSeek 的“传统手艺”，到 Manus，再到最近风头正劲的天工超级智能体。

讲真，目前各家 AI 视频工具在“一致性”这个老大难问题上，都还有很长的路要走。

即梦+DeepSeek 的组合，虽然可控性稍强，但人物和场景的连贯性依然是个挑战。

而天工超级智能体呢？主打一个“方便”，一条指令下去，坐等 20 分钟，一个 1 分钟的视频就出炉了。听着很美是不是？但遗憾的是，一致性问题依旧没解决，甚至……可以说还不如即梦+DeepSeek 精调的效果。Manus直接出不了结果

就看《视频王者谷歌VEO3》能否解决了

不信？这就带你瞅瞅！

“AI 牛马”天工超级智能体，视频生成初体验

可能有些同学对天工超级智能体还不熟悉，它上周刚发布，我在《天选打工人，你们的“AI 牛马”终于来了》里有过介绍。

✨ 五大智能体模式：

做 PPT 确实是一把好手，其他几个智能体也各有千秋，之后有机会再细聊。

这次咱们重点体验的是它的通用模式，用它来挑战古诗短视频制作。

想尝鲜的同学，可以复制以下链接（点击“阅读原文”直达，使用邀请码注册天工：

https://www.tiangong.cn/login?invite_code=87ca1e0b19bbfbe3bd5fd2a08f9e6239

（新用户有 7500 点体验额度，每天还会送 3000 点，凑合凑合，1 万点做一个短视频勉强够）

操作流程很简单：选定“通用模式”，然后甩出我们的指令：

"我想做一个视频介绍中国古诗，你帮我根据古诗《过故人庄》生成视频，人物、风格要统一，另外提供口播脚本用于视频解说"

天工的回应也相当自信：“你的问题已成功接收，天工即将梳理思路，为你呈现全面且精准的答案。” 听起来很靠谱！

接着，它就开始调用一堆内部模块（MCP）吭哧吭哧干活了，边干活还边给你汇报工作进度：

结果揭晓：方便是真方便，翻车也是真翻车

一番等待后，视频终于生成。喏，就是下面这个效果：

大家可以清楚地看到，单拎出每一帧画面，其实都还不错，颇有几分意境。但问题就出在“一致性”上

—人物形象、绘画风格、甚至场景元素都在不停“变脸”，说好的“人物、风格要统一”呢？

看来 AI 还没完全领会用户的“圣意”。

更让人肉疼的是价格。这短短 40 秒的视频，消耗了我 1 万 2 千点，折合人民币大概 50 块！虽然用的都是赠送的点数，不过商用起来，这成本……有点感人。

对于厂商来讲，估计这个价格还要亏钱

天工的项目有回放链接，我放到这里，大家斧正：https://tiangong.cn/share/project/1926451357335023616?sid=-YyigbGFmJ&t=

一点猜测与期待

据我猜测，天工目前视频生成可能基于开源模型 wan 进行了微调，但在画面一致性控制上，可能还没来得及做针对性的优化。

就看天工团队后续是否会针对性升级了。

写在最后

好啦，今天的“天工视频初体验”就分享到这里。虽然结果不尽如人意，但也算帮大家踩了个坑。

天工超级智能体已经算是同类中的顶流了，效果尚且如此。想一步到位实现高质量全自动 AI 做视频，梦想和现实目前看还有一段距离。

不过，未来两年肯定是类似超级智能体的天下！

文章版权归作者所有，未经允许请勿转载。

THE END