可灵进入2.0时代,全系模型更新,但把大部分人拒之门外

昨天值得说的有两件事。

1、可灵2.0全系模型更新,图片和视频生成质量大幅提升,而且增加了多模态编辑功能。

2、智谱开源了6款高性能的GLM模型,刷新商业模型最快速度,推理速度可达200 tokens/秒。

一、可灵进入2.0时代

省流版总结:

1、可灵2.0视频模型:语义理解更强,动作响应更强,镜头运功更好,复杂的动作质量也更好(尤其是一些高速度运动),画面美感也有提升,人物的表情等细节也更丰富。

2、可图2.0图片模型:语义理解更好,画面质感提升,对于风格化的生成更强, 新增了图片的风格转绘功能。

3、视视频多模态编辑功能:新增了可以直接替换、增加、删减视频中的元素的功能。

整体来说就是一句话:很强,非常强,强到没有对手。

忍痛生成了一个demo,大家可以看一下效果:

图片:工笔画风格,中景镜头,李白上半身正面面对镜头,手中举着杯子,背景是亭子

img

视频:李白转过头面对镜头,然后举杯饮酒

大家不要问为什么不多做一些测试,葉子只能回答:不配,太穷。

可灵2.0确实强大,不论从任何方面来说,都是目前的T0级别的AI视频模型。

但是价格也相当感人,一次5秒需要100灵感值。相当于10元5秒。一个黄金会员每月只能出7条视频。

img

这次更新直接淘汰了大部分普通用户,成为了大模型界的GPT,基本面对的就是B端。

大家看看就好,不是很建议使用,因为效果确实是好,但也确实是贵。

二、智谱开源六大模型

再返回来看一下智谱,直接发布了新一代开源模型GLM-4-32B-0414系列,并启用全新域名”z.ai”,向全球用户免费开放使用。

而且已在北京证监局办理辅导备案,辅导机构为中国国际金融股份有限公司,标志着”大模型六小虎”中首个IPO正式启动。

是不是对比一看智谱更亮眼了。

上月底智谱刚发布了一个很NB的产品:AutoGLM沉思。葉子也写过相关的文章,效果很亮眼。

这个月就又开源了六款模型。

简单说明:

1、开源的为 32B/9B 系列 GLM 模型,包括基座、推理和沉思三类模型。

2、全部采用 MIT 许可协议,完全开源,不限制商用,无需任何申请。

3、启用了全新域名 z.ai,目前该平台整合了 32B 基座、推理、沉思三类 GLM 模型。

4、国内第一家正式启动 IPO 流程的「大模型六小龙」。

反正对比起来,更喜欢开源的智谱,而不是用不起的可灵2.0。

希望下一家AI视频公司,能给我们这些贫穷的AI视频爱好者更多一些选择,而不是被价格默默淘汰。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

    暂无评论内容