昨天值得说的有两件事。
1、可灵2.0全系模型更新,图片和视频生成质量大幅提升,而且增加了多模态编辑功能。
2、智谱开源了6款高性能的GLM模型,刷新商业模型最快速度,推理速度可达200 tokens/秒。
一、可灵进入2.0时代
省流版总结:
1、可灵2.0视频模型:语义理解更强,动作响应更强,镜头运功更好,复杂的动作质量也更好(尤其是一些高速度运动),画面美感也有提升,人物的表情等细节也更丰富。
2、可图2.0图片模型:语义理解更好,画面质感提升,对于风格化的生成更强, 新增了图片的风格转绘功能。
3、视视频多模态编辑功能:新增了可以直接替换、增加、删减视频中的元素的功能。
整体来说就是一句话:很强,非常强,强到没有对手。
忍痛生成了一个demo,大家可以看一下效果:
图片:工笔画风格,中景镜头,李白上半身正面面对镜头,手中举着杯子,背景是亭子

视频:李白转过头面对镜头,然后举杯饮酒
可灵2.0确实强大,不论从任何方面来说,都是目前的T0级别的AI视频模型。
但是价格也相当感人,一次5秒需要100灵感值。相当于10元5秒。一个黄金会员每月只能出7条视频。

这次更新直接淘汰了大部分普通用户,成为了大模型界的GPT,基本面对的就是B端。
大家看看就好,不是很建议使用,因为效果确实是好,但也确实是贵。
二、智谱开源六大模型
再返回来看一下智谱,直接发布了新一代开源模型GLM-4-32B-0414系列,并启用全新域名”z.ai”,向全球用户免费开放使用。
而且已在北京证监局办理辅导备案,辅导机构为中国国际金融股份有限公司,标志着”大模型六小虎”中首个IPO正式启动。
是不是对比一看智谱更亮眼了。
上月底智谱刚发布了一个很NB的产品:AutoGLM沉思。葉子也写过相关的文章,效果很亮眼。
这个月就又开源了六款模型。
简单说明:
1、开源的为 32B/9B 系列 GLM 模型,包括基座、推理和沉思三类模型。
2、全部采用 MIT 许可协议,完全开源,不限制商用,无需任何申请。
3、启用了全新域名 z.ai,目前该平台整合了 32B 基座、推理、沉思三类 GLM 模型。
4、国内第一家正式启动 IPO 流程的「大模型六小龙」。
反正对比起来,更喜欢开源的智谱,而不是用不起的可灵2.0。
希望下一家AI视频公司,能给我们这些贫穷的AI视频爱好者更多一些选择,而不是被价格默默淘汰。
暂无评论内容