豆包图像生成又更新了,一次生成20张图,还能保持一致性

豆包又又更新了,如果你现在打开豆包可以看到下面界面中的智能升级Beta。

恭喜你,你被豆包最新的图片生成功能灰度到了。

img

这也是豆包最新的图片生成功能,完全可以对标GPT-4o。

省流版功能介绍:

1、单次生图20张。

可以通过提示词的描述,让豆包一次性生成最多20张图片。通过连续对话可以生成更多。

2、连续性多图生成功能。

可以把分镜图/故事/绘本等内容,一次性生成20张以内的图片,并可以一定程度的保持人物、场景、风格的一致性。

3、语义理解大幅度增强。

即使非常简单的提示词,豆包也可以深度理解我们要表达的意图,生成符合我们想法的图片。

目前的瑕疵:

1、人物脸部一致性较差。

使用人物作为参考时,生成的一致性较差。

2、个别时候不响应。

有时候多次对话修改,可能不直接生成图片。可以点击技能中的图像生成,保持技能使用中。

img

下面看一下测试的几个例子:

1、一次生成20张图片。

直接生成了20张不同的建筑图片,并都标注了建筑名字。有些都没听说过。

img

2、故事性、连续一致性

只用一句提示词,直接把一个故事自动拆解为分镜,并生成相应的图片。同时也保持了风格的一致性。

绘本故事这次真的无敌了。

img

3、做一道菜并配图

当时Gemini更新的时候,葉子也用过这个作为案例测试。这次也拿来测测豆包。

效果好极了,一点不比Gemini差。

img

从葉子测试的很多个case来看,豆包这次的更新真的可以说国产大模型又一次新的高峰。

很多方面不输于GPT-4o的图片生成,有些地方还有所超越。当然也有一些不足的地方。但基本和GPT-4o的图片生成功能站在了同一台阶。

两周前,即梦3.0图片模型更新,中文的生成直接给设计行业带来了一次地震和狂欢。

很多人到现在连即梦3.0还没玩明白,现在豆包又带着全新的图片生成模型Beta来了。

用嘴改图、连续生图、人物场景风格一致性,一次生成20张图。

不得不说,单纯的图片生成领域,字节带着豆包和即梦站在了金字塔尖。

而且,最近两天即梦3.0视频生成大模型已经在内测了。

3.0图片模型+3.0视频模型。

这下,豆包真的要高处不胜寒了。

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

    暂无评论内容