豆包图像生成又更新了，一次生成20张图，还能保持一致性-课多多

豆包又又更新了，如果你现在打开豆包可以看到下面界面中的智能升级Beta。

恭喜你，你被豆包最新的图片生成功能灰度到了。

这也是豆包最新的图片生成功能，完全可以对标GPT-4o。

省流版功能介绍：

1、单次生图20张。

可以通过提示词的描述，让豆包一次性生成最多20张图片。通过连续对话可以生成更多。

2、连续性多图生成功能。

可以把分镜图/故事/绘本等内容，一次性生成20张以内的图片，并可以一定程度的保持人物、场景、风格的一致性。

3、语义理解大幅度增强。

即使非常简单的提示词，豆包也可以深度理解我们要表达的意图，生成符合我们想法的图片。

目前的瑕疵：

1、人物脸部一致性较差。

使用人物作为参考时，生成的一致性较差。

2、个别时候不响应。

有时候多次对话修改，可能不直接生成图片。可以点击技能中的图像生成，保持技能使用中。

下面看一下测试的几个例子：

1、一次生成20张图片。

直接生成了20张不同的建筑图片，并都标注了建筑名字。有些都没听说过。

2、故事性、连续一致性

只用一句提示词，直接把一个故事自动拆解为分镜，并生成相应的图片。同时也保持了风格的一致性。

绘本故事这次真的无敌了。

3、做一道菜并配图

当时Gemini更新的时候，葉子也用过这个作为案例测试。这次也拿来测测豆包。

效果好极了，一点不比Gemini差。

从葉子测试的很多个case来看，豆包这次的更新真的可以说国产大模型又一次新的高峰。

很多方面不输于GPT-4o的图片生成，有些地方还有所超越。当然也有一些不足的地方。但基本和GPT-4o的图片生成功能站在了同一台阶。

两周前，即梦3.0图片模型更新，中文的生成直接给设计行业带来了一次地震和狂欢。

很多人到现在连即梦3.0还没玩明白，现在豆包又带着全新的图片生成模型Beta来了。

用嘴改图、连续生图、人物场景风格一致性，一次生成20张图。

不得不说，单纯的图片生成领域，字节带着豆包和即梦站在了金字塔尖。

而且，最近两天即梦3.0视频生成大模型已经在内测了。

3.0图片模型+3.0视频模型。

这下，豆包真的要高处不胜寒了。

文章版权归作者所有，未经允许请勿转载。

THE END