豆包又又更新了,如果你现在打开豆包可以看到下面界面中的智能升级Beta。
恭喜你,你被豆包最新的图片生成功能灰度到了。

这也是豆包最新的图片生成功能,完全可以对标GPT-4o。
省流版功能介绍:
1、单次生图20张。
可以通过提示词的描述,让豆包一次性生成最多20张图片。通过连续对话可以生成更多。
2、连续性多图生成功能。
可以把分镜图/故事/绘本等内容,一次性生成20张以内的图片,并可以一定程度的保持人物、场景、风格的一致性。
3、语义理解大幅度增强。
即使非常简单的提示词,豆包也可以深度理解我们要表达的意图,生成符合我们想法的图片。
目前的瑕疵:
1、人物脸部一致性较差。
使用人物作为参考时,生成的一致性较差。
2、个别时候不响应。
有时候多次对话修改,可能不直接生成图片。可以点击技能中的图像生成,保持技能使用中。

下面看一下测试的几个例子:
1、一次生成20张图片。
直接生成了20张不同的建筑图片,并都标注了建筑名字。有些都没听说过。

2、故事性、连续一致性
只用一句提示词,直接把一个故事自动拆解为分镜,并生成相应的图片。同时也保持了风格的一致性。
绘本故事这次真的无敌了。

3、做一道菜并配图
当时Gemini更新的时候,葉子也用过这个作为案例测试。这次也拿来测测豆包。
效果好极了,一点不比Gemini差。

从葉子测试的很多个case来看,豆包这次的更新真的可以说国产大模型又一次新的高峰。
很多方面不输于GPT-4o的图片生成,有些地方还有所超越。当然也有一些不足的地方。但基本和GPT-4o的图片生成功能站在了同一台阶。
两周前,即梦3.0图片模型更新,中文的生成直接给设计行业带来了一次地震和狂欢。
很多人到现在连即梦3.0还没玩明白,现在豆包又带着全新的图片生成模型Beta来了。
用嘴改图、连续生图、人物场景风格一致性,一次生成20张图。
不得不说,单纯的图片生成领域,字节带着豆包和即梦站在了金字塔尖。
而且,最近两天即梦3.0视频生成大模型已经在内测了。
3.0图片模型+3.0视频模型。
这下,豆包真的要高处不胜寒了。
暂无评论内容