谷歌 Gemini 2.0 Flash Experimental 发布!让普通人“有嘴就能作图”的AI绘画新王诞生了!

谷歌这把放大了!

时隔两个月之后,推出了Gemini 2.0 Flash Experimental生成图片的公开预览版

图片

先说总结,AI绘画界的新王要诞生了!

图片

这不就是等于一下掀了好几家的饭碗?

官方给了4个案例,先来一起看下效果。

4大示例

图文结合

讲故事,它会配图片,全程保持人物和场景一致。你给它反馈,这模型能重讲这个故事,或者改改画图的风格 。

一致性是目前最麻烦的,这块功能Midjourney是铁废物一个,其他几家也没看出来谁家特别好。

这个功能如果真的完善,做儿童绘本是一点问题没有,还能搞视频。

对话式图像编辑

用聊天的方式直接修改图片,类似于之前dalle那种感觉。

这个功能想象空间就相当大了,直接“用嘴做图”了,其他工具的废物点是无法确切了解你的意思,你说东,它出西。

不只是做家装图了,什么图都能直接用嘴改。

对世界有认知

它能运用各种大家知道的常识,还能更好地思考分析,来画出合适的图片。看着跟真的一样的图,比如给菜谱配个图啥的,它就特别拿手。

这就有点agent的味了喔,以后图文做菜这块可有的玩了,人人都能做美食博主,太适合拿来打矩阵了。

文本呈现

大多数图像生成的工具,要准确地把一大串文字画到图片里太难了,经常拼错。Gemini 2.0 Flash 在文本呈现的能力更强。

别说长文本了,就单独说文本,能生成正确的都没几个,天天抽卡抽个没完。

如果能搞定字,这不就无敌了?长图,海报,短视频,哪个都能用得上了呀。

3月12日,是个值得纪念的日子👇

官网:https://aistudio.google.com/prompts/new_chat

写在最后

现在整体看下来,也太牛了!

如果这几个功能结合在一起使用,直接就不得了了,融合多个AI绘画工具的优点于一身。

随便一个会打字的普通人都能用,这不就人人都是设计师?

明天我会做个实际测试,看下效果是否如它展示的这么好,已经被之前几个工具搞怕了,hello kitty变猫妖的程度。

不过如果测试效果特别好的话,各行设计师还是尽快想想新出路吧,现在就去做金字塔顶端的人也是个好路子。

真不知道,以后人类还能干点什么。

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

    暂无评论内容