谷歌这把放大了!
时隔两个月之后,推出了Gemini 2.0 Flash Experimental生成图片的公开预览版

先说总结,AI绘画界的新王要诞生了!

这不就是等于一下掀了好几家的饭碗?
官方给了4个案例,先来一起看下效果。
4大示例
图文结合
讲故事,它会配图片,全程保持人物和场景一致。你给它反馈,这模型能重讲这个故事,或者改改画图的风格 。
一致性是目前最麻烦的,这块功能Midjourney是铁废物一个,其他几家也没看出来谁家特别好。
这个功能如果真的完善,做儿童绘本是一点问题没有,还能搞视频。
对话式图像编辑
用聊天的方式直接修改图片,类似于之前dalle那种感觉。
这个功能想象空间就相当大了,直接“用嘴做图”了,其他工具的废物点是无法确切了解你的意思,你说东,它出西。
不只是做家装图了,什么图都能直接用嘴改。
对世界有认知
它能运用各种大家知道的常识,还能更好地思考分析,来画出合适的图片。看着跟真的一样的图,比如给菜谱配个图啥的,它就特别拿手。
这就有点agent的味了喔,以后图文做菜这块可有的玩了,人人都能做美食博主,太适合拿来打矩阵了。
文本呈现
大多数图像生成的工具,要准确地把一大串文字画到图片里太难了,经常拼错。Gemini 2.0 Flash 在文本呈现的能力更强。
别说长文本了,就单独说文本,能生成正确的都没几个,天天抽卡抽个没完。
如果能搞定字,这不就无敌了?长图,海报,短视频,哪个都能用得上了呀。
3月12日,是个值得纪念的日子👇
官网:https://aistudio.google.com/prompts/new_chat
写在最后
现在整体看下来,也太牛了!
如果这几个功能结合在一起使用,直接就不得了了,融合多个AI绘画工具的优点于一身。
随便一个会打字的普通人都能用,这不就人人都是设计师?
明天我会做个实际测试,看下效果是否如它展示的这么好,已经被之前几个工具搞怕了,hello kitty变猫妖的程度。
不过如果测试效果特别好的话,各行设计师还是尽快想想新出路吧,现在就去做金字塔顶端的人也是个好路子。
真不知道,以后人类还能干点什么。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容