兄弟们,谷歌刚刚又发布了一个 AI 做图神器,Nano Banana
图像编辑能力超群,出道即巅峰,闷声不响就干掉了“生图一致性”四大家族
这是一个怎么样神奇的故事?听我给你摆
一、侠起
一切要从几天前 LMArena 平台一位神秘 AI 来客说起
LMArena 是全球最硬核的大模型角斗场,匿名 PK、实时投票,胜者为王。
同一句提示词,两个模型匿名对战,再由用户对生成结果质量投票,投完票两个匿名模型才会显名;网站再根据投票结果,用一系列算法来进行模型排行。
前几天,LMArena 多了一个叫 Nano Banana 的新模型,起初大家不在意,因为这种不出名的 AI 模型太多了,大多还在炼气中期,很多模型来去匆匆
哪知道用着用着,大家发现,这个叫 Nano Banana 的 AI 绘图模型,效果出奇得好
尤其在保持主体一致性上,几乎没有对手,每次都以明显优势获胜
说到主体一致性,这是 AI 做图痛点中的痛点,刚需中的刚需
如何让同一个主角,在不同角度、不同动作、不同妆容、不同服装、不同环境的图片中保持一致性,是过去两年 AI 做图的技术难点。
让一个人整体保持不变并不难,难的是如何让一部分变,一部分不变,所谓“该大的大、该小的小”
为了解决这个问题,最近半年各大 AI 门派练了很多法宝,包括
-
黑森林的 flux-kontext -
字节跳动的 seededit -
GPT-image,言出法随 GPT4o 的底层图像模型 -
千问 qwen-image-edit
个个都身怀绝技
结果让人大跌眼镜,上述一众专门修炼“一致性大法”的炼丹期好手都在 LMArena 平台的对战中,败在 Nano Banana 手下,这是哪里来的结婴期前辈?
全球网友炸了锅,纷纷涌向 LMArena,开始刷屏测试
结果发现,Nano Banana 在理解/遵循/人物/手/肢体/光影/细节/文字/空间关系/物体属性匹配/材质质感 等方面稳稳的第一!
网友@ZHO_ZHO_ZHO 甚至说:画面/风格很像但优于 Google Imagen-4
用一张图片就能创建连贯的故事序列,速度快且保持氛围
X 平台上有大 V 在试用后直言不讳的说:Photoshop 可能要被取代了!

大家一直在猜到底是哪家的产品
最终聚焦到了谷歌
首先,有网友在谷歌网站发现了一个测试页面

然后谷歌 DeepMind 团队的产品经理在 X 默默了发了根香蕉

大家秒懂,原来是谷歌家的啊,Nano Banana 可能是谷歌为即将推出的 Gemini 3.0 模型系列开发的原生图像生成模型
加上 8 月 20 日,是谷歌一年一度的产品大会,大家纷纷推测会正式宣布 Nano Banana 出道
二、场景
不管是哪家的,全球网友纷纷挖掘出了 Nano Banana 的各种玩法
我从赚钱的角度,简单总结了 Nano Banana 的用途
只要有视觉设计、摄影,都可以用它,非常有商业价值

表情管理大师

微调人物角度

镜头切换
感觉一部电影分镜头就制作完成了。现在只需要动作。然后它就真的成了一部电影。 一次拍摄,无限角度。它不仅捕捉到了场景,还捕捉到了氛围、基调,甚至色彩。简直是疯狂

把照片变成手办
一张照片就可以

动漫形象也行
明星同框
布拉德皮特和基努里维斯合影

和偶像合影
与去世名人合影,栩栩如生

更换服装

更换海报文字
它完美还原了相机拍摄的文字失真、光线和色彩

平面广告
对光线和细节的理解很到位。关键在于在提示中添加一些具体内容,比如“不要换衣服”或“保持相同的姿势”

再来张

展示体育瞬间蒙太奇

老照片修复
图像修复效果都从未如此惊艳。

图片融合
四张照片完美融合在一起

产品摄像
即使产品图片上的图案比较复杂,Nano Banana 也能完美匹配

多图融合

制作虚拟偶像
一致性是指疯狂的调性、细节和氛围都与原始镜头完美地保持一致。
从让主人公不同动作,到移除物体

甚至将整个场景转移到一个新的故事中,一切都很顺利。
1、网站
现在要使用 Nano Banana,到 LMArena 平台即可免费使用,
先科学,再登录网址 lmarena.ai
无须注册 ,选择网页上面的“Battle”。选择下面的“image”,然后输入文字、或者参考图+文字,就可以用了
2、做图
正好有位在外游山玩水的群友发了一张图,问:
这个图片怎么拍会更好看?

哈哈,此情此景,怎能没有佳人相伴?
赶紧用 Nano Banana 给他添了个美女。
把草原和美女图片上传,输入提示语:让女人躺在左边的草地上

1 分钟不到,这个美女就躺在草地上,效果天衣无缝

群友还不知足,说:差个男主角!
这有何难?神器在手,江山我有。上,马老师

还多个机位拍摄,谈人生谈理想

群里立马炸开锅,一个女网友发来照片,清风,我正在重庆 18 梯耍,给我改改,要点刺激的
1 分钟,改好,如下,左边是原图,右边是刺激的

用下来,发现岂止是 NB,简直是 NB 它妈给 NB 开门,NB 到家啦
竞品比较
效果比其他一致性模型有明显优势
其他 AI,大部分都有瑕疵,不是人物变形,就是 AI 味太重,一股塑胶味
看看这张图,最左边是原图,上传到平台后,输入提示词:女人在公园被暴雨淋湿透
中间是 flux-1-kontext-pro,右边是 gemini-2.0

从左至右:qwen-image-edit,seededit-3.0,nano-banana
你可能会说,即梦 seededit 也挺好啊,但是大雨滂沱,还像个傻子在微笑?不符合逻辑

再看个例子,上传水弹女神,提示词 “吐舌头俏皮”
首先败下阵的是 qwen-image-edit,舌头怪附体?

接着是 Flux-content,同样效果不忍睹视

GPT 和 gemini 2 也不是对手。gemini 2 倒是俏皮了,但是没有吐舌头,GPT 和 seed 都有点傻姑的感觉


Nano Banana 可以稳定完成之前只有 gpt-img 才可以的复杂任务
Nano Banana 人像保持、生成速度优于 gpt,智能度/语义理解和风格迁移逊于 gpt
做视频
有了一致性的图片,首尾帧大法也好,提示词工程也好,做的视频效果自然就好
先用 Nano Banana 做一张美女跳绳的图片

得到

打开 通义万象 https://tongyi.aliyun.com/wanxiang ,使用即梦、可灵都可以
上传图片后,输入提示语:女孩跳绳

哈哈,这个模型一上手就停不下来,AI 电影厂正式开机!改天先给你们拍部小短片~
——今日测试小结——
一句话总结:Nano Banana 的「生图+改图」功能,就是能把脑海里的画面直接搬到屏幕上的顶级神器。
还没体验过的朋友,真的别再等了,立刻去用。
另外忍不住感慨:Google 还是那个 Google,全面到离谱。AI 大模型虽离 GPT-5 只差一口气,可一到多模态就火力全开:两个月前甩出视频大杀器 Veo 3,一个月前上架 Imagen 4,现在又祭出 Nano Banana。
放眼当下,「一致性之王」的桂冠非 Nano Banana莫属。
其他家肯定会拼命追赶,至于下一次花落谁家?拭目以待。













暂无评论内容