谷歌“香蕉”火了没多久,字节豆包就想让它“凉凉”
创始人
2025-09-10 12:22:48
0

作者 | 阿虎 石濑编辑 | Kino

AI生图界,最近真是要过年了。

谷歌Nano Banana模型还没玩够,字节最新图像创作模型Seedream 4.0又来了。该模型的核心亮点是首次支持多模态生图,同一模型可以实现文生图、图像编辑、组图生成等多种任务。

简单来说就是,无论是用AI“无中生有”,还是用AI实现精准P图,Seedream 4.0都比以往版本的模型体验更丝滑、更可控。

更让我们期待的是,或许Seedream 4.0可以解决Nano Banana中文字生成不稳定、图片比例不可控等问题。对国内大多数用户来说,Seedream 4.0如果在性能上能打,那以后也不必大费周章非要用Nano Banana了。

目前,Seedream 4.0模型已陆续全量上线即梦、豆包App和扣子空间。我们第一时间上手,设计了几个贴近日常使用场景的实测案例,让Seedream 4.0和Nano Banana来了场PK,下面一起来看看“豆包大战香蕉”,谁会是新的P图之王?

连续修改同一张图人物保持不变

我们先是把一张马斯克的图片“喂”给了豆包和Nano Banana,让它们更换原图背景的同时保持人物表情不变。

原图:

背景图:

提示词:把图1背景换成图2。

可以看到,两个模型都遵循了提示词的要求。不过,左边豆包生成的图片色彩饱和度更高,右边Nano Banana更为严谨地引用了用户上传的参考图。

接着我们试着调整了一下图中马斯克发型和妆造。

提示词:把他的发型换成摇滚长发男,加上烟熏妆。

Nano Banana

豆包

有一说一,豆包生成的摇滚长发男还真是那个味儿,虽然提示词里没有要求更改衣服和面部装饰,但它生成的图片确实更符合我们预期的想要生成的形象。

在创意发挥上,豆包更胜一筹,能举一反三生成更符合摇滚氛围的整体形象;而在指令的精准遵循上,Nano Banana的表现则更为严谨。但总的来说,AI生图模型在人物一致性方面确实保持得越来越好了。

生成真实感自拍图

提示词:请画一张极其平凡无奇的iPhone自拍照,没有明确的主体或构图感,就像是随手一拍的快照。照片略带运动模糊,阳光或店内灯光不均导致轻微曝光过度。角度尴尬、构图混乱,整体呈现出一种刻意的平庸感,就像是从口袋里拿手机时不小心拍到的一张自拍。主角是水豚(卡皮巴拉),背景是大学校园的宿舍里。

左边为Nano Banana;右边为豆包生成

豆包和Nano Banana都精准生成了水豚、宿舍等样式,还成功复刻了国内外大学寝室之间的差异性。

值得一提的是,实测过程中我们发现,Nano Banana支持基于上下文的多轮图片编辑,但豆包需要再次上传图片、下达新指令,体验稍显繁琐。

基于参考图生成宠物手办

另外,我们可以上传单张或者多张图片,再加上具体的指令,进行任何形式的图片编辑。

提示词:基于参考图,将角色转换为1/6比例的高完成度PVC静态手办的图片,图片中该角色置于手中,手办背后是一只较大的手办品牌开窗盒,正面透明塑料窗可看见同款手办的本体和配件。室内暖色灯光,柔和的45°主光+顶补光;单反摄影质感,50mm镜头,f/2.8,浅景深,真实PVC/ABS塑料反射,喷涂阴影、细微合模线与微划痕,桌面反射与颗粒感,背景轻微散景。

从左至右,分别是参考图、豆包生成、Nano Banana生成

米其林级别的可视化食谱

提示词:参照这张图的展示风格,把丝瓜汤的制作步骤变成可视化食谱

优雅,太优雅了。在这一轮的比拼中,两者可以说是棋逢对手,都生成了质感高级、菜谱清晰、风格统一的图片。有趣的是,在豆包的概念中,丝瓜汤是一定要配鸡蛋的,符合中式大厨的习惯偏好。

接着,我们再试试豆包和Nano Banana生成组图的能力,举个例子,我们只给一道菜名,看看AI是不是能生成前后相符的关联性图像,把整个制作过程“想象”出来。

提示词:手绘风格,做出一张丝瓜汤的制作步骤完整教程的长图,步骤说明要中文

豆包生成了4张连续图片

NanoBanana生成图片

在生成连续长图方面,两个模型都还有待完善,豆包还无法将整个制作过程完整地展示在一张长图上,Nano Banana生成中文的能力依然是短板。

但让我们惊喜的是,豆包对漫画风格的一致性“拿捏”得很好。对于有分镜制作需求的漫画师、导演、创作者来说,它或许会是一个“好帮手”,更好地帮助你发散灵感。

最后,再给你们开开眼,当豆包家族“玩梗”丝瓜汤:

提示词:帮我生成图片:风格不变,把图中的女生变成老奶奶的样子,手里端着一碗绿色的丝瓜汤,下方写着文字“喝点丝瓜汤降降火”。比例 1:1。

帮我生成图片:风格不变,把图中的男生变成老大爷的样子,戴着老花眼镜,用手指着镜头,下方写着文字“那你错了”。比例 1:1。

提示词:让这四个人围坐在一个饭桌前,桌上摆满了用丝瓜做成的菜,背景是家里的餐厅,比例16:9

话说回来,自从前两周Nano Banana掀起生图热潮以来,网友们发掘出了成百上千个AI生图的“邪修玩法”,甚至有报道直言“属于AI生图的ChatGPT时刻来了”

从我们的实测来看,这场对决没有绝对的赢家,更像是两位高手过招。尽管两者在细节上仍有所欠缺,但两者的价值或许不在于一时的技术比拼,而是在一次次技术进步中,用越来越低的门槛,推动我们迈向一个AI生图的新时代。

相关内容

热门资讯

SK海力士宣布与Naver C... 【环球网科技综合报道】9月10日消息,据外媒The Koreapost报道,存储芯片企业SK海力士与...
做菜、救援、照顾老人……40家... IT时报记者 孙妍 走进外滩大会机器人小镇,机器人做菜、救援、演奏……忙得不亦乐乎。 “2025 I...
让机器人干苦力!外滩大会机器人... 来源:TMTguanchawang 机器人翻越崎岖高地,操作电箱闸刀,安插火药雷管,甚至还在废墟中成...
一文读懂多媒体信息发布系统/广... 在当今数字化信息飞速传播的时代,多媒体信息发布系统无处不在,从商场的促销展示,到机场的航班信息提示,...
道通科技于柏林发布新一代AI智... 本报讯 (记者李昱丞)近日,深圳市道通科技股份有限公司(以下简称“道通科技”)在德国柏林举办新能源全...
29.9万元!科研教育人形机器... 9月9日,“人形机器人第一股”优必选联合北京人形机器人创新中心推出的全尺寸科研教育人形机器人天工行者...
贾跃亭:法拉第未来恢复正常上市... 9月10日,FF贾跃亭宣布FFAI顺利完成所有监督期的合规项,成功通过了纳斯达克的一年监控期,标志公...
哈工大深圳校区成立低空科学技术... 低空科学技术研究院揭牌。哈工大深圳校区供图 中新网广东新闻9月8日电 (记者 索有为)哈工大深圳校...
王腾因违规泄露信息被小米辞退,... 2025-09-09 15:40:17 作者:狼叫兽 前小米中国区市场部负责人、REDMI品牌负...
2026合肥智能工厂展|合肥具... 2026合肥智能工厂展|合肥具身智能机器人与5G绿色智能工厂展览会 2026合肥具身智能机器人与5G...
通行宝:预计今年高速收费机器人... 通行宝(301339)发布公告,2025年9月9日,公司召开了投资者关系活动。 公司表示,已于8月份...
小程序开发平台有哪些?2025... 在数字化浪潮以排山倒海之势席卷全球的当下,各行业都深刻意识到数字化转型已不再是可选项,而是关乎生存与...
原创 中... 在当今这个科技迅猛发展的时代,中国航天事业又一次创造了惊人的壮举。最新的消息是,我们将对一颗距离地球...
长效抗艾疗法来了!他们用好奇心... 来源:滚动播报 (来源:上观新闻) 今天(9月10日),2025世界顶尖科学家协会奖“生命科学或医...
固态电池上车倒计时 上游设备企... 记者 王帅国 随着固态电池上车时间的临近,国内上下游产业链正在产生化学反应。9月以来,固态电池概念表...
约2.3亿光年外现奇观:矮星系... 在多数人的认知里,大质量黑洞似乎总是与星系中心紧密相连,仿佛那里才是它们理所当然的“栖息地”。然而,...
百正创源4个月营收破千万! 9月8日,在百正创源(包头)智能传动有限公司智能卡轨车生产车间,技术人员正专注于布线、组装工作。这批...
iOS 26将于9月15日正式... (AI云资讯消息)苹果宣布下一代重大iPhone软件更新iOS 26的发布日期:9月15日。 此次...
华为中国行2025·山西新质生... 9月9日,华为中国行2025·山西新质生产力大会在长治市举行。来自政、产、学、研各界的300余位代表...
iPhone16降价,苹果官网... 9月10日凌晨1点,2025苹果秋季新品发布会发布iPhone17系列。 发布会后苹果官网下调iPh...