Nano Banana 是什么? --知识铺
Nano Banana(官方名称为 Gemini 2.5 Flash Image)是由Google DeepMind 开发的一款图像生成和编辑模型。它是基于生成式人工智能技术的文本到图像转换工具,属于 Gemini 大型语言模型系列。该模型于2025年8月推出,作为 Gemini 聊天机器人和其他 Google 产品的功能。Nano Banana 最初是该模型在秘密公开测试期间使用的代号,后来在互联网上迅速走红。
历史
Nano Banana 首次在众源AI评估平台 LMArena 上以匿名模型的形式出现,时间为2025年8月12日。它于2025年8月26日通过 Gemini 应用和相关 Google AI 服务向公众发布。Nano Banana 这个昵称源于内部占位符命名,但当这个代号开始在网络群组中使用时,很快就被网络采用。Google 在公开发布时通过官方声明确认其身份为 Gemini 2.5 Flash Image。2025年11月20日,DeepMind 发布了 Nano Banana Pro](Gemini 3.0 Pro Image),具有改进的文本渲染和世界知识能力。
功能特性
该模型允许用户通过自然语言提示改变发型、背景,并混合照片。主体一致性功能允许在多个修订中识别同一个人或物体。多图像融合可以将多张照片无缝融合成一个输出,世界知识允许进行上下文感知的更改。此外,它还提供 SynthID 水印功能,这是输出中的隐形数字签名,用于识别AI生成的信息。
推出与采用
发布后,Nano Banana 在 Gemini 应用、Google AI Studio 和 Vertex AI 中提供。根据 Google 的说法,它吸引了超过1000万新用户使用 Gemini 应用,并在推出后数周内促成了2亿多次图像编辑。
文化影响
人们开始将 Nano Banana 与一股病毒式热潮联系起来,人们将自己的自拍照变成看起来像玩具的3D小雕像。这一事件在 Instagram 和 X(前身为 Twitter)等平台上迅速传播。
通过将该模型添加到 X,用户可以在帖子中直接标记 Nano Banana 以从提示中生成照片,这使其更加流行。
评价反馈
2025年9月《TechRadar》的评论报告指出,Nano Banana] 在逼真度和多个提示的一致性方面都超过了 ChatGPT 的图像生成功能。《Tom’s Guide》的评论对其处理创意和生动图像编辑的能力表示赞扬。
《PC Gamer》的另一篇评论提到该模型缺少一些基本的编辑工具(如裁剪),有时不会应用更改,而是恢复到原始图像。
Nano Banana] 在建筑可视化方面表现出良好的性能,即使在复杂几何形状的情况下也能产生正确比例的图像。
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai002/post/20251029/Nano-Banana-%E6%98%AF%E4%BB%80%E4%B9%88/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com