图片

在结合这两个工作流程之前,让我们先看看如何将 Midjourney 图像的功能与可生成多种输出 [例如联系表、角色表视图或产品展示的不同角度] 的提示相结合。为此我们将使用 JSON 格式的提示,你也可以是纯文本。如果你想将提示转换为JSON,只需咨询 ChatGPT 即可。

图片

简单的拍摄

我将使用以下 Midjourney 图像来做测试:

一位美丽的韩国女模特身着简约的白色开衫,发型格外醒目。她留着中等长度的奶棕色分层发型,层次丰富,营造出一种纯真无邪的氛围。她的头发光泽亮丽,蓬松细腻,清晰可见,成为照片的焦点。她站在干净的白色背景下,自然光线柔和。照片写实的超高清人像,柔和的自然光线,晶莹剔透的细节,极简主义的美学风格——AR 2:3——exp 10——v 7.0

图片

得到一张喜欢的图像,粘贴以下提示并将图像上传到 Google AI Studio 获得结果:

{
“模型”:“gemini-2.5-flash-image”, “模型” : “gemini-2.5-flash-image”,
“输入” : [
    {
“角色” : “用户”,
“内容” : [
{ “类型” : “图像” , “来源” : “用户上传” },
        {
“类型” : “文本”,
“text” : “使用附件照片作为唯一参考,在相同的环境和光线下为同一模特创建一张单独的编辑照片拍摄联系表。生成 4 张不同的照片,排列在 2x2 网格(两行两列)中。 所有照片都必须是写实照片,而不是插图。 \n \n 拍摄顺序和方向(保持服装、身份和环境一致): \n 1)全身英雄 — 模特面对镜头或略微自然的姿势;保持背景的连续性。 \n 2)中景编辑 — 腰部以上,自信的目光,微妙的头部倾斜;相同的照明和分级。 \n 3)行走轮廓 — 侧面全景或中景,微妙的动作,与背景对齐。 \n 4)特写肖像 — 肩膀和头部,浅景深与参考相匹配;一致的纹理。 \n \n 硬性限制: \n - 与参考相同的环境和照明(没有新的位置或道具)。 \n - 所有镜头中的模特身份、服装、颜色和比例相同。 \n - 排列为平衡的 2x2 网格(行/列对齐、间距相等、无重叠)。 \n - 最大化每次拍摄的帧使用率;使用白色边距。 \n - 所有 4 张照片的色彩分级、曝光和白平衡保持一致。 \n - **隐藏图像编号,请勿在图像的任何位置添加任何文字、数字、标签、徽标、边框或数字。 输出必须是纯摄影。** \n - 输出必须是 2x2 布局中的一张单一图像(而不是四张单独的图像)。”
        }
      ]
    }
],
“生成配置” :{
“种子” : 23456
  }
}

图片

图片

人物角色很统一,有些意思,但请_注意,如果你希望使用_相同的提示获得不同的结果,只需更改提示中的种子号即可。

-

多视图产品展示

同样,用以下 Midjourney 图像来做测试:

漂浮在半空中的 Nike Air Force 1,全新鞋面,无瑕疵,正面和侧面视图,戏剧性的工作室灯光,动态角度,干净的背景,高细节,专业商业摄影,照片般逼真,C4D 渲染 –ar 2:3 –exp 12 –v 7.0

图片

继续在 Google Studio 中上传你想要的产品和以下提示:

{
“模型”:“gemini-2.5-flash-image”, “模型” : “gemini-2.5-flash-image”,
“输入” : [
    {
“角色” : “用户”,
“内容” : [
{ “类型” : “图像” , “来源” : “用户上传” },
        {
“类型” : “文本”,
“text” : “使用所附产品照片作为唯一参考,创建一个产品表,以 4 个经典目录视图显示同一款产品,并以 2x2 网格(两行、两列)排列。 \n \n 所需视图: \n 1) 正面视图 — 完整产品面向相机,居中。 \n 2) 右侧视图 — 向右旋转 90°,完整产品。 \n 3) 左侧视图 — 向左旋转 90°,完整产品。 \n 4) 后视图 — 从正面旋转 180°,完整产品。 \n \n 严格限制: \n - 产品标识、比例、颜色和纹理必须与参考保持一致。 \n - 保持背景中性,纯色工作室(白色或浅灰色),在所有镜头中保持一致。 \n - 将 4 个视图排列在干净的 2x2 网格中,间距和对齐方式相等。 \n - 无重叠,无裁剪,没有额外的道具或反射。 \n id=52> - 所有 4 张照片的光照必须均匀且中性。 \n - 输出必须是具有 4 个视图的单个方形图像(而不是四个单独的图像)。”
        }
      ]
    }
],
“生成配置” :{
“种子” : 12345
  }
}

图片

图片

看着也不错,但是有一张重复的视角,也算是OK。

-

角色的多个视图

继续,用以下 Midjourney 图像来做测试:

3D 卡通风格的黑熊角色,有着简单可爱的脸,戴着透明的角质框眼镜,穿着超大号连帽衫和阔腿工装裤,站在干净的白色工作室背景前,逼真的服装纹理,极少的阴影,清晰的全身视图,韩国街头时尚风格,休闲而现代 –ar 2:3 –exp 18 –v 7.0

图片

Google Studio 中上传你想要的产品和以下提示:

{
“模型”:“gemini-2.5-flash-image”, “模型” : “gemini-2.5-flash-image”,
“输入” : [
    {
“角色” : “用户”,
“内容” : [
{ “类型” : “图像” , “来源” : “用户上传” },
        {
“类型” : “文本”,
“text” : “使用所附产品照片作为唯一参考,创建一个单独的产品表,以 4 个经典目录视图显示此全身角色,排列在 2x2 网格(两行,两列)中。 \n \n 所需视图: \n 1) 正面视图 — 完整产品面向相机,居中。 \n 2) 右侧视图 — 向右旋转 90°,完整产品。 \n 3) 左侧视图 — 向左旋转 90°,完整产品。 \n 4) 后视图 — 从正面旋转 180°,完整产品。 \n \n 严格限制: \n - 产品标识、比例、颜色和纹理必须与参考保持一致。 \n - 保持背景中性,纯色工作室(白色或浅灰色),在所有镜头中保持一致。 \n - 将 4 个视图排列在干净的 2x2 网格中,间距和对齐方式相等。 \n - 无重叠,无需裁剪,无需额外的道具或反射。 \n- 所有 4 张照片的照明必须均匀且中性。 \n- 输出必须是具有 4 个视图的单个方形图像(而不是四个单独的图像)。 请勿添加文本”
        }
      ]
    }
],
“生成配置” :{
“种子” : 12345
  }
}

图片

图片

看一个有趣的例子,里面只上传角色的上半身,用以上 JSON 提示也是可以实现的,同样 Midjourney 图像来做测试:

3D 可爱卡通人物,泰国男性,24 岁,戴眼镜,白色 Polo 衫,红粉色领子和黄色袖边,正面,表情丰富,嘴唇清晰可见,可进行口型同步,皮肤光滑,色彩柔和,灯光温暖,表情俏皮友好,细节丰富,数字艺术,电影灯光,简单的白色背景 –ar 2:3 –exp 14 –v 7.0

图片

图片

图片

-

物体的不同材质

我知道这很烂大街的操作,但把物体变成雕像,或者在玻璃里看到科技物品的想法真的很吸引人。

继续,用上面的熊图像来做测试:

{
“模型”:“gemini-2.5-flash-image”, “模型” : “gemini-2.5-flash-image”,
“输入” : [
    {
“角色” : “用户”,
“内容” : [
{ “类型” : “图像” , “来源” : “用户上传” },
        {
“类型” : “文本”,
“text” : “使用所附的产品照片作为参考,创建一个产品表,显示以 4 种不同材质呈现的相同对象。将输出排列在干净的 2x2 网格(两行,两列)中。产品的形式、比例和细节在所有四个版本中必须保持一致。 \n \n 材质变体: \n 1) 白色抛光大理石 — 细腻的纹理,高端雕塑饰面。 \n 2) 透明水晶/玻璃 — 折射、半透明、优雅的反射。 \n 3) 液态水银 — 金属、高反射、液体般的表面张力。 \n 4) 生锈的铁/氧化物 — 粗糙、风化、腐蚀的纹理。 \n \n 限制: \n - 仅材质发生变化;产品的形状、比例和设计保持不变。 使用白色边距 \n - 四个版本的照明必须保持一致(工作室灯光、柔和阴影)。 \n - 中性高级背景(例如,渐变工作室灰色)以强调材料差异。 \n - 均匀排列在 2x2 网格中,无重叠,间距平衡。 \n - 输出必须是一张单独的方形图像(而不是四张单独的图像)。“
        }
      ]
    }
],
“生成配置” :{
“种子” : 98765
  }
}

图片

图片

确实很有意思,大理石,金属等看着很萌~

图片

构建工作流程

如你所见有很多可能性,你需要访问 Google AI Studio,输入提示符然后等待。此外,图像右下角会显示双子座水印。但如果我告诉您,您可以在一个一体化界面中拥有所有内容,而且没有双子座水印,您会怎么想?

为此,请转到“构建”部分并单击“空”。

图片

图片

然后复制这个提示:

实现一个文本框,我可以在其中编写提示,并实现一个用于上传图片的文本框。我希望你使用 Nano Banana,这样我就可以编写一个提示来更改我上传图片的某些方面。

翻译:

实现一个文本框,我可以在其中编写提示,并实现一个用于上传图片的文本框。我希望你使用 Nano Banana,这样我就可以编写一个提示来更改我上传图片的某些方面。

请耐心等待1分多种,系统会自动生成一个界面,您可以在其中创建您的图像,并且由于它使用内部 API,因此不会出现 Gemini 水印。

图片

-

插播一条,10月1日出现的 Sora2 和 Grok 0.9版本更新视频玩了一阵,没有 Sora2 邀请码的,Grok 绝对是首选,地址:https://grok.com/imagine

图片

图片

历史文章 

图片

图片

![图片](data:image/svg+xml,%3C%3Fxml version=‘1.0’ encoding=‘UTF-8’%3F%3E%3Csvg width=‘1px’ height=‘1px’ viewBox=‘0 0 1 1’ version=‘1.1’ xmlns=‘http://www.w3.org/2000/svg’ xmlns:xlink=‘http://www.w3.org/1999/xlink’%3E%3Ctitle%3E%3C/title%3E%3Cg stroke=‘none’ stroke-width=‘1’ fill=‘none’ fill-rule=‘evenodd’ fill-opacity=‘0’%3E%3Cg transform=‘translate(-249.000000, -126.000000)’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

![图片](data:image/svg+xml,%3C%3Fxml version=‘1.0’ encoding=‘UTF-8’%3F%3E%3Csvg width=‘1px’ height=‘1px’ viewBox=‘0 0 1 1’ version=‘1.1’ xmlns=‘http://www.w3.org/2000/svg’ xmlns:xlink=‘http://www.w3.org/1999/xlink’%3E%3Ctitle%3E%3C/title%3E%3Cg stroke=‘none’ stroke-width=‘1’ fill=‘none’ fill-rule=‘evenodd’ fill-opacity=‘0’%3E%3Cg transform=‘translate(-249.000000, -126.000000)’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

有意向或者感兴趣的小伙伴欢迎加入AI[MJ · DeepSeek · 4o]学习交流。