
2023 年被誉为生成式 AI 元年,许多 AI 软件如雨后春笋问世,除了有 OpenAI 打造的 ChatGPT,以自然语言文字生成技术被广泛应用于各个领域,成为当今泛用度最高的 AI 辅助工具之外。
说到以文生图的 AI 创作工具,Midjourney 可谓首屈一指,如今作为时下最受欢迎的 AI 绘图机器人,Midjourney 不仅让美术职人、设计师趋之若鹜,甚至是没有绘画技能的市井小民,都能利用想象力搭配提示词,快速生出许多精细的图像。 随着多代版本的更迭,Midjourney 从初代版本推出至今,已来到最新 V5.2,更新速度既快又频繁,如果是初次接触这套 AI 绘图工具,那么本篇将一步步引导入门,为读者们重点解析 Midjourney 使用注意事项、安装方式、界面概况、常用指令大全和 V5.2 新功能。
Midjourney 使用前注意事项
在正式介绍 Midjourney 的重点功能和必学参数指令之前,不免俗地要点出使用前的注意事项,比方说注册方式和订阅方案等,帮助 Midjourney 新手快速入门。
Prompt 关键字技巧与基本接口
紧接着就是重头戏:让 AI 为你绘制图像! 如前文提到,首先需要在聊天字段中输入「/imagine」,并在 Prompt 提示词之后键入所要创作的内容,由于 Promot 用法是一门高深的学问,如果不输入精准的命令描述,产生的结果可能十分随机,甚至与预期相去甚远,因此,Prompt 关键词的输入技巧可说至关重要。
Prompt 提示词公式
为了让 AI 尽可能产出与描述相符的图像,Prompt 提示词大致可规划出三大面向:第一部分是把「主题与背景」描述放在最前头,比方说要创作一个游戏角色,这时可先形容其外表特征、正在做什么事,以及所在的场景和环境; 第二是形容该图像的「风格和媒介」,订定图像整体风格走向,这时便可以直接填入一或多位艺术家、插画家、导演名字或大范围的艺术流派等,例如:皮克斯、毕加索、超现实主义、浮世绘等,甚至还可以输入相机型号或摄影师名字给AI参考,同时还能指定想要生成的图像类型,像是平面设计图、插画、摄影照片等; 最后是填入「颜色和氛围感」形容词,有个小技巧是加上光线与光影描述能大幅提升质感,或是使用建模和设计软件,也可以达到类似的渲染效果,像是 3DsMAX、Maxon Cinema 4D。 前面提到的三大项目并非都要写到,主要根据自己所要生成的图像适当地加入叙述,每一个 Prompt 都必须以空格或逗号隔开,才能被有效读取。
▲ 举例来说笔者在 Prompt 栏位里输入角色主体和外貌描述词作为主题,接着形容图像所在场景,最后定义风格和媒介。
Upscale 与 Variation 接口解析
将 Prompt 送出后,Midjourney 会在画面上显示生成图片的进度百分比,约在1 分钟内根据指令绘出四张图片,图片生成后,下方皆会有九个按钮,其中,数字 1、2、3、4,分别对照左上、右上、左下和右下的图片顺序,而第一排英文字母 U 是 Upscale 升级大图的单字缩写,假设用户喜欢某一张图片,即可选择单独放大该图片,以利欣赏和应用; 而 V 是英文单字 Variation 变化型的意思,Midjourney 会根据所选择的图片,进一步生成与之相似的风格图像增加更多选择,假如对 AI 给出的四张图都不满意,也能点选重新整理图标再次执行命令,产生新的一批图片。
▲ 假设在四张图中,特别喜欢第二张的图像,即可点击 U2 提升解析、下载保存,也能选择 V2 产出图二的变异版本。
11 个不可不知的 Midjourney 参数指令
除了以「/imagine」加上 AI 绘图咏唱「主体+风格+渲染」之外,许多进阶玩家也常常会在文本描述末尾加入连字号「–」搭配后缀参数,改变 Midjourney 机器人生成图像的方式,让最终成果趋近于理想,目前 Midjourney 有相当多值得利用的指令,下文为读者汇整出 11 个 Midjourney 常见的后缀参数。
1. /describe 以图生文
要玩好 AI 绘图,咏唱出精准的 Prompt 指令是不可或缺的条件,而要打出好的提示词,便需要将脑中想象的画面细节尽可能一一写出来,才能让 AI 产生有用的图片,但对于新手来说,时常不知从何下手,因此,初期除了可以直接参考别人的关键词加以修改之外,其实还能利用「/describe」指令,将想要的相似图片丢上去, 自动分析出相关的提示字和解构图片中出现的元素,对于不知如何产出相似风格或图案的用户,是相当好用的功能。
▲ 第一步,在输入字段中打出「/describe」,接着选择喜欢的图片上传,并按下Enter 送出指令。
▲ 接着,Midjourney 机器人会针对图片进行分析,并产出四组对应的提示词,可将有用的 Prompt 复制下来,并贴在 /imagine 栏位后,让 AI 产出相似图片。
2. /blend 一次融合多张图
Midjourney 不仅具备以文生图、以图生文反向操作的能力,它还可以多张图片元素混合成一张图,有时候可以打造出意想不到的效果,目前默认一次最多可上传 5 张图片,另外还有 1 个「Dimensions」项目,将图像以特定比例呈现,目前 Dimensions 中一共有 Portrait(3:2)、Square(1:1)和Landscape(2:3)三种选择,以下图为例,笔者把开着跑车的芭比和城市街景混合后,得到以建筑物为背景的香车美人风格图像。
▲ 首先在对话字段输入「/blend」,接着可选择图片上传,默认为 2 张,点击增加最多可上传 5 张图片,并可于「Dimension」选项中制定该图的特定尺寸。
▲ 按下 Enter 送出,并等待出图即可。
3.–ar 自定义图像宽高比
Midjorney 在 V1 到 V4 模型版本会有不同的宽高比范围限制,例如 Version 4a or 4b 只接受 1:1、2:3 或 3:2 的图像比,Version 4c 仅限使用 1:2 到 2:1 大小的宽高比例制图,不过 V5 版本以上已全面升级支持自定义尺寸,因应目前 Midjourney 默认版本是最新的 V5.2,现在只要在 Prompt 字尾加上 –ar 任何整数比例,就可以生成想要的宽高比例,其中ar是英文单字aspect ratio的缩写,要留意的是,在图像生成或放大过程中,最终输出比例可能会略为调整,例如笔者使用–ar 16:9的参数创建,但最后实际获得的图像宽高比为7:4。
▲ 首先在对话框中输入「/imagine」并于 Prompt 后面加入文字描述,最后在提示词末端加入 –ar 的任何整数比例,按下 Enter。
▲ 以下图输入 –ar 16:9 宽高比为例,Midjourney 机器人制图时将以宽高比为16:9 的横式画面创作,但最终成像比例仍会经过些微调整。
4. –chaos 提高四张图片差异度
基本上 Midjourney 在接收指令后产生的四张图片,整体元素仍围绕在下达的关键词,通常不会出现特别出格的结果,因此,如果想要改变结果的多样性或产出变化较大的图片,那么就可以藉由在指令末尾加上 –chaos 或 –c 搭配一个数值来开启这个功能,目前数值范围从 0 至 100,其中,–chaos 0 为预设值、100 为最大值, 越高的数值能产生更多意想不到的成果。
▲ 以下图为例,在对话框中输入「/imagine」并于 Prompt 后面加入文字描述,最后在提示词末端加入 –chaos 80,强化四张图片的差异度。
▲ 另外做为对照组,下图则同样在对话框中输入完全相同的文字描述,并在提示词尾端加入 –chaos 10,使四张图的风格更接近。
5. –no排除特定元素
通常在添加 Midjourney 提示词时,须尽量正面描述想要出现的元素,避免使用反面描述词,但假设你确实不想要图片存在某种特定元素,这时就能用负面提示参数「–no」来实现,实际用法为 –no 并在后面加上想从图片中移除的东西,机器人就会尝试从图像中移除该物,不过要注意的是这个指令只能尽量减少相关内容物的出现, 没办法百分之百让指定元素消失,举例来说,当你想要获得纯景观或空景图时,便能利用 –no people 去除人物。
▲ 以上图为例一般在输入提示词「an eagle soaring high with its wings spread wide.一只展翅高飞的老鹰」会得到输入框上的结果,如果想要去除树和山的元素,便能在句尾加入 –no trees –no mountain。
▲ 从成果图来看,Midjourney 机器人确实减低了树木和山巒的出现机率。
6. –tile 拼砖功能回归
继 V1、V2、V3 版本之后,Midjourney 也在 V5 版本更新时,重新回归拼贴参数「–tile」,这个参数指令最大用途是让作品变成无缝拼贴的图案,使用方式只要在提示句末加入参数 –tile,就会生成像壁纸或是地砖一样的无缝重复花纹,存取下来后便能平铺使用。
▲ 在对话框输入 /imagine prompt 及提示词,并在句尾添加 –tile 就会获得无缝组合拼贴的图像。
7. :: 将提示词分开考虑
假设想要让 Midjourney 机器人各别考量两个以上的提示词,那只需在提示里加入双冒号「::」便能在制图时将两个或多个词汇分开考虑进去,比方说输入 cup cake,基本上会生成常见的杯子蛋糕图片,但如果是分成 cup::cake,那杯子和蛋糕就会被认定是两个词汇,进而创建出放在杯子上的蛋糕图。
▲ 在提示中添加双冒号::,可向 Midjourney 机器人表明应单独考量每个词汇。
8.–niji/ 切换算图模式
Midjourney 在经过版本的更迭,从 –v 1、–v 2、–v 3、–v 4 版本到目前最新的–V 5.2,不仅分辨率提高,还能提供更完善的风格和细节演算。 而目前除了 V1 到 V5.2 版本模式可切换变更图片绘制特色外,去年底释出的 –niji 模式可说是动漫电绘的特仕版,专门拿来画二次元动画和插画风格的图像,在输入提示词之前,可先使用 /settings 到设定中进行模式切换,或是在提示词末加上 –niji 5 的指令亦可执行,值得一提的是,目前官方也为Niji模型新增了三个不同的模式,分别为 — style expressive、–style cute 和 –style scenic,第一个能使图像产生更高的饱和度和明度,整体光线感更强、色彩更丰富,而且人物五官塑造也更为立体精致,画面构图更具动态感; 第二种模式则是将人物和其它物体造型塑造成偏 Q 版或圆润可爱的风格; 第三种从字面上理解就是着重环境背景的刻画,使背景内容更丰富精致、亮度更高,甚至画面主体会呈现逆光感。
▲ 开启 Niji 模式有两个方式,一是直接在 Prompt 最后加上 –niji 5,另一种是输入 /settings 选择 Niji Vesion 5,并可于下方菜单点击需要的模式,接下来输入的指令都会采用选取的 Niji 模式制作。
▲ 设定完成后,接着在 Prompt 后送入图像提示词即可,下图即是在 –niji 5 模型下使用 –style expressive 模式所绘制。
9. –stylize 自订图片艺术化程度
–stylize 简称 –s 也是经常被使用的 Midjourney 参数指令之一,主要用来设置图像的艺术化程度,以较新的两个版本 V4 和 V5 来说,参数范围皆在 0-1000,默认值为 –s 100,Niji 模式下不适用 –stylize 指令,数值越小代表越接近文字叙述,数值越大则能产生更具艺术感色彩和细节的图片,总体来说,在 -s 250-500 的风格效果就十分出色,而最新版本 V5.2 释出后,–stylize 风格化强度也比 V5.1 更加明显。 而另一个常见的 –style raw 原始模式,则是会赋予丰富的细节和生动的色彩,提升锐利度让图画看起来更加写实逼真。
▲ 以下图为例,在 V5.2 版本下输入相同提示词,左图为预设值 –s100、右图为 –s500,明显看出右图像是被加上滤镜一般,具有更浓烈的橙红色调,细节也更丰富。
10. Zoom out 图像外绘图
日前,Photoshop 新增的生成填充功能引起极大回响,主要是可以使用简单的文字提示,让原图以非破坏性的方式从影像中新增、延伸或移除内容,而 Midjourney V5.2 版本最新导入的 Zoom Out 则有异曲同工之妙,让使用者在生成一张四宫格图像之后,点击其一喜欢的图像进行 Upscale 放大像素提升细节后,下方会出现可自选的调节参数, 包含Zoom Out 2x、Zoom Out 1.5x分别代表在原图的基础上按照比例绘制2倍及1.5倍,另还有Custom Zoom自订义拓展比例,其数值范围为1.0-2.0、接受小数点,而「Make Square」选项能将非正方型的图像拓展绘制成正方形。
▲ 在 U1 至 U4 的四宫格图片中,点击其中一张喜欢的图片进行 Upscale,接着便能在放大图下方选择 Zoom Out 2x 或 Zoom Out 1.5x 进行图像外绘制。
▲ 下方范例为原图的 2 倍变焦拉远,可看见图像向外绘制后的衔接点还满自然,画面品质也颇高。
11. /shorten 精简提示词
有时候提示词中涵盖过多的元素或过于复杂冗长,多少会影响绘图的最终成像,这时便能利用V5.2版本新增的「/shorten」指令,只需在输入框中键入「/shorten」并复制原本的长文提示词发送出去,Midjourney 机器人就会辅助分析,并以粗体字标示哪些单词具有作用可以保留,进而精简词汇,通常提示词经过精简后, 画面的关键元素会变得更加明显清楚,反而能使主题更为突出,物体也会比原图更好,细节丰富度和美感上也比长篇提词更加强烈。
▲ 第一步在对话框中键入选择「/shorten」,并在 Pormopt 后将长篇提示词输入并发送。
▲ 机器人便会提供五个精简化的有效提示词建议,提升 AI 抓重点的能力,绘制更符合需求的图片。