玩 Midjourney 的一点小心得

GPT42024-01-19 10:31:29562

玩了两天 Midjourney 了,今天花时间好好看了一下官方文档,把一些我比较感兴趣的点摘录一下。

咒语的正确读音

你可能已经知道 AI 画图只需一道咒语,这个咒语的专业名称叫 Prompt。

首先是 Prompt 的读音,我这 Poor 英文一直都把它读作“普肉木普特”,其实人家那个 M 不发音,应该读作:

基本画图方法

Midjourney 的 Prompt 由三部分组成:图片链接文字描述若干参数,官网的这张图一目了然。

基本的画图功能只要写文字描述就可以了,在官方的 Discord 频道的机器人对话框中输入命令/imagine,随后会自动呼出画图模式,后面的参数 Midjourney 会自动添加一个模型的版本号,比如 --v 5

稍等片刻就画出了这样一张图:

现在画出了 4 张图,从 1 开始依次编号。

在图的下面会有一些按钮:

  • U 开头的按钮表示要把对应编号的图片放大,单独给出来。

  • V 开头的按钮表示以对应编号的图片的样式和构图为模板,再生成四张图。

  • 剩下的按钮是刷新按钮,表示以当前的 Prompt 重画一遍。


当然如果想自己指定版本号也是可以的,比如在文本后面指定 5.2 版本,--v 5.2

只不过我觉得画出的结果相差不是很大,都还不错。

Prompt 应该尽量精准简短,不要一堆废话。比如这个就不太好:

Show me a picture of lots of blooming California poppies, make them bright, vibrant orange, and draw them in an illustrated style with colored pencils

Midjourney 官网示例

应该替换成:

Bright orange California poppies drawn with colored pencils

Midjourney 官网示例

上面的反例画出的图是这样,可以看到它没有画出彩色铅笔(colored pencils),语义表述不到位。

以图生图

在文本前面加上图片链接就可以以图生图了。

那么图片的链接从哪里来呢?可以用公网上搜到的图片,但是如果你懒得找,也可以输入 /describe ,上传一张自己的图片,然后 Midjourney 会描述一下这张图片的内容。当你的图片上传后,长按这张图片,选择复制链接,就得到这张图的链接了。

我随便画了一张比较抽象的小猪跳舞的图片,然后被 Midjourney 判定为违规,理由是这只小猪没穿衣服。

于是我又画了一张穿了衣服的版本。

Midjourney 给出的描述是这样:

下面我用这张图来配合一段 Prompt,让它帮我生成一张全新的图片:

/imagine 图片链接 A cute little piglet standing, wear short sleeves and sports shorts printed with the word "PIG", illustration,Exquisite details, ultra high definition, 8k

怎么样?是不是还不错。我觉得第二张图最接近我的原图,我点了一下 V2,让它帮我再来 4 张相同风格的图。

画图效果我已经很满意了,只是衣服上的“PIG样显示的不是很完美,可能要达到这一点需要特殊的技巧。

调整图片的风格

除了要花心思描述图片的内容之外,如果指明了画作的风格,出来的图效果差距会很明显。比如:

Block Print 风格的奥黛丽赫本:

Block Print Audrey Hepburn --v 5

Risograph 风格的玛丽莲梦露

Risograph style Marilyn Monroe --v 5

Ukiyo-e 风格的钢铁侠

Ukiyo-e style Iron Man --v 5

官网提供的风格有这几种:

  • Block Print 

  • Folk Art

  • Cyanotype 

  • Graffiti

  • Paint-by-Numbers 

  • Risograph 

  • Ukiyo-e 

  • Pencil Sketch 

  • Watercolor 

  • Pixel Art 

  • Blacklight Painting 

  • Cross Stitch


只要按这样的格式写 Prompt 就行:XX style XX,默认的效果已经足够惊艳。

调整线条的风格

还可以指定线条的风格:

斯嘉丽约翰逊的素描画

Continuous Line sketch of Scarlett Johansson --v 5

Blind Contour 素描线条风格的漩涡鸣人

Blind Contour sketch of Naruto --v 5

护额上的木叶村标志很标准呢。

官网给出的线条风格有这些:

  • Life Drawing 

  • Continuous 

  • Loose Gestural

  • Blind Contour 

  • Value Study 

  • Charcoal Sketch


指定图片内容的年代

还可以指定图片内容所处的年代:

1700 年代的外星人

1700s alien illustration --v 5

有点惊悚。

1920年代的神奇女侠

1920s Wonder Woman portrait --v 5

1920年代的盖尔加朵

1920s Gal Gadot illustration --v 5

年代的选择就写整数年代就行。

另外还可以指定情感,色调以及图片主体所处的环境等等。

图片混合

还有一个我很喜欢的功能,Midjourney 的 /blend 命令可以把两张图片混合起来生成一张新图。比如我把一张老虎和一张老鹰的画组合在一起,就得到了一头没见过的怪兽。

虽然挺帅,但是它好像不会飞的样子。

生成小视频

如果在 Prompt 末尾加上 --video,还可以生成一个表现绘图过程的小视频。绘图完毕之后,将鼠标移到消息的区域,点击右上角的第一个添加反应的按钮,然后在呼出的对话框里输入:envelope:,选择第一个信封的图标,就可以生成视频了。

Princess Elsa of Frozen blinked --video --v 5.2

背景音乐是我后来加的,默认生成的视频是无声的,还不错吧。


以上就是一些基本的上手玩法。后面还有更多高级的专业玩法,比如各种参数的选择,包括图片的宽高比,图像的摄影类型等等,官网都罗列的非常详细,我后续一一尝试过后再写。


你如果感兴趣,也可以赶快玩起来呀!





题图:《浮世绘风格的艾莎公主》

模型:Midjourney v5.2

Prompt: Ukiyo-e style, Princess Elsa of Frozen blinked --ar 16:9 --v 5.2



本文链接:http://lechangxia.cc/gpt4/474.html

相关文章