玩 Midjourney 的一点小心得

GPT42024-01-19 10:31:29562

玩了两天 Midjourney 了，今天花时间好好看了一下官方文档，把一些我比较感兴趣的点摘录一下。

咒语的正确读音

你可能已经知道 AI 画图只需一道咒语，这个咒语的专业名称叫 Prompt。

首先是 Prompt 的读音，我这 Poor 英文一直都把它读作“普肉木普特”，其实人家那个 M 不发音，应该读作：

基本画图方法

Midjourney 的 Prompt 由三部分组成：图片链接、文字描述和若干参数，官网的这张图一目了然。

基本的画图功能只要写文字描述就可以了，在官方的 Discord 频道的机器人对话框中输入命令：/imagine，随后会自动呼出画图模式，后面的参数 Midjourney 会自动添加一个模型的版本号，比如 --v 5：

稍等片刻就画出了这样一张图：

现在画出了 4 张图，从 1 开始依次编号。

在图的下面会有一些按钮：

U 开头的按钮表示要把对应编号的图片放大，单独给出来。
V 开头的按钮表示以对应编号的图片的样式和构图为模板，再生成四张图。
剩下的按钮是刷新按钮，表示以当前的 Prompt 重画一遍。

当然如果想自己指定版本号也是可以的，比如在文本后面指定 5.2 版本，--v 5.2：

只不过我觉得画出的结果相差不是很大，都还不错。

Prompt 应该尽量精准简短，不要一堆废话。比如这个就不太好：

Show me a picture of lots of blooming California poppies, make them bright, vibrant orange, and draw them in an illustrated style with colored pencils
Midjourney 官网示例

应该替换成：

Bright orange California poppies drawn with colored pencils
Midjourney 官网示例

上面的反例画出的图是这样，可以看到它没有画出彩色铅笔（colored pencils），语义表述不到位。

以图生图

在文本前面加上图片链接就可以以图生图了。

那么图片的链接从哪里来呢？可以用公网上搜到的图片，但是如果你懒得找，也可以输入 /describe ，上传一张自己的图片，然后 Midjourney 会描述一下这张图片的内容。当你的图片上传后，长按这张图片，选择复制链接，就得到这张图的链接了。

我随便画了一张比较抽象的小猪跳舞的图片，然后被 Midjourney 判定为违规，理由是这只小猪没穿衣服。

于是我又画了一张穿了衣服的版本。

Midjourney 给出的描述是这样：

下面我用这张图来配合一段 Prompt，让它帮我生成一张全新的图片：

/imagine 图片链接 A cute little piglet standing, wear short sleeves and sports shorts printed with the word "PIG", illustration,Exquisite details, ultra high definition, 8k