Midjourney|文心一格prompt教程[进阶篇]:Midjourney Prompt 高级参数、各版本差异、官方提供常见问题

1.Midjourney Prompt 高级参数

Quality

图片质量是另一个我比较常用的属性,首先需要注意这个参数并不影响分辨率,并不改变分辨率,并不改变分辨率(重要的事情要说三遍)。

它改变的更多的是图片的细节,比如下面这个例子,下方第一张图是 0.25 ,你会发现最右边的图细节比第一张图多很多很多。

但低 Quality 也不是没有好处,它的好处是生成图片的时间会更快,换句话说,你可以花更少的 GPU 时间,我一般会用这个参数做一些探索性生成图,大方向没问题,再让模型丰富细节。

除了在 prompt 里输入外,你也可以在设置里,调整默认的版本,相关教程请查阅 Midjourney 基础设置。

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --q 或者 —q
  • --quality 或者—quality
woodcut birch forest --q .25
  • 默认为 1
  • 仅支持 .25,.5 ,1 和 2,如果输入大于 2 会被降级到 2

Seed

你在使用 Midjourney 的时候,应该会发现,即使用相同的 prompt,每次生成的图片都会不一样。其实 Midjourney 会为每个生成的图片打上一个 seed 编号,你可以在 prompt 里加入这个 seed 参数,这样每次生成的图片就一样了,以下是官方的例子:

调用方法很简单:

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --seed 或者 —seed
  • --sameseed 或者—sameseed
woodcut birch forest --seed 123
  • 输入完全一样的文字 prompt,并且加上 seed 参数,才能生成一样的图。
  • V1、2、3 还有 test、testp 版本即使加了这个 seed 也没法生成一模一样的图,只能生成近似的图。
但只能生成近似图

那如何获得这个 seed?

找到你想要获得 seed 的图片,然后在其消息右上角有个 emoji 按钮,点击后会出现一个 emoji 菜单,然后在 emoji 菜单里输入 envelope ,最后点击 ️ emoji ,然后在图片下方就会出现一个 envelope 的 emoji,最后你会收到 Midjourney Bot 的私信推送,该消息上面就会有 Seed 号码。

Image Weight

这个翻译成中文是「图片权重」的意思。

当你同时用 img prompt 和文字 prompt 的时候,就可以通过这个参数设置到底更像图片还是更像文字,当这个参数越大,AI 生成的图片就越像原图,越小,就越像文字描述。

以下是 Midjourney 的官方案例,可以看到,数值越大,就越像原图:

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --iw 或者 —iw
flowers.jpg birthday cake --iw .5 这个参数在不同版本有不同的默认值(就是即使你不输入这个参数,AI 也会自己加这个参数进去)和区间 默认为 1,区间是 0.5-2 默认为 0.25,区间是 -10000-10000

Stop

这个参数跟 ChatGPT 里的 stop 类似,就是强制暂停模型。

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --stop 或者 —stop
splatter art painting of acorns --stop 90
  • 默认值是 100
  • 你可以输入 10 到 100

Style

这个参数主要是用于切换 V4 模型中的分支模型。

我个认为觉的这个不是很好用,且因为 V5 已经推出,大家都在用 V5 了,所以未来我认为会淘汰(这个我猜测其实是 V5 的其他分支版本,早放出是为了收集数据)。所以就不做介绍了。

Uplight

当 Midjourney Bot 图片生成完成后,图片下方都会有一排 U 按钮,这些按钮做的事情就是这个 Uplight 参数做的事情,一般人都会通过点击按钮来使用,比较少在 prompt 里添加。

而且现在 V5 版本,U 按钮已经不会影响分辨率了,只是做为一个裁切图片的功能。所以这个参数也是一个我认为要被淘汰的参数。大家不必关心。

Upbeta

另一个我认为会被淘汰的按钮。

Video

我觉得这个参数很有意思,这其实是个类似录 gif 的参数。在 prompt 里加入这个参数,升成图片的同时,还会记录升成的过程,但可惜这个参数只支持到 V3,估计官方未来也会放弃吧,主要是没啥用,就是好玩。

2. Midjourney 各版本差异

V1、V2、V3、V4、V5

我们都用相同的 prompt 来看看各版本的差异,我使用的是官方案例里的 prompt:

  1. vibrant California poppies

从上图里其实你就能看到 Midjourney 的进化方向:

  1. 越来越丰富的细节,生成的内容也越来越真实。V1 和 V2 基本上就是简笔画,看看 V2 第四张图前景和背景的处理就很粗暴,到了 V3 背景和透视都变得更加合理,然后到了 V4 基本就是一个可用的状态。
  2. 分辨率越来越高。V1~V3 单张图是 256 x 256,到了 V5 单图已经默认是 1024*1024。
  3. 参数更多,Prompt 更加重要。这个在 V5 版本更加明显,感觉以前的版本,并不太能理解一些词,比如材料词 marble 之类的。但到了 V5 理解能力变强了。
  4. 艺术风格词变得更重要。这个结论暂时没有得到官方的认证,甚至有很多人认为 V5 版本是个更「通用」的版本,我的理解是 V5 提高了整个基准线,不需要太多描述词,就能生成一个「可以看」的图片,但如果要生成一张你跟你预期完全一致的图,其实变难了,你需要了解更多的 prompt。

然后我们再来看看更复杂的 prompt 看看版本的差异:

  1. 21years chinese girl, in school, beauty, long black hair, sun lightinsane detail, smooth light, real photography fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM

看看生成的结果,是不是差距非常大,从 V1 到 V5 的进化,Midjourney 大约花了 1 年的时间,如果仅算研发时间,我觉得应该不到 1 年,非常了不起:

Niji

最后再介绍一个 Midjourney 的特殊版本 Niji,这个版本其实是 Midjourney 跟 Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」 或者 「2D」。

它在生成动漫类的图片上,比较在行。举个例子,prompt 是 fancy peacock,左图是 v5 模型,右图是 niji v5模型,右图更偏向于漫画风格:

3. Midjourney 官方 FAQ

本章节,主要是翻译官方的 Discord FAQ 文章,一些大家常见的问题进行翻译,各位可以在官方 Discord prompt-faqs 找到这些原稿。

4K、HD 等所谓的 Rendering 词有用吗?

官方解释 Rendering 词包括:

Rendering words include 4k, 6k, 8k, 16k, ultra 4k, octane, unreal, v-ray, lumion, renderman, hd, hdr, hdmi, high-resolution, dp, dpi, ppi, 1080p.

有用吗?官方的解释是:

Rendering words do something to your image. They may also be what's breaking your prompt. So, as part of troubleshooting, we recommend removing them. Removing them often fixes issues with blurring, focus, clarity, and coherence.

意思就是会影响,有一定作用,但弊大于利。加入这些词,反而会破坏你的 prompt,特别是一些摄影场景,比如你需要用到诸如背景虚化等效果,再加上 4K 可能就会破坏背景虚化。

所以官方建议去掉这些词。

Prompt 里的词语顺序会影响结果吗?

官方解释

Word order matters. Early words are generally more influential.

顺序会影响结果,越早出现的词,对结果影响越大。所以我设计的模版才会将「类型」放在最前面。因为这是我的最重要的目标。官方还建议:

  1. 避免列举词语:例举的意思是在 prompt 里写多个同一个意思的词。
  2. 使用具体的相关词语:越具体生成的图片越符合 prompt。
  3. 用句子片段:就是不要像写雅思作文那样,写定语从句、长难句,而是将这些词切开。
  4. 避免使用4K、8K、16K等安慰剂词汇。

为何 Seed 不生效?

官方对 Seed 的评价是:

  • Seeds can not transfer the style or appearance of images across jobs.
  • Seeds can not be used to 'bookmark' styles or appearance. (i.e. "Use seed XYZ for that!")
  • Seeds are the weakest force in Midjourney. In --v 5 they may not work as expected at all.

简单总结,就是这个功能在 V5 版本下非常不稳定,你不要预期它能跨图片传输 prompt。

Midjourney|文心一格prompt教程[进阶篇]:Midjourney Prompt 高级参数、各版本差异、官方提供常见问题的更多相关文章

  1. SpringBoot系列教程web篇之如何自定义参数解析器

    title: 190831-SpringBoot系列教程web篇之如何自定义参数解析器 banner: /spring-blog/imgs/190831/logo.jpg tags: 请求参数 cat ...

  2. SpringBoot系列教程web篇之Post请求参数解析姿势汇总

    作为一个常年提供各种Http接口的后端而言,如何获取请求参数可以说是一项基本技能了,本篇为<190824-SpringBoot系列教程web篇之Get请求参数解析姿势汇总>之后的第二篇,对 ...

  3. SpringBoot系列教程web篇之Get请求参数解析姿势汇总

    一般在开发web应用的时候,如果提供http接口,最常见的http请求方式为GET/POST,我们知道这两种请求方式的一个显著区别是GET请求的参数在url中,而post请求可以不在url中:那么一个 ...

  4. go语音之进阶篇爬百度贴吧单线程版本

    一.爬什么? 1.明确目标 : 知道你准备在那个范围或者网站去搜索 2.爬: 将所有的网站的内容全部爬下来 3.取:去掉对我们没用处的数据 4.处理数据:按照我们想要的方式存储或使用 二.百度贴吧小爬 ...

  5. 文心一言,通营销之学,成一家之言,百度人工智能AI大数据模型文心一言Python3.10接入

    "文心"取自<文心雕龙>一书的开篇,作者刘勰在书中引述了一个古代典故:春秋时期,鲁国有一位名叫孔文子的大夫,他在学问上非常有造诣,但是他的儿子却不学无术,孔文子非常痛心 ...

  6. 获取了文心一言的内测及与其ChatGPT、GPT-4 对比结果

    百度在3月16日召开了关于文心一言(知识增强大语言模型)的发布会,但是会上并没现场展示demo.如果要测试的文心一言 也要获取邀请码,才能进行测试的. 我这边通过预约得到了邀请码,大概是在3月17日晚 ...

  7. SpringBoot系列教程web篇之过滤器Filter使用指南扩展篇

    前面一篇博文介绍了在 SpringBoot 中使用 Filter 的两种使用方式,这里介绍另外一种直接将 Filter 当做 Spring 的 Bean 来使用的方式,并且在这种使用方式下,Filte ...

  8. SpringBoot系列教程Web篇之开启GZIP数据压缩

    本篇可以归纳在性能调优篇,虽然内容非常简单,但效果可能出乎预料的好: 分享一个真实案例,我们的服务部署在海外,国内访问时访问服务时,响应有点夸张:某些返回数据比较大的接口,耗时在 600ms+上,然而 ...

  9. SpringBoot系列教程web篇Listener四种注册姿势

    java web三要素Filter, Servlet前面分别进行了介绍,接下来我们看一下Listener的相关知识点,本篇博文主要内容为SpringBoot环境下,如何自定义Listener并注册到s ...

  10. SpringBoot系列教程web篇Servlet 注册的四种姿势

    原文: 191122-SpringBoot系列教程web篇Servlet 注册的四种姿势 前面介绍了 java web 三要素中 filter 的使用指南与常见的易错事项,接下来我们来看一下 Serv ...

随机推荐

  1. VsCode里面运行mvn命令显示The JAVA_HOME environment variable is not defined correctly

    问题描述 关于这个问题,就是环境配置出了问题!!! 问题解决 在settings.json里面,配置的环境的路径不能出错,我就是在配置的时候,名为Environments的文件夹写成Environme ...

  2. 在golang中如何正确判断接口是否为nil

    本文主要来分析一下在golang中,如何判断interface是否为nil,以及相关注意事项. 正常情况下,我们声明一个interface类型的变量,默认值将会返回nil,以golang自带的io.W ...

  3. 自己动手从零写桌面操作系统GrapeOS系列教程——14.屏幕显示原理与文本模式

    学习操作系统原理最好的方法是自己写一个简单的操作系统. 一.屏幕显示原理 电脑显示器屏幕是由很多很小的像素组成的.每个像素就像是一个小灯泡,在屏幕上一排一排的整齐排列着.只要能控制每个像素的颜色就能显 ...

  4. vivo 短视频用户访问体验优化实践

    作者:vivo 互联网运维团队- Hu Tao 本文介绍了vivo短视频用户访问体验优化的实践思路,并简单讲解了实践背后的几点原理. 一.背景 我们平时在看抖音快手视频的时候,如果滑动到某个视频画面一 ...

  5. 开源不易、安全慎行,中国软件如何走向文明?丨RTE 技术环境月报 202205

    各位开发者小伙伴: 这里是 2022 年第 5 期的 RTE<技术环境月报>--致力于成为对大家"有用"的 Highlight 看板--每月初通过 RTC 开发者社区( ...

  6. 来自我的Moments-实用学习资源或网站

    目录 计算机基础知识 操作系统原理 计算机网络 其他 计算机技术栈 电子技术和嵌入式 计算机专业工作和面试 软件工程师手册(华为资料) 机器人工程师学习计划-硬核-知乎文章 提升效率的工具 BIT T ...

  7. Facebook 的 Thrift

    更多内容,前往个人博客 Thrift 源于 Facebook,在 2007 年 Facebook 将 Thrift 作为一个开源项目提交给了 Apache 基金会.对于当时的 Facebook 来说, ...

  8. Teamcenter_NX集成开发:通过NXOpen查询零组件是否存在

    之前用过NXOpen PDM的命名空间下的类,现在记录一下通过PDM命名空间下的类查询Teamcenter零组件的信息,也可以用来判断该零组件是否存在. 1-该工程为DLL工程,直接在NX界面调用,所 ...

  9. Hugging News #0324: 🤖️ 黑客松结果揭晓、一键部署谷歌最新大语言模型、Gradio 新版发布,更新超多!

    每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...

  10. BEST 定理与矩阵树定理的证明

    BEST 定理:计算有向图的欧拉回路数量 欧拉图 \(G\) 的欧拉回路个数为 \(T_s(G)\prod(out_i-1)!\),其中 \(T_s(G)\) 代表以 \(s\) 为根的内向树个数,\ ...