AI绘图之Midjourney初体验
Midjourney (MJ) 使用笔记
最近尝试了 Midjourney 绘图,简单记录下使用流程。
注册及登陆
首先是账号注册和登陆,基本上就是一路下一步,唯一需要注意的是加入MJ频道,具体流程为:
- 打开Discord,点击右上角
Login
进入登陆界面 - 点击登陆页面下方的
Register
,进入注册页面 - 输入用于注册的相关信息,点击下方continue完成注册。
- MJ会发送一份验证邮件,需要进入邮箱点击完成验证。
- 继续登陆MJ,进入MJ主界面
- 点击左侧的
探索可发现的服务器
按钮,打开服务器界面,找到下方的Midjourney
群组并点击。如果下方没有找到,也可以在搜索框搜索
- 点
Getting Started
进入到服务器,进来之后点击最上面的加入Midjourney
,加入MJ群组。如果此处一直加入不了群组,可能是代理的国家人数太多受限了。尝试切换代理的国家,再次尝试。但是如果IP换得频繁,也有可能触发风控。 - 加入群组后,点击左上角的
私信
,打开Midjourney Bot
,即可打开和MJ机器人的对话框。
- 如果需要订购会员,在对话框输入
/subscribe
命令,点击弹出的Manage Account
,进入订阅界面。此处选择月付的标准版会员,切换到Monthly Billing
,点击Standard Plan
下放到的Subscribe
进行订阅,在弹出的窗口中输入自己的支付方式,完成支付即可。
下次使用时,从 https://discord.com/channels/@me 登陆即可。
运行指令
登陆以后,点击左上角私信
,接着选中Midjourney Bot
,即可打开和MJ机器人的对话框。
在对话框中输入各种指令(按下/
即会有智能提示,可以通过Tab键进行选择),并回车执行指令。常用参数包括:
/imagine <prompt>
为生成图像的指令,其中 prompt 是用于生成图像的文本命令
/info
了解账户的订阅信息和剩余时间/relax
切换到relax模式。该模式生成图像不消耗账户的GPU时间,但是需要排队,可能生成速度较慢/fast
切换到fast模式,该模式可以在60s内生成图像,但是需要消耗账户的GPU时间。/blend
将两个图片进行融合/settings
调整MJ的设置,包括MJ的版本、风格、质量参数、风格参数和输出模式等。
/stealth
切换到隐身模式,标准版不可用/describe
图片生成文字。上传图片,MJ返回对该图片的文字描述/ask
问问题,类似ChatGPT/show
使用图片作业ID(job id可在MJ记录中查看或复制)重新生成 Discord 中的作业/help
查看帮助信息/subscribe
管理订阅/prefer option set
创建指定变量/prefer option list
列出之前设置的所有变量/prefer suffix
指定要添加每个提示末尾的后缀,用来统一调整后续绘图的参数
绘图
掌握了MJ的基本用法后,就可以开始绘图了。比如使用命令 /imagine Diagrammatic isometric the water cycle or water cycle diagram shows four seasons of watering of Earth's surface, in the style of forest vistas, whistlerian, photoillustration, left forests but right fragment trees, 2d game art, rough-edged 2d animation Three dimensional
命令生成一个四季的水文循环的图。
命令运行时,可以在右侧看到进度,等待进度到100%,即会展示绘制的图片。
绘图最关键的就是设计prompt。比如上面的绘图命令中:
- Diagrammatic isometric提示用于科研绘图展示
- four seasons 指定4个子图分别生成4季的图像
- rough-edged 2d animation Three dimensional 用于展示2d风格和三维风格
可以尝试让ChatGPT生成绘图prompt,再自己微调。
也可以考虑上传先找到一张样图,使用/describe
命令获取MJ对该图片的描述。将该描述略微修改后,作为/imagine
命令生成图像的prompt。
比如先使用 /describe
命令对下图进行描述。
描述后,生成了4个可选的图片介绍,选择第一个描述,稍作修改后作为prompt生成图像 /imageine An educational poster titled "The Water JCyle" that depicts the water cycle from its source to oceans, highlighting key elements such as clouds and raindrops in blue color on one side of the page. The other half shows an illustration showing vegetation, rivers, lakes, etc., with arrows connecting them all around. There is also text detailing each step in the process, along with notes about soil, air, atmosphere, and Earth's surface waters.
等待片刻,即可得到基于该图生成的示意图。还是有一些相似,可以在此基础上再修改。可以看到,MJ对文字的支持不好,推荐只用MJ生成图片,后期自己加文字标注。
绘图参数
绘图时,可以在绘图的prompt后面添加一些参数,用来控制绘图的一些设置,如图像比例、清晰度之类的。常用的参数有:
--aspect
或--ar
,绘图比例,比如 4:3、16:9,默认为1:1--chaos <0-100>
或者--c <0-100>
,控制图片的创意度和多样性,数字越大,创意性越强,默认为0--no
,控制图片中不要出现的元素,比如--no dogs
,会尝试从图像中移除狗--quality
或--q
,控制图片的精细质量程度,默认值是1。数值越大,越多细节,但渲染时间越长--seed <0-4294967295>
,绘图种子,用来控制图片相似性。使用相同的种子编号和提示将产生相似(也就是并不相同)的结果图像。seed值可以影响图像的细节、颜色、形状等方面,但不会改变图像的主题和内容--stop <10-100>
,控制图片渲染到哪一个进度停止,默认为100,即全部渲染完成后再停止--style <1, 2, 3, 4, 5.0, 5.1, 5.2, or 6>
,模型版本切换,从MJ V1到MJ V6有非常多个版本可以切换。默认使用最新的 V6版本--stylize <0-1000>
或者--s
,控制图片的风格化程度,数值越高图片的艺术性越强,和写的内容偏差就越大,默认是100 (style med)--iw <0–2>
设置相对于文本粗细的图像提示粗细。默认值为 1--repeat <1–40>
重复运行n次,用于多次运行选最好的。
图片调整
MJ可以在之前绘图的基础上做各种调整。比如,初次绘图后,图片的下方会出现9个图标,可以对之前生成的图像进行调整:
- U1~U4 (Upscale) 可以选择刚才的某一个子图放大,并添加更多的细节
- V1~V4 (Vary) 可以对所选图像进行进一步变化,生成图的风格和构图会与所选图像相似
- 最后一个循环箭头的图标用于重新生成图像。
选择需要的子图后,可以继续点击下方按钮对图片进行修改,主要包括 Upscale(提高分辨率)、Zoom out(向外括图)、vary(更新图像)和平移括图。
- Upscale 是提升图片的分辨率,并添加更多细节。
- Zoom out 是以当前图像为中心,根据提示词向外括图
- Vary 是对图像的原始内容进行更新。其中:
- Vary (Subtle) 和 Vary (Strong) 是对图像整体进行重绘,Strong修改程度比Subtle更大
- Vary (Region) 则是对图片的局部进行重绘。点击按钮后,在弹出的新窗口中通过方框或者套索选择要重绘的区域,然后在下方窗口中输入用于重绘的prompt。该prompt仅需要提示如何对选定区域进行重绘,不需要添加原来的prompt。
- 4个方向按钮则是在不改变原来图像的情况下,向指定方向平移括图。
更具体的解释Vary (Region):
- 为了保证整体的协调,局部修改仍然受之前全局prompt的约束,所以如果要大面积的修改图像,仍然需要调整全局的prompt,而不是选中大范围后进行局部重绘
- 局部重绘后,没有选中的地方不会变化,选择的地方重绘后可能和原来差别很大。如果想要保证和原来绘图尽量一直,可以在绘图时设置和原来相同的随机数种子(
--seed xx
),并且增大iw参数 (比如--iw 2
,iw的范围为[0,2])。其中,2就是深度参考之前的图片,基本上构图不会发生什么变化。
如果想要重绘部分也尽可能的与原来保持一致,可以尝试Stable Diffusion。SD中绘图时可以使用ControlNet,可以在该模型中使用Candy边缘检测,使生成的图像与原图轮廓比较相近,具体可参考 stable diffusion 绘图 局部重绘
prompt设计的技巧
MJ的prompt包含3部分:图像prompt、文本prompt和参数。其中:
- 图像prompt以图像链接的形式给出,可以影响最终结果的样式和内容。图像prompt始终应该在prompt的最前方
- 文本prompt,最常用的prompt,给出要生成的图像的文本说明
- 参数,用来更改图像的生成方式,可以更改纵横比、型号、升频器等。位于prompt的末尾。
对于prompt的设计,官方有一些建议:
- 用词尽量具体。在许多情况下,更具体的同义词效果更好。比如对于大小,可以使用try tiny, huge, gigantic, enormous或者immense等词。
- 控制描述的长度。更少的词意味着每个词的影响力更大。单词间通过逗号、括号或者连字符来组织想法。如果描述太复杂,可能产生一些克苏鲁的东西……
- 专注于想要的,而不是不想要的。描述时不要写反向表达,就正向思维说想要XX呈现在图片中。如果想要控制这个XX不在生成的图片中,可以使用
--no
参数 - 尽可能处理好背景和细节,可以从以下几个方面来描述:
- 主题:人、动物、人物、地点、物体等 (Subject: person, animal, character, location, object, etc.)
- 媒介:照片、绘画、插图、雕塑、涂鸦、挂毯等 (Medium: photo, painting, illustration, sculpture, doodle, tapestry, etc.)
- 环境:室内、室外、月球上、纳尼亚、水下、翡翠城等 (Environment: indoors, outdoors, on the moon, in Narnia, underwater, the Emerald City, etc.)
- 照明:柔和、环境、阴天、霓虹灯、工作室灯等 (Lighting: soft, ambient, overcast, neon, studio lights, etc)
- 颜色:充满活力、柔和、明亮、单色、彩色、黑白、柔和等 (Color: vibrant, muted, bright, monochromatic, colorful, black and white, pastel, etc.)
- 情绪:稳重、平静、喧闹、精力充沛等 (Mood: Sedate, calm, raucous, energetic, etc.)
- 构图:人像、头像、特写、鸟瞰图等 (Composition: Portrait, headshot, closeup, birds-eye view, etc.)
- 如果要控制图片中某个物体的数量,尽量具体化。比如说"two dogs",或者"flock of birds"
- 不用考虑大写英文单词
个人感觉MJ对文字的支持不好,不要企图让MJ在图片中加入文字,不然可能会很怪。
关于MJ的更多使用,可以查看其官方文档。
本文参考:
- Midjourney官方文档
- Midjourney 新手快速起步指南
- Midjourney尝试科研绘图,图文摘要,效果惊艳!
- Midjourney指南 - 生成高分辨率图片(内容已更新至V5)
- midjourney人工智能绘图如何上手,新手小白完全攻略
- Midjourney的安装和订阅
- stable diffusion 绘图 局部重绘
- 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!
AI绘图之Midjourney初体验的更多相关文章
- ChatGPT 和 Midjourney 初体验
ChatGPT 和 Midjourney 这两个系统这些天红的发紫,自己也尝试着注册和使用了一下. 一.ChatGPT 我在上周才刚刚注册 OpenAI,注册过程也比较麻烦. 国内的 IP 是无法访问 ...
- Xamarin.iOS开发初体验
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAKwAAAA+CAIAAAA5/WfHAAAJrklEQVR4nO2c/VdTRxrH+wfdU84pW0
- .NET平台开源项目速览(15)文档数据库RavenDB-介绍与初体验
不知不觉,“.NET平台开源项目速览“系列文章已经15篇了,每一篇都非常受欢迎,可能技术水平不高,但足够入门了.虽然工作很忙,但还是会抽空把自己知道的,已经平时遇到的好的开源项目分享出来.今天就给大家 ...
- Xamarin+Prism开发详解四:简单Mac OS 虚拟机安装方法与Visual Studio for Mac 初体验
Mac OS 虚拟机安装方法 最近把自己的电脑升级了一下SSD固态硬盘,总算是有容量安装Mac 虚拟机了!经过心碎的安装探索,尝试了国内外的各种安装方法,最后在youtube上找到了一个好方法. 简单 ...
- Spring之初体验
Spring之初体验 Spring是一个轻量级的Java Web开发框架,以IoC(Inverse of Control 控制反转)和 ...
- 【腾讯Bugly干货分享】基于 Webpack & Vue & Vue-Router 的 SPA 初体验
本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/57d13a57132ff21c38110186 导语 最近这几年的前端圈子,由于 ...
- 【Knockout.js 学习体验之旅】(1)ko初体验
前言 什么,你现在还在看knockout.js?这货都已经落后主流一千年了!赶紧去学Angular.React啊,再不赶紧的话,他们也要变out了哦.身旁的90后小伙伴,嘴里还塞着山东的狗不理大蒜包, ...
- 在同一个硬盘上安装多个 Linux 发行版及 Fedora 21 、Fedora 22 初体验
在同一个硬盘上安装多个 Linux 发行版 以前对多个 Linux 发行版的折腾主要是在虚拟机上完成.我的桌面电脑性能比较强大,玩玩虚拟机没啥问题,但是笔记本电脑就不行了.要在我的笔记本电脑上折腾多个 ...
- 百度EChart3初体验
由于项目需要在首页搞一个订单数量的走势图,经过多方查找,体验,感觉ECharts不错,封装的很细,我们只需要看自己需要那种类型的图表,搞定好自己的json数据就OK.至于说如何体现出来,官网的教程很详 ...
- Python导出Excel为Lua/Json/Xml实例教程(二):xlrd初体验
Python导出Excel为Lua/Json/Xml实例教程(二):xlrd初体验 相关链接: Python导出Excel为Lua/Json/Xml实例教程(一):初识Python Python导出E ...
随机推荐
- 美团一面,面试官让介绍AQS原理并手写一个同步器,直接凉了
写在开头 今天在牛客上看到了一个帖子,一个网友吐槽美团一面上来就让手撕同步器,没整出来,结果面试直接凉凉. 就此联想到一周前写的一篇关于AQS知识点解析的博文,当时也曾埋下伏笔说后面会根据AQS的原理 ...
- HarmonyOS线上Codelabs系列挑战赛第二期:调用三方库,制作酷炫的视觉效果
HarmonyOS线上Codelabs系列挑战赛正如火如荼进行中,开发者们可以通过体验基于HarmonyOS特性和能力的应用开发,快速构建有趣.有用的应用程序.火速加入,与众多开发者一起碰撞想法, ...
- k8s之存储卷OpenEBS
一.OpenEBS简介 OpenEBS 是一种开源云原生存储解决方案,托管于 CNCF 基金会,目前该项目处于沙箱阶段. OpenEBS能够将Kubernetes工作节点上可用的住何存储转换为术卷或分 ...
- Python Flask获取iOS的UDID
测试iOS app时候,我们可以安装以下4种类型的包 : AdHoc -- 一般为正式环境验证AppStore -- 上传AppStore,只有 ...
- 必须经典GPT4.0
学习C#编程,有一些经典的教材和资源值得关注.下面列出了一些建议供你参考: 1. <C# 编程黄皮书>(C# Programming Yellow Book):Rob Miles 编著的这 ...
- git合并某分支上的单次提交(cherry-pick)
1. 查找提交对应的hash值 git log 查看 d 查看下一页,q退出 vscode通过gitlens插件查看 2.合并提交 git cherry-pick hahs值
- 力扣1337(java&python)-矩阵中战斗力最弱的 K 行(简单)
题目: 给你一个大小为 m * n 的矩阵 mat,矩阵由若干军人和平民组成,分别用 1 和 0 表示. 请你返回矩阵中战斗力最弱的 k 行的索引,按从最弱到最强排序. 如果第 i 行的军人数量少于第 ...
- 力扣32(java)-最长有效括号(困难)
题目: 给你一个只包含 '(' 和 ')' 的字符串,找出最长有效(格式正确且连续)括号子串的长度. 示例 1: 输入:s = "(()"输出:2解释:最长有效括号子串是 &quo ...
- 数据湖揭秘—Delta Lake
简介:Delta Lake 是 DataBricks 公司开源的.用于构建湖仓架构的存储框架.能够支持 Spark,Flink,Hive,PrestoDB,Trino 等查询/计算引擎.作为一个开放 ...
- 云小蜜 Dubbo3.0 实践:从微服务迁移上云到流量治理
简介:阿里云-达摩院-云小蜜对话机器人产品基于深度机器学习技术.自然语言理解技术和对话管理技术,为企业提供多引擎.多渠道.多模态的对话机器人服务.17 年云小蜜对话机器人在公共云开始公测,同期在混合 ...