sd基础

工作原理&入门



输入提示词后 有文本编码器将提示词编译成特征向量vae编码器将特征向量传入潜空间内,特征向量在潜空间内不断降噪,最后通过vae解码器将降噪之后的特征向量 解码成一个个像素组成的图片

一般选中默认vae模型



解码编码的模型



CLIP值越大,提前停止的越快,我们提示词被数字化的层数越少,提示词的相关性越小。反之越小越能丰富提示词

CLIP终止层数一般为2

其他功能



1.Hires.fix 高清修复

2.Refiner 当渲染到80% 切换另一个模型渲染

3.CFG 一般为5-10 越小ai越自由,越高越靠近提示词

4.随机种子 提示词一样,随机种子一样则可以在不同电脑生成相同图片

5.迭代步数越高 20-30 图片质量越高,步数过高则失真,且消耗更多时间,有时候还没有效果

ADetailer 修复人物的脸

采样方法 DPM++2M

网站,模型推荐

liblib NovelAI hugingface promlib civitai github
majicmix dreamshaper primemix architectrealmix

提示词 语法

英文和英文的标题符号

权重

数字越高权重越高,画面着重描述什么

[cat]=(cat:0.9)
(cat)=(cat:1.1)
{cat}=(cat:1.05)
[[cat]]=(cat:0.9x0.9)=(cat:0.81)
((cat))=(cat:1.1x1.1)=(cat:1.21)
ctrl + 上箭头 可以快捷调节 权重多低都行,过高则不行,会失真

短句与长句

一个一个词的拼写,而不是一句话呢
一个个词组会更准确,而且好调整权重
提示词控制在75个以内,正反向一样,不超过75

起手式

正向 4k masterpiece 会让图片更加精美
反向则用 text blur之类
有修饰词

提示词顺序,越靠前权重越高

no.1 画质词/画风词
no.2 主题 one girl
no.3 环境/场景/构图
no.4 lora

提示词污染

1girl,blue dress,pink hair,green umbrella,

1girl,blue dress,red hair,puple umbrella,



防止提示词尤其是颜色相互渗透 使用break隔开

提示词融合

1girl,cat  猫在女孩身上
1girl And cat 猫娘 (1girl_cat 有同样效果)
[cat|dog] 也有融合效果
{forest:1girl:0.3} 在30%的时候结束画forest
{forest:1girl:0.7} 在70%的时候结束画forest

图生图&高清修复

通过图片加提示词生成结果



使用预设起手式,并添加进提示词



通过插件来快速选择自己想要的提示词

masterpiece,best quality,1girl,police,glamor,in summer,street,

将参考图拖入图生图并增加提示词

masterpiece,best quality,1girl,police,glamor,in summer,street,coat,

增加提示词coat,通过原图再次生图

图生图重绘幅度,不过高也不过低 0.3-0.5结果图与参考图之间差距不会太大
0.5-0.7赋予ai更多想象空间
低于0.3 或大于 0.7则扭曲变形

局部重绘,增加sunglasses提示词



upscale 二次元

GAN 4X Anime6B 适合动漫放大 (Gan生成式对抗网络简称)

重绘幅度 0.3-0.5安全区间 0.5-0.7ai自由领域

放大倍数x2 512 变为1024

文生图界面



文生图界面的放大需要锁定种子



再次点击小图标来到图生图,再次放大



无需锁定种子

再次放大 模型放大



从512缩放到1024

controlnet

风格转换 softedge

最开始能通过线条处理还原参考图的只有canny

canny 硬边缘 canny将参考图通过细线勾勒出来 架构基于相邻像素计算差值,死板,图片会出现莫名奇妙的元素

softedge 全能模型 将主体勾勒



开启插件controlnet

pidinet 与 hed

hed 保留图片更多细节,完整性好 建筑,场景

pidinet 能够更好保留主体,忽视细节 人物



使用真实系的模型,将二次元图片好好描述

线稿上色 Lineart

lineart多用于线稿上色动漫类图像处理

mj 生成线稿



点击爆炸按钮后,会有去下载插件,如控制台显示git网络失败,手动去下载到相应目录解压



最好宽高比 和原来图片一样 也就是宽度和高度

controlnet-2

openpose 姿态管理



姿态成功控制



dw_openpose_full效果最好

根据参考图图片高宽一致

depth [空间关系]

场景 比如教堂

softedge + depth

控制线条分布 + 深度



depth



预处理用了hedsafe

softedge

负面提示词这里因为是建筑,所以去除finger有关



可以通过提示词来改变教堂颜色

人物

softedge openpose depth ipadapter

线条分布 绑定骨骼 空间关系 面部特征迁移/风格一致性

tile

参考图模糊,再分区块重采样 结果图细节更丰富

可以将图片拖入controlnet的单张图片,再次tile。可以看到叶子的纹路

controlnet Ipadapter

ipadapter 可以去hugingface里下载,根据后缀放在指定目录

换脸

材质迁移

风格迁移

换脸



生成一张图片,为参考图



将参考图拖进ipadapter

写实换脸,上传了自己的图片

材质迁移

ipdapter



softedge



depth



midas也不错

材质很重要,如果用下图材质则使用crystal materials

Ipadapter-1

风格迁移

选择综合性强的大模型 dreamshaper



生成参考图



风格转换 style transfer



点击生成,



生成成功后,高清放大



直接更换风格

甚至可以根据动漫角色的画风,直接变换

ipadapter与openpose综合运用

controlnet unit1 ipadapter

生成骨骼图

controlnet unit2 openpose

写提示词增加lora

要和骨骼图一样比例



有lora则更靠近赫敏的图片

综合案例使用

室内设计

大模型选择 Architecturerealmix



unit 1 mlsd处理完只包含直线



unit 2

生成毛坯房

Unfinished, nothing, no furniture, rough, house interior

精装修

ModernRoomDesign,Interior design,modern simplicity,green,(masterpiece),(high quality),best quality,real,(realistic),super detailed,(full detail),(4k),modern,fashion,grand,vista,(high floor:1.2),



去到图生图



改变关键词然后图生图

如果成品出来还想改变,继续图生图

如果想要壁纸变成自己图片的风格,通过勾选上传独立的控制图像

使用ipadapter,进行渲染

如果没有空间深度则继续使用depth

stable diffusion基础[liblib]

正向提示词

人物特征

1girl,solo,

suspender dress,headdress,delicate eyes,beautiful face,shallow smile,snow-white skin,elegant standing,

场景特点

outdoor,blue sky,white clouds,flowers,grass,

场景设定 [天气与光线与白天和黑夜]

day,night sunset,rain shrong rim light

movie light,light tracking,

场景形容词

beautifful ,happy

生图标准 [画质与风格]

8k,highest quality,high resolution

Comic Watercolor Realistic Abstract

1girl,solo,
suspender dress,headdress,delicate eyes,beautiful face,shallow smile,snow-white skin,elegant standing,
outdoor,blue sky,white clouds,flowers,grass,
movie light,light tracking,
beautiful,happy,
8k,highest quality,high resolution,
realistic,extreme detail

负向

low quality,blurry,bad proportions,cropped,watermark

ugly,bad body,missing fingers,extra feet

NSFW text logo

参数

eular a画笔选择,根据推荐来,其实都差不多

步数15-25,过高也不会有用

comfyui尝试

sd 挂lora+汉化工作流

图片有元数据

可以通过拉取图片来获得工作流

comfyui 大部分问题可以通过离线安装的方式解决 google可以解决。每当报错

通过日志去查看,工作流报红,缺模型就安装模型,缺插件安装插件,缺什么装什么

stable diffusion 入门教程的更多相关文章

  1. Stable Diffusion魔法入门

    写在前面 本文为资料整合,没有原创内容,方便自己查找和学习, 花费了一晚上把sd安装好,又花了大半天了解sd周边的知识,终于体会到为啥这些生成式AI被称为魔法了,魔法使用前要吟唱类比到AI上不就是那些 ...

  2. Stable Diffusion 关键词tag语法教程

    提示词 Prompt Prompt 是输入到文生图模型的文字,不同的 Prompt 对于生成的图像质量有较大的影响 支持的语言Stable Diffusion, NovelAI等模型支持的输入语言为英 ...

  3. AI 绘画咒语入门 - Stable Diffusion Prompt 语法指南 【成为初级魔导士吧!】

    要用好 Stable Diffusion,最最重要的就是掌握 Prompt(提示词).由于提示词对于生成图的影响甚大,所以被称为魔法,用得好惊天动地,用不好魂飞魄散 . 因此本篇整理下提示词的语法(魔 ...

  4. CTF必备技能丨Linux Pwn入门教程——格式化字符串漏洞

    Linux Pwn入门教程系列分享如约而至,本套课程是作者依据i春秋Pwn入门课程中的技术分类,并结合近几年赛事中出现的题目和文章整理出一份相对完整的Linux Pwn教程. 教程仅针对i386/am ...

  5. CTF必备技能丨Linux Pwn入门教程——利用漏洞获取libc

    Linux Pwn入门教程系列分享如约而至,本套课程是作者依据i春秋Pwn入门课程中的技术分类,并结合近几年赛事中出现的题目和文章整理出一份相对完整的Linux Pwn教程. 教程仅针对i386/am ...

  6. CTF必备技能丨Linux Pwn入门教程——环境配置

    说在前面 这是一套Linux Pwn入门教程系列,作者依据Atum师傅在i春秋上的Pwn入门课程中的技术分类,并结合近几年赛事中出现的一些题目和文章整理出一份相对完整的Linux Pwn教程. 问:为 ...

  7. AI绘画提示词创作指南:DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵

    作者:韩信子@ShowMeAI 深度学习实战系列:https://www.showmeai.tech/tutorials/42 自然语言处理实战系列:https://www.showmeai.tech ...

  8. wepack+sass+vue 入门教程(三)

    十一.安装sass文件转换为css需要的相关依赖包 npm install --save-dev sass-loader style-loader css-loader loader的作用是辅助web ...

  9. wepack+sass+vue 入门教程(二)

    六.新建webpack配置文件 webpack.config.js 文件整体框架内容如下,后续会详细说明每个配置项的配置 webpack.config.js直接放在项目demo目录下 module.e ...

  10. wepack+sass+vue 入门教程(一)

    一.安装node.js node.js是基础,必须先安装.而且最新版的node.js,已经集成了npm. 下载地址 node安装,一路按默认即可. 二.全局安装webpack npm install ...

随机推荐

  1. SHA256/SHA512码计算方式

    (1)Windows系统计算SHA256/SHA512码的方式: certutil -hashfile yourfilename SHA256/SHA512 以计算readme.txt文档进行说明: ...

  2. kettle从入门到精通 第三十六课 kettle carte 集群

    1.carte服务可以单体运行也可以集群方式运行,今天我们一起来学习下carte的集群模式部署和使用.本次示例用一个master和两个slave从节点演示. carte-config-master-8 ...

  3. 神奇的JavaScript弱等价类型转换

    JavaScript语言特性 - 类型转换 JavaScript这门语言的类型系统从来没有它表面看起来的那样和善,虽然比起Java.C#等一众强类型语言,它的弱类型使用起来似乎是如此便利,但正因为它极 ...

  4. 一个简单可分享的web数据透视分析

    我推荐一个简单可分享的在线数据透视分析网站,首先看效果: 在线数据透视展示 用户上传一个Excel或csv文件后,把指标拖拽到左右两侧,再选择合适的分析方式,在中间展示区域就会出现分析数据或者图形了, ...

  5. sftp jsch文件移动备份的思路

    1.jsch jar包不支持mv cp等移动复制的功能,转换思路,sftp下载文件到本地服务器,目录可以考虑使用/年/月/日层级. 2.然后sftp下载操作完毕,记录一张文件操作表,记录下载状态. 3 ...

  6. 关于编译告警 C4819 的完整解决方案 - The file contains a character that cannot be represented in the current code page (number). Save the file in Unicode format to prevent data loss.

    引言 今天迁移开发环境的时候遇到一个问题,同样的操作系统和 Visual Studio 版本,原始开发环境一切正常,但是迁移后 VS 出现了 C4819 告警,上网查了中文的一些博客,大部分涵盖几种解 ...

  7. logging.basicConfig()

    logging.basicConfig() 是 Python 标准库 logging 模块中的一个函数,用于配置日志记录器(logger)的基本选项.这个函数允许你在不创建和配置多个 logger.h ...

  8. Linux命令行配置RIAD5

    环境准备: 系统: redhat6.9 硬盘:300G*3 SAS MegaCli是一款管理维护硬件RAID软件,可以用来查看raid信息等 1. 安装MegaCli rpm -ivh Lib_Uti ...

  9. poj1338 ugly number 题解 打表

    类似的题目有HDU1058 humble number(翻译下来都是丑陋的数字). Description Ugly numbers are numbers whose only prime fact ...

  10. 【动手学深度学习】第三章笔记:线性回归、SoftMax 回归、交叉熵损失

    这章感觉没什么需要特别记住的东西,感觉忘了回来翻一翻代码就好. 3.1 线性回归 3.1.1 线性回归的基本元素 1. 线性模型 \(\boldsymbol{x}^{(i)}\) 是一个列向量,表示第 ...