ComfyUI插件:IPAdapter_plus(新版)节点

前言:

学习ComfyUI是一场持久战,而IPAdapter_plus是常用且便捷有效的风格迁移模型,可以通过提供参考图像去进行图像的生成,比如风格迁移,风格融合,人物脸部模拟等各种工作,请大家重点关注本篇内容,深刻理解节点用法!!祝大家学习顺利,早日成为ComfyUI的高手!

目录

一、IPAdapter Advanced/ IPAdapter/ IPAdapter Batch (Adv.)节点

二、IPAdapter Unified Loader FaceID/ IPAdapter Unified Loader/ IPAdapter Unified Loader Community节点

三、IPAdapter FaceID/ IPAdapter FaceID Batch节点

四、IPAdapter Tiled/ IPAdapter Tiled Batch节点

五、IPAdapter Embeds/ IPAdapter Combine Embeds/ IPAdapter Encoder节点

六、IPAdapter Noise/ Prep Image For ClipVision节点

七、“参考人物换装更换”示例工作流

一、IPAdapter Advanced/ IPAdapter/ IPAdapter Batch (Adv.)节点

这三个节点用来将IPAdapter模型的效果注入到大模型中去引导扩散。

输入:

model → 模型

ipadapter → IP适配器

image → 图像

image_negative → 负图像

attn_mask → 注意力掩码

clip_vision → CLIP视觉

参数:

weight → 权重

weight_type → 权重类型

combine_embeds → 合并嵌入 可选项为concat、add、subtract、average、norm average

start_at → 起始位置

end_at → 结束位置

embeds_scaling → 嵌入缩放;默认为'V only',可选项为'V only'、'K+V'、'K+V w/ C penalty'、'K+mean(V) w/ C penalty'

'V only':仅对视觉嵌入(V)进行缩放操作,保持其他嵌入不变。

'K+V':对键(K)和视觉嵌入(V)进行缩放操作,保持其他嵌入不变。

'K+V w/ C penalty':对键(K)和视觉嵌入(V)进行缩放操作,并在缩放过程中对C惩罚,保持其他嵌入不变。

'K+mean(V) w/ C penalty':对键(K)和视觉嵌入(V)进行缩放操作,但是在缩放视觉嵌入时使用均值进行,同时对C进行惩罚,保持其他嵌入不变。

输出:

MODEL → 输出嵌入信息之后的模型

示例:如下图所示,使用SDXL的大模型,对weight_type的四种变化方式进行了测试,可以看出权重类型的不同变换方式对最终图像的生成有很大的影响。

示例:如下图所示,对四种不同的嵌入方式进行了一一实验,大家可自行对比择优选择。

功能:

①IPAdapter Advanced 节点提供了更多高级选项和参数,以实现对图像的精细控制。该节点通常用于需要更精确调整和优化图像的情况。主要功能包括:

· 高级图像处理选项:提供一系列高级图像处理算法和参数,可以对图像进行详细的调整和优化。

· 多种滤镜和效果:允许用户应用多种滤镜和效果,以实现特定的图像风格或增强效果。

· 自定义参数:提供更灵活的自定义参数设置,用户可以根据具体需求调整每个处理步骤的参数。

②IPAdapter 节点是基本的图像处理和调整节点,提供了常用的图像处理功能。适用于大多数普通图像处理任务。主要功能包括:

· 基本图像处理功能:如裁剪、调整大小、旋转、颜色调整等。

· 预设滤镜和效果:包含一些常用的滤镜和效果,用户可以快速应用这些预设来调整图像。

· 参数设置:允许用户对基本参数进行调整,以实现所需的图像效果。

③IPAdapter Batch (Adv.) 节点专为处理大量图像而设计,适用于批量处理场景。主要功能包括:

· 批量处理:支持一次处理多张图像,提高处理效率。

· 高级处理选项:提供与IPAdapter Advanced相同的高级选项和参数,确保批量处理时仍然可以进行精细控制。

· 自动化工作流程:支持自动化设置和参数调整,减少手动操作,提高工作效率。

二、IPAdapter Unified Loader FaceID/ IPAdapter Unified Loader/ IPAdapter Unified Loader Community节点

这三个节点是用来自动加载IPAdapter和其对应的CLIP version模型的,不需要自己对应加载。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置信息

参数:

preset → 预设的模型配置

lora_strength → LoRA 模型的强度参数

provider → InsightFace 模型的提供程序

输出:

MODEL → 输出选择的模型

ipadapter → IPAdapter 模型的配置信息

示例:如下图所示,给出了IPAdapter Unified Loader FaceID的一般用法,该节点可以自动加载对应的lora,clip version和insightface模型,不需要自己进行指定,同理另外两个节点也可以自行适配不需额外的指定。

功能:

①IPAdapter Unified Loader FaceID 节点专为处理人脸识别和人脸数据加载设计,适用于需要对人脸数据进行统一处理的应用场景。主要功能包括:

· 人脸识别加载:能够从数据集中加载人脸图像,确保图像数据格式一致。

· 特征提取:提取人脸特征用于进一步处理或分析。

· 人脸对齐:自动对齐人脸图像,以便后续处理步骤中更容易处理。

②IPAdapter Unified Loader 节点是一个通用的图像数据加载节点,适用于需要统一处理和格式化图像数据的场景。主要功能包括:

· 统一数据加载:从各种来源加载图像数据,并将其格式化为统一的数据格式。

· 基本预处理:包括图像裁剪、调整大小、颜色调整等基本预处理功能。

· 数据规范化:确保所有加载的图像数据都符合统一的规范和标准,方便后续处理。

③IPAdapter Unified Loader Community 节点专为社区数据集设计,适用于加载和处理来自社区的数据集。主要功能包括:

· 社区数据集支持:支持从各种社区来源加载图像数据,例如开源数据集、公共数据集等。

· 数据整合:将来自不同社区的数据集整合为统一格式,便于统一处理。

· 社区特定预处理:提供针对社区数据集的特定预处理选项,确保处理流程优化。

三、IPAdapter FaceID/ IPAdapter FaceID Batch节点

这两个节点是用来识别人物的脸部,然后控制生成的图像跟参考图像的脸部相似,Batch节点可以批量的输入参考图像。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置

image → 图像输入

image_negative → 负图像输入

attn_mask → 注意力掩码

clip_vision → CLIP 视觉模型

insightface → InsightFace 模型

参数:

weight → 权重参数

weight_faceidv2 → FaceIDv2 权重参数

weight_type → 权重类型

combine_embeds → 嵌入组合方式

start_at → 起始位置

end_at → 结束位置

embeds_scaling → 嵌入缩放方式

输出:

MODEL → 输出选择的模型

示例:使用faceID之前,对图片要进行预处理,处理成为224*224的正方形才能提供给视觉编码模型,如果在原始图像中画蒙版,那么蒙版区域与处理后的图像并不贴合,所以会导致生成的图像并不像原图。

示例:ipadapter faceID batch节点可以同时批量处理图像

功能:

①IPAdapter FaceID 节点专为单张人脸图像的处理和识别设计,适用于需要对单个人脸图像进行识别和处理的场景。主要功能包括:

· 人脸检测:识别人脸图像中的面部区域。

· 特征提取:从人脸图像中提取独特的面部特征用于识别。

· 匹配和识别:将提取的面部特征与已有数据库中的特征进行匹配,以识别身份或验证身份。

· 图像预处理:包括图像裁剪、调整大小、对齐和颜色调整等基本预处理操作。

②IPAdapter FaceID Batch 节点专为批量处理人脸图像设计,适用于需要一次处理多张人脸图像的场景。主要功能包括:

· 批量处理:支持一次处理多个图像,极大提高了处理效率。

· 人脸检测和特征提取:与IPAdapter FaceID相同,进行人脸检测和特征提取,但能够同时处理多个图像。

· 批量匹配和识别:对多个图像中的人脸特征进行匹配和识别,适用于大规模人脸识别任务。

· 自动化处理:提供自动化处理选项,减少手动操作,适用于需要高效处理大量人脸图像的场景。

四、IPAdapter Tiled/ IPAdapter Tiled Batch节点

这两个节点可以输入非正方形的图像,然后对整体分块进行参考,让最终生成的图像参考原图的全部信息。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置

image → 图像输入

image_negative → 负图像输入

attn_mask → 注意力掩码

clip_vision → CLIP 视觉模型

参数:

weight → 权重参数

weight_type → 权重类型

combine_embeds → 嵌入组合方式

start_at → 起始位置

end_at → 结束位置

sharpening → 锐化程度

embeds_scaling → 嵌入缩放方式

输出:

MODEL → 输出最终的模型信息

mask → 如果输入有蒙版,会输出分块后的蒙版信息

tiles → 输出分块的结果

示例:

示例:如下图所示,在原图中绘制蒙版,然后将蒙版传入Tiled节点之后,节点会对蒙版也进行相应的裁剪和原始图像一一对应,最终生成的图像只参考蒙版区域进行模仿。

功能:

①IPAdapter Tiled节点用于处理单张大分辨率图像,通过将图像分成多个较小的块进行处理。主要功能包括:

· 图像分块:将大分辨率图像分成多个小块,以便更高效地处理和分析。

· 分块处理:对每个图像块单独进行处理,例如滤镜应用、特征提取等。

· 重组图像:处理完成后将各个图像块重新组合,恢复为完整的图像。

· 处理优化:通过分块处理减少内存消耗和处理时间,适用于处理高分辨率图像或复杂图像处理任务。

②IPAdapter Tiled Batch节点用于批量处理多个分块的图像,适用于需要一次处理多张大分辨率图像的场景。主要功能包括:

· 批量图像分块:支持一次将多张图像分成多个小块进行处理。

· 批量分块处理:对每个图像块进行批量处理,适用于大规模图像处理任务。

· 批量重组图像:处理完成后将多个图像的块重新组合,恢复为完整的图像。

· 高效处理:通过批量和分块处理,显著提高处理效率和资源利用率,适用于需要处理大量高分辨率图像的应用场景。

五、IPAdapter Embeds/ IPAdapter Combine Embeds/ IPAdapter Encoder节点

这三个节点组合使用,分别是对原始图像进行编码处理,合并编码后的结果,编码结果来影响模型的扩散。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置

pos_embed → 正向嵌入

neg_embed → 负向嵌入

image → 图像输入

attn_mask → 注意力掩码

clip_vision → CLIP 视觉模型

embedx → 嵌入的条件信息

参数:

weight → 权重参数

weight_type → 权重类型

combine_embeds → 嵌入组合方式

start_at → 起始位置

end_at → 结束位置

输出:

MODEL → 输出最终的模型信息

embed → 嵌入编码信息

示例:

功能:

①IPAdapter Embeds节点用于从图像中提取特征嵌入,生成用于后续处理或分析的特征向量。主要功能包括:

· 特征提取:从输入图像中提取重要特征,生成特征向量(嵌入)。

· 图像表示:将图像数据转换为低维度的特征向量,以便于后续的处理和分析。

· 多种模型支持:支持使用不同的预训练模型来提取特征嵌入,适用于各种图像处理任务。

②IPAdapter Combine Embeds节点用于将多个特征嵌入进行组合,生成一个新的综合特征嵌入。主要功能包括:

· 特征组合:将多个输入的特征嵌入进行融合,生成一个综合的特征向量。

· 多种组合方法:支持多种特征组合方法,如加权平均、拼接等,适应不同的处理需求。

· 增强特征表示:通过组合多个特征嵌入,提高特征表示的丰富性和鲁棒性,适用于复杂图像分析任务。

③IPAdapter Encoder节点用于对图像进行编码,将图像数据转换为特征嵌入。主要功能包括:

· 图像编码:将输入图像通过编码器模型,转换为特征嵌入。

· 模型训练支持:支持使用预训练模型或自定义训练的编码器模型进行编码。

· 特征表示优化:通过编码过程,优化图像特征的表示,便于后续处理或分析。

六、IPAdapter Noise/ Prep Image For ClipVision节点

这两个节点,一个是用来将原图加上噪声,并可以设置一定的控制方法,比如shuffle,第二个节点是将原始图像进行裁剪去生成适合视觉编码的图像。

输入:图像信息

参数:

type → 噪声类型

strength → 强度

blur → 模糊程度

interpolation → 插值方式

crop_position → 裁剪位置

sharpening → 锐化程度

输出:处理后的图像信息

示例:

功能:

①IPAdapter Noise 节点用于添加或处理图像中的噪声,常用于数据增强或图像处理的特定需求。主要功能包括:

· 添加噪声:在图像中添加随机噪声,以增强数据的多样性,通常用于训练深度学习模型时的数据增强。

· 噪声类型:支持多种噪声类型,如高斯噪声、椒盐噪声等,用户可以根据需要选择合适的噪声类型。

· 噪声强度:允许用户调整噪声的强度,以控制添加噪声的量级和影响。

②Prep Image For ClipVision 节点用于将图像数据预处理为适合ClipVision模型输入的格式和规范。主要功能包括:

· 图像调整:调整图像的尺寸和分辨率,使其符合ClipVision模型的输入要求。

· 图像归一化:对图像数据进行归一化处理,以匹配ClipVision模型的输入规范,通常包括将像素值缩放到特定范围(如0-1或-1到1)。

· 颜色处理:调整图像的颜色通道顺序或进行颜色归一化,以确保输入图像与ClipVision模型的训练数据一致。

七、“参考人物换装更换”示例工作流

熟练使用以上节点,你就可以搭建“参考人物换装更换”的工作流了。

该工作流输入两张图像,一张原始人物图像用来参考脸部和发型,一张一幅图像,用来作为衣服参考,衣服参考图像通过segment anything节点去抠图生成衣服对应的蒙版然后进行embed,人物直接进行embed,人物图像会加入噪声编码后去作为neg embed,然后去控制采样器出图,最终结果如下:

**孜孜以求,方能超越自我。坚持不懈,乃是成功关键。**

ComfyUI插件:IPAdapter_plus(新版)节点的更多相关文章

  1. Ztree插件,定位节点时(focus)不能进入可视区域BUG解决方案

    相关插件版本: jquery.ztree.exedit-3.4.js jquery.ztree.all-3.4.js jquery-1.8.0.js function onAsyncSuccess(e ...

  2. Jstree 使用CheckBox插件 选中父节点时被禁用的子节点也会选中问题

    问题描述: 最近用jstree遇到一个问题,使用CheckBox插件时,当父节点选中时,被禁用的子节点也会选中如下 解决方案: 1.  将jstree升级到最新的版本,v3.3.4及以上就可以 2. ...

  3. 实现一个3D图片轮播插件 —— 更新版

    前言:     前段时间写下了之前那篇 3D图片轮播效果,后来发现了 Pedro Botelho 写的jquery.gallery.js ,于是重新修改了自己的这个图片轮播,使之可以成为一个插件来使用 ...

  4. Elasticsearch-2.4.3的3节点安装(多种方式图文详解)(含 head、kopf、marvel、shield和watcher插件安装和使用)

    前提: Elasticsearch-2.4.3的下载(图文详解) Elasticsearch-2.4.3的单节点安装(多种方式图文详解) 我这里,以192.168.80.10(HadoopMaster ...

  5. 分布式搜索引擎ElasticSearch+Kibana (Marvel插件安装详解)

    在安装插件的过程中,尤其是安装Marvel插件遇到了很多问题,要下载license.Marvel-agent,又要下载安装Kibana 版本需求 Java 7 or later Elasticsear ...

  6. openfire Hazelcast插件集群配置

    原文:http://blog.csdn.net/frankcheng5143/article/details/48708899 注意虽然hazelcast 官方已经有了3.5.2版本,但是openfi ...

  7. 谷歌浏览器中安装.crx扩展名的离线Chrome插件

    一.本地拖放安装 1.下载扩展程序/脚本程序至本地计算机: 2.将其直接拖拽到浏览器的“扩展程序”(chrome://chrome/extensions/)页面. 二.解决“只能通过Chrome网上应 ...

  8. elasticsearch插件大全

    Elasticsearch扩展性非常好,有很多官方和第三方开发的插件,下面以分词.同步.数据传输.脚本支持.站点.其它这几个类别进行划分. 分词插件 Combo Analysis Plugin (作者 ...

  9. KSImageNamed-Xcode插件在xcode 6.4/6.3或其他版本中不能使用解决方案

    大家都知道这个插件很强大,但是现在这个插件最新版貌似只支持xcode7 ,需要修改KSImageNamed-xcode中的一个配置文件,添加uuid才能使他支持xcode6.3或6.4 进入下载的插件 ...

  10. Elasticsearch 5.0 安装 Search Guard 5 插件 (五)

    一.Search Guard 简介 Search Guard  是 Elasticsearch 的安全插件.它为后端系统(如LDAP或Kerberos)提供身份验证和授权,并向Elasticsearc ...

随机推荐

  1. Native如何使用Tunnel Mode

    mAudioSessionId = AudioSystem::newAudioUniqueId(AUDIO_UNIQUE_ID_USE_SESSION); mHwSync = AudioSystem: ...

  2. 面试题:两个UILabel横向排列,要求压缩其中一个Label,另外一个Label的内容保持完整

    一.题目 AutoLayout中,布局两个UILabel,竖直方向处于统一水平线上:水平方向,二者间隔一定距离,左边的label距离父容器一定间距,右边的label距离容器右侧一定间隔 要求,两个la ...

  3. switch case 跳转表

    一.事情来源 事情来源是一段奇怪的代码,代码如下 int x = 1000; switch (x) { case 1000: { NSLog(@"%d", 1); } case 2 ...

  4. Apache 服务搭建

    Apache 一.了解apache Apache(或httpd)是Internet上使用最多的Web服务器技术之一,使用的传输协议是http(Hypertext Transfer Protocol), ...

  5. .NET8 Hello World!

    ​ 使用ASP.NET Core Web Application模板创建的Empty项目如下: ​ 这是一个最简单的Web项目,运行起来会在根路径响应Hello World! 2.1.1 Progra ...

  6. Easysearch 内核完善之 OOM 内存溢出优化案例一则

    最近某客户在使用 Easysearch 做聚合时,报出 OOM 导致掉节点的问题,当时直接让客户试着调整 indices.breaker.request.limit ,但是不起作用,于是又看了下 Ea ...

  7. nginx resolver 指定多个DNS (2个DNS)

    nginx resolver 指定多个DNS (2个DNS) 直接在 resolver 后边填2个DNS,中间用空格 location / { resolver 223.5.5.5 114.114.1 ...

  8. 《Android开发卷——自定义日期选择器(一)》

    (小米手机) (中兴手机) 在实际开发中,Google官方提供的时间选择器API已经不能满足于我们的需要了,所以很多公司都是采用自定义的形式来实现日期选择器. 这个例子很简单,定义三个NumberPi ...

  9. 什么是Web3.0,和区块链又有什么关系?

    又是一个莫名其妙的词语的新起-.- 我大致归纳为以下几个点 什么是web3.0 Web 3.0(Web3)是下一代互联网的发展方向,旨在创建一个更加去中心化.用户控制和数据保护的网络环境.与之前的We ...

  10. azure 代码管理器网址

    visual studio 团队资源管理器 azure代码管理网页 记录一下 https://dev.azure.com