深度解析IP-Adapter：ComfyUI中的重要节点

来源：网络作者：趣玩小编发布时间：2024-09-17 09:58:22

中秋假期，又可以玩玩 AI 了。前面介绍了 ComfyUI 的 Lora 模型以及 ControlNet，本文介绍另一个非常重要且使用的节点，IP-Adapter。

IP-Adapter 概念

1.1 IPAdapter 的介绍
IP-Adapter 是腾讯ailab实验室发布的一个Stable Diffusion适配器，被认为是Stable Diffusion最强插件。其作用是以输入的一张或多张图像作为生成图像的提示词，实现图片风格或者肖像风格的迁移。官网地址： https://github.com/tencent-ailab/IP-Adapter

IP-Adapter的实际用途有很多，比如保留产品样式，替换背景生成海报，根据设计图纸生成装修效果图，对图片进行人脸替换等等。以下是一个商业海报案例：

1.2 IPAdapter 与 img2img 的区别
IPAdapter 与 img2img 的底层原理完全不同。IPAdapter将输入的图像作为图像提示词，而img2img则是通过提取输入图像的特征进行模仿生成。用一个不太准确的例子来描述：IPAdapter在生成图像时，是在根据文本提示词进行作画，在绘图的过程中，始终记得输入图像的风格，并将这些风格元素融入到画师的灵感中进行创作。而img2img在生成图像时，是慢慢擦除输入的参考图像，然后在这个基础上进行绘画，保留了原图像的痕迹。

基本使用

2.1 节点安装及模型下载
在ComfyUI中使用IP-Adapter需要安装节点 ComfyUI_IPAdapter_plus ，官方地址： https://github.com/cubiq/ComfyUI_IPAdapter_plus

节点安装方式有很多，之前的文章有讲过，推荐使用ComfyUI节点管理器安装
Github主页中对需要安装的模型有详细描述，下载后按要求安装到指定路径即可。需要注意的内容有：安装在/ComfyUI/models/clip_vision的两个文件下载后需要重命名，再放到对应的文件夹内；如果没有/ComfyUI/models/ipadapter这个文件夹，可以自己手动新建一个。

下载基础模型

下载FaceID模型

下载Lora模型

2.2 节点使用
首先我们加载默认的工作流看看效果：

接下来我们接入IP-Adapter节点：

这里，我们输入了一张光头强的图片，核心节点主要是 应用IPAdapter节点 ，模型需要通过一个 IPAdapter模型加载器 加载一个IP-Adapter的模型输入。注意，这里的模型要和基础大模型版本匹配。同时还需要使用 CLIP视觉加载器 加载一个视觉模型，这些模型都是刚才下载下来的。

我们固定了采样器的随机种子，其余参数也不变，IP-Adapater模型权重设置为1，看看生成效果，此时生成的人物已经变成了光头强风格，并且后面的背景也变成了森林。

基本流程就是，输入一张参考图，使用CLIP视觉模型对图像内容进行理解，再通过IPAdapter模型和基础大模型协同作用，作为条件输入到潜空间，从而实现图像风格的魔法效果。

另外， ComfyUI_IPAdapter_plus 插件还提供了另一个节点， IPAdapter加载器 。它的作用是把IPAdapter模型和Clip视觉模型一起加载进来了。

该节点需要将基础大模型连接到输入，输出的模型连接到 应用IPAdapter节点 。测试生成的图像和之前效果是一样的。

2.3 参数说明

2.3.1 IPAdater模型

IPAdapter的模型非常多，总共有十几二十个。在使用过程中，应该如何进行选择呢？前面提到，IPAdapter是将输入的参考图像作为输入条件，与提示词共同作用，两者之间既有合作又有对抗。当输入的图像风格与提示词矛盾时，以哪个为准呢，这里就跟选择的IPAdapter的模型相关了。
下面我做了一个简单的分类：

图中对sd 1.5模型进行了说明。除了框起来的部分，剩下的模型，根据名字，可以看到一些是SDXL版本的，还有一些则需要使用 bigG clip vision 模型进行视觉编码。

2.3.2 权重 Weight

权重可以通俗理解为IPAdapter的作用强度。接下来，我们将IPAdapter的权重设置为0和0.5，看看生成效果：

可以看到，权重为0时，与没有加入IPAdapter生成的图像一样，说明，权重设置为0时，IPAdapter完全没有介入，完全依靠提示词文本指导图像生成。权重设置为0.5时，提示词作用有所减弱，参考图的风格已经很明显了。对于linear类型（默认值，也是唯一老版本保留的类型），从0.8开始一般效果比较好。如果使用其他类型，可以尝试更高的值。