1、大模型加载节点
大模型加载节点是Comfyui的核心节点之一,用来加载训练好的模型文件,不同的模型包容性和偏向性不同,模型可以在C站(https://civitai.com)免费下载使用,也可以自己基于某个基础模型训练处自己的模型。
大模型加载节点使用时选择一个模型路径,就可以输出三个值,模型、条件和VAE
2、正向提示词节点
正向提示词节点是我们控制AI生成走向的关键手段,通过描述不通的正向提示词,告诉AI我们想要的画面,AI会基于这些词语,努力生成我们想要的样子。
正向提示词书写时在早期SD1.5大模型时,都以单个单词+一个逗号(例如:1girl,black hair)这种形式来书写,越靠前的单词,权重越高,权重的意思就是AI识别词语时的重视程度,越往后的提示词,AI越容易忽略。在SDXL大模型时期,已经不在提倡用单词形式提示AI了,而是变成了自然语言为主,(例如:A big head photo of a girl with black hair)
正向提示词节点左侧的CLIP要连接大模型输出的CLIP,右侧的输出条件,后面会连接到采样器的正向提示词上
3、负向提示词节点
负向提示词节点也是我们控制AI生成走向的手段,通过描述不通的负向提示词,告诉AI我们不想要出现的元素。比如图片中不想要出现文字,不想要都出现坏手等等,
负向提示词节点左侧的CLIP连接的是大模型输出的CLIP,右侧的输出条件,后面会连接到采样器的负向提示上
4、空潜节点
空潜就是设置要绘制的图片的几个属性,有宽高,和批次,批次就是要生成多少个图片,文生图工作流会用到空潜,另外如果是图生图,就是对空潜做修改,下一篇会讲到。
空潜没有输入值,只有输出值,输出的Latent连接到采样器的Latent上
5、采样器节点
采样器节点是Comfyui工作流最重要核心节点,可以说其他节点都是在输入,采样器就是AI的大脑部分,所有的条件经过采样器后就形成了一个AI印象中的图片,后面只需要经过解码就能拿到这张图。
采样器的输入一般有
模型,来自大模型的模型数据
正面条件,来自大模型的CLIP并经过正向提示词节点插入的正面条件
负面条件,来自大模型的CLIP并经过负向提示词节点插入的负向条件
Latent,来自空潜的Latent数据
随机种子,随机种子就是其他所有条件都不变的情况下的其中一张AI大脑中的图片,如果条件都不变,改变了随机种子,那么生成的图片就是一张新图,如果其他条件都不变,随机种子也不变,最终出来的图也是不变的
运行后操作,可以选择随机,固定等,用来设置随机种子的变化方式的
步数,步数是AI生成图片的过程中的变化次数,简单理解就是AI要生成要一张图,会根据条件,先大概画一张模糊的,然后让这一张模糊的一步步变得清晰,变化过程中会按照提示词的意思添加一些元素上去,大模型的不同所需的步数是不一样的,有的大模型20步就够了,有的要30步,步数的设置按照选择的大模型不同而改变就行,一般下载大模型的时候,模型作者都会提供步数的参考值
CFG,意思是提示词相关性,AI绘图时,AI有一定的随机性,而CFG的值是用来强调提示词的权重,值越大,最终图片受到提示词影响越大,这个不用太大,总要留一些空间给AI发挥,一般选择大模型的时候,作者也会提供CFG的参考值
采样器,就是采样方法,采样器会给出几个选项,一般大模型的作者也会给出采样方法的参考选项
调度器,就是采样曲线,一般大模型作者也会给出参考曲线,或者选择不同的调度器都试一下,那个出图符合预期就用那个
降噪,文生图一般都设置为1就行,在图生图的时候,降噪设置给0.4到0.5时就相当于在参考图基础上做微调,如果图生图的时候,降噪设置为1,那么参考图就会被修改的面目全非
6、VAE解码节点
VAE解码节点左侧连接的是采样器的输出值Latent,以及大模型的输出值VAE,右侧输出的是能显示出来的图片数据
VAE解码节点的作用就是将在AI大脑采样器中形成的图片描述数据,转换成像素数据,因为只有像素数据才能生成图片文件
7、图片保存节点
图片保存节点就是用来将解码后的数据转换成我们经常用的PNG图片,这个节点一般会工程的output目录下保存一个名称前缀是ComfyUI的png图片
当然如果只是随手生成,不想保存图片,只想看看,也可将图片保存节点替换为图片预览节点
这一篇讲到了Comfyui的基础文生图工作流,以及基础节点的值的大概意思,通过基础工作流,我们能通过描写不同的提示词得到一些随机图片,想要一张自己满意的图,在这个基础工作流只能通过不断的随机生成,靠运气获取,下一篇讲解通过基础文生图的稍微变种,就能变成图生图工作流,图生图能做到的是提供参考图,生成和参考图相关的图片,比如图片修复,图片风格修改等等,会更好玩一些