Bootstrap

Stable Diffusion 使用详解(1)---- 提示词及相关参数

目录

背景

提示词

内容提示词

人物及主体特征

场景

环境光照

画幅视角

注意事项及示例

标准化提示词

画质等级

风格与真实性

具体要求

背景处理

光线与色彩

负向提示词

小结

常用工具

另外几个相关参数

迭代步数

宽度与高度

提示词引导系数

图片数量


背景

AI作图提示词其实是一门学问,本质上,如果AI足够智能,其实不会有提示词写法这一说,按照人脑所想即所得的原则,进行无差别障碍的生图才是最终目标。但这之间,就现有技术而言,有着一条难以逾越的鸿沟,就是AI 生图的机制决定了,你在文生图的过程中,提示词需要尽量符合AI 模型能捕捉的原则,这是不得已而为之的做法。未来这条鸿沟应该能跨越,但实现的技术方式需要仰仗LLM及其他领域对人类语言的更深层次理解。现阶段,要想用好AI绘画,特别是文生图,掌握提示词及相关参数的用法是必不可少的。提示词有两大类,一类是内容相关的,一类是画质等绘画要求相关的,比如绘画的风格,清晰度,镜头的长远等。今天主要看下提示词的用法。

提示词

内容提示词

就是指与这个画面相关的提示词,说的越清楚,AI绘制的越到位。

人物及主体特征

  1. 服饰穿搭
    • 示例:white dressjeans and T-shirtbusiness suit
    • 可以通过颜色和款式详细描述服饰。
  2. 发型发色
    • 示例:blonde hairlong curly hairshort black hair
    • 注意描述发型的长度、颜色和卷曲程度。
  3. 五官特点
    • 示例:small eyesbig nosesmiling lips
    • 详细描述面部特征,包括眼睛大小、鼻子形状和嘴唇表情。
  4. 面部表情
    • 示例:smilingserioussad
    • 表情是传达人物情感的重要部分。
  5. 肢体动作
    • 示例:sittingwalkingstretching arms
    • 描述人物的姿态和动作。

场景

  1. 室内/室外
    • 示例:indooroutdoor
    • 初步确定场景的大致环境。
  2. 大场景
    • 示例:forestcitybeach
    • 描述主要场景背景。
  3. 小细节
    • 示例:treebushflower
    • 增添场景中的小元素,使画面更丰富。

环境光照

  1. 白天/黑夜
    • 示例:daynight
    • 确定整体光照的时间段。
  2. 特定时段
    • 示例:morningsunset
    • 细化到具体的时间段,如早晨或日落。
  3. 光环境
    • 示例:sunlightbrightdark
    • 描述整体光线的亮度。
  4. 天空
    • 示例:blue skystarry sky
    • 特定天空的颜色和特征。
  5. 光影效果
    • 示例:soft lightinghard shadowscinematic lighting
    • 详细描述光线的柔和度、阴影的强度和电影般的灯光效果。

画幅视角

  1. 距离
    • 示例:close-updistant
    • 描述镜头与主体的距离。
  2. 人物比例
    • 示例:full bodyupper body
    • 展示人物的整体或局部。
  3. 观察视角
    • 示例:from abovefrom belowfront view
    • 描述观察者的视角位置。
  4. 镜头类型
    • 示例:wide angletelephoto
    • 镜头类型影响画面的构图和透视。

注意事项及示例

需要说明的是,你最好使用英文来描述提示词,虽然有些国内的stable diffusion 应用在上面做了二次开发,支持了中文,但效果毕竟没有原生的好。实际上他的做法也是将中文提示词通过AI等翻译成英文的,所以不如英文来的直接,不对还可以自己调整。

比如我想绘制: ‘一搜木船停泊在碧蓝色的海上,阳光照耀着海水,波光粼粼,很美。’

翻译成提示词:

‘a sleek speedboat moored peacefully at the lower right corner of a sparkling, crystal clear turquoise sea, with sunlight gently kissing the water's surface, causing a shimmering, rippling effect of light and shade, capturing a serene and breathtaking beauty’

标准化提示词


画质等级


best quality:最佳质量
highest quality:最高质量
ultra highres:超高分辨率
highres:高分辨率
extremely detailed:极其详细
ultra-detailed:超详细
highly detailed:高度精细
detailed and intricate:细致而复杂


风格与真实性


photorealistic:照片真实感
realistic:真实感
raw photo:原始照片
professional illustration:专业插图
fine art:美术精品
cinematic:电影级画质


具体要求


masterpiece:杰作
best quality, masterpiece, best quality, ultra highres, ultra-detailed:这些组合词常用于提升图像的整体品质
8k wallpaper:8K高清壁纸,指明输出分辨率
physically-based rendering:基于物理的渲染,模拟真实光照和材质效果


背景处理


detailed background:细致的背景
blurry background:模糊背景
white background:白色背景
这些提示词可以帮助控制图像的背景细节或风格


光线与色彩


虽然不是直接关于画质的提示词,但光线和色彩的处理对画质有很大影响。

例如,perfect lighting、dynamic lighting等提示词可以引导模型生成具有优秀光影效果的图像。


负向提示词


有时,通过避免某些不想要的元素也可以间接提升画质。

例如,no blur、no jpeg artifacts等提示词可以确保图像清晰无伪影。

小结

描述人物
描述场景
描述环境 (时间、光照)
描述画幅视角
其他画面要素
高品质标准化画风
标准化
其他特殊要求

我们改变一些构图权重,看看

我希望看到水质发生一些变化:

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

冒号后面的是比例,默认1。 按照我的经验调整不要超过+- 0.5,不然容易走形。

水波更大了,但是我们希望船远一点,于是拉大视角,加入关键词即可。

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,long zoom,

其实有时候长的短语更能让AI找到意境,因为一个逗号表示一个完整信息,如果这个信息比较足,他会走位一个整体考虑,同时整个场景需要他考虑的事情会比那种一直满篇都是逗号的可能要好,你可能只能用权重来调整这些分布,但好的提示词更能在意境与短语间折中。

a sleek speedboat parked gracefully on a crystal clear turquoise blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

常用工具

推荐个写提示词的网站给你,因为我经常用。

AI绘画提示词生成器 - 一个工具箱 - 好用的在线工具都在这里!

另外几个相关参数

今天先讲下这几个参数

迭代步数

我们都知道 stable diffusion 的基本扩散原理,就是先变模糊,再不停迭代绘制将图片变清晰,在这一过程中,迭代步数 就是指 图像从水滴落下开始扩散,到完全清晰的过程中,你需要AI帮你做多少轮的绘制。通常来讲,迭代次数越多,画面越清晰,画质也会越好。当然决定画质的不止这一个因素,与高宽像素等也有密不可分的关系。但就一般情况而言,迭代次数达到某个阈值后,并不是迭代次数越多,画质越好。我的经验是一般 7 - 20  为宜,上了30以后,迭代次数不管怎么增加,都没太大意义。

宽度与高度

用AI绘画的人,都希望绘制的作品满足自己的大小要求,这里一般是比较大的画作。但不幸的是,AI绘画的宽度与高度越大,那么需要使用显卡的memory 就越多,所需要的时间也越多。一般情况下,要看你显卡的配置,一般大家都是用的是N卡,就是Nivida 的显卡。显存越大,AI作画的高宽像素也就越大。通常我自己来说,一般不超过1024,因为我的N卡在超过1024后,就比较慢。这时候可以通过诸如图片修复或是图生图的方式来解决,调优。

提示词引导系数

顾名思义,就是你写的prompt对AI作画影响的权重,是要完全符合你说的,还是说给AI自己一定的想象空间来完成作画。你可以尝试改变这个权重来看下对画作的影响。

图片数量

就是一次生成多少张符合你要求的图片,你可以从中选取一张作为最好的,在上面尽心后期调优。

比如像这样,一次生成3张:

今天就先写到这里吧。希望你对提示词等用法有所感悟,掌握人类语言转换为AI 作画提示词的一些技巧,这也不可能一蹴而就,需要多加练习才可以达到一定的境界。

;