AIGC-文生视频-学习之路

CFG

AIGC神功_SD采样方法与CFG_大猫404-站酷ZCOOLAIGC神功_SD采样方法与CFG,成都设计爱好者,站酷网,中国设计师互动平台.爱卿们好！本喵又出现了~熟悉的封面有没有把你吸引进来呢？这次让我们继续来讲AIGC的内容哟，这是篇硬核科普~https://www.zcool.com.cn/article/ZMTU0OTI0MA==.html

马尔可夫链

马尔可夫链 ▏小白都能看懂的马尔可夫链详解点击蓝字关注我们1.什么是马尔可夫链在机器学习算法中，马尔可夫链(Markov chain)是个很重要的概https://mp.weixin.qq.com/s?__biz=MzU0MDQ1NjAzNg==&mid=2247568069&idx=1&sn=8d0d44b4a4f939ff37cbda62bef9d26a&chksm=fb3b6fcecc4ce6d88a38e767c20ec9afdbc6901188489e80f2f2e4fa96fcd0043ee380224777&scene=27 简述马尔可夫链【通俗易懂】 - 知乎马尔可夫链前言马尔可夫链（Markov Chain）可以说是机器学习和人工智能的基石，在强化学习、自然语言处理、金融领域、天气预测、语音识别方面都有着极其广泛的应用 The future is independent of the past given t…https://zhuanlan.zhihu.com/p/448575579

stable diffusion的前传：

轻松理解 VQ-VAE：首个提出 codebook 机制的生成模型 - 知乎近两年，有许多图像生成类任务的前沿工作都使用了一种叫做"codebook"的机制。追溯起来，codebook机制最早是在VQ-VAE论文中提出的。相比于普通的VAE，VQ-VAE能利用codebook机制把图像编码成离散向量，为图…https://zhuanlan.zhihu.com/p/633744455

VQGAN是一个改进版的VQVAE，它将感知误差和GAN引入了图像压缩模型，把压缩图像生成模型替换成了更强大的Transformer。相比纯种的GAN（如StyleGAN），VQGAN的强大之处在于它支持带约束的高清图像生成。VQGAN借助NLP中"decoder-only"策略实现了带约束图像生成，并使用滑动窗口机制实现了高清图像生成。虽然在某些特定任务上VQGAN还是落后于其他GAN，但VQGAN的泛化性和灵活性都要比纯种GAN要强。它的这些潜力直接促成了Stable Diffusion的诞生。

如果你是读完了VQVAE再来读的VQGAN，为了完全理解VQGAN，你只需要掌握本文提到的4个知识点：VQVAE到VQGAN的改进方法、使用Transformer做图像生成的方法、使用"decoder-only"策略做带约束图像生成的方法、用滑动滑动窗口生成任意尺寸的图片的思想。

VQGAN 论文与源码解读：前Diffusion时代的高清图像生成模型 - 知乎2022年中旬，以扩散模型为核心的图像生成模型将AI绘画带入了大众的视野。实际上，在更早的一年之前，就有了一个能根据文字生成高清图片的模型——VQGAN。VQGAN不仅本身具有强大的图像生成能力，更是传承了前作VQVA…https://zhuanlan.zhihu.com/p/637705399?utm_id=0

改进版的vqgen：maskgit

[CVPR2022]MaskGIT: Masked Generative Image Transformer阅读笔记 - 知乎arxiv： MaskGIT: Masked Generative Image Transformergithub： google-research/maskgit: Official Jax Implementation of MaskGIT (github.com)笔记链接： https://occipital-aphid-dee.notion.site/MaskGIT-Ma…https://zhuanlan.zhihu.com/p/618235198

stable diffusion：

stable diffusion原理解读通俗易懂，史诗级万字爆肝长文，喂到你嘴里 - 知乎个人网站一、前言（可跳过）hello，大家好我是 Tian-Feng，今天介绍一些stable diffusion的原理，内容通俗易懂，因为我平时也玩Ai绘画嘛，所以就像写一篇文章说明它的原理，这篇文章写了真滴挺久的，如果对你有用…https://zhuanlan.zhihu.com/p/634573765

stable diffusion的相关介绍与代码展示：CLIP text encoder、UNet、文生图、文生视频、inpainting

https://zhuanlan.zhihu.com/p/617134893通向AGI之路码字真心不易，求点赞！ https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC（AI Generated Content）元年，上半年有文生图大模型DALL-E2和Stable Diffusion，下半年有OpenAI的文本对话大模型Ch…https://zhuanlan.zhihu.com/p/617134893

AnimateDiff：

https://blog.csdn.net/qq_41994006/article/details/132011849
https://blog.csdn.net/shadowcz007/article/details/131757666
https://www.zhihu.com/pin/1685665464804700161
部署：https://blog.csdn.net/weixin_51330846/article/details/133795764

https://huggingface.co/guoyww/animatediff/discussions/5