GAN(Generative Adversarial Network)代表了深度学习中生成建模的尖端方法,通常利用卷积神经网络等架构。生成建模的目标是自主识别输入数据中的模式,使模型能够生成与原始数据集相似的新示例。
本文涵盖了您需要了解的有关 GAN、GAN 架构、GAN 的工作原理以及 GAN 模型类型等的所有信息。
目录
- 什么是生成对抗网络?
- GAN 的类型
- GAN 的架构
- GAN 是如何工作的?
- 生成对抗网络 (GAN) 的应用
- GAN 的优势
- GAN 的缺点
- GAN(Generative Adversarial Network) - 常见问题
什么是生成对抗网络?
生成对抗网络 (GAN) 是一类功能强大的神经网络,用于无监督学习。GAN 由两个神经网络组成,一个判别器和一个生成器。 他们使用对抗性训练来生成与实际数据相同的人工数据。
- 生成器试图通过生成随机噪声样本来欺骗判别器,判别器的任务是准确区分生成的数据和真实数据。
- 这种竞争互动产生了逼真的高质量样本,这推动了两个网络的发展。
- GAN 被证明是用途广泛的人工智能工具,它们在图像合成、样式迁移和文本到图像合成中的广泛使用证明了这一点。
- 他们还彻底改变了生成建模。
通过对抗性训练,这些模型进行竞争性相互作用,直到生成器能够熟练地创建真实的样本,从而在大约一半的时间里欺骗判别器。
生成对抗网络 (GAN) 可以分为三个部分:
- 生成式:学习生成式模型,该模型描述数据是如何根据概率模型生成的。
- 对抗性:对抗性这个词是指将一件事与另一件事对立起来。这意味着,在 GAN 的上下文中,生成结果与数据集中的实际图像进行比较。一种称为判别器的机制用于应用尝试区分真实和虚假图像的模型。
- 网络:使用深度神经网络作为人工智能 (AI) 算法进行训练。
GAN 的类型
- 原版 GAN:这是最简单的 GAN 类型。在这里,Generator 和 Discriminator 只是一个基本的多层感知器。在 vanilla GAN 中,算法非常简单,它尝试使用随机梯度下降来优化数学方程。
- 条件 GAN (CGAN):CGAN 可以被描述为一种深度学习方法,其中设置了一些条件参数。
- 在 CGAN 中,将向生成器添加一个附加参数“y”,以生成相应的数据。
- 标签也被放入 Discriminator 的输入中,以便 Discriminator 帮助区分真实数据和虚假生成的数据。
- 深度卷积 GAN (DCGAN):DCGAN 是最流行也是最成功的 GAN 实现之一。它由 ConvNet 组成,而不是多层感知器。
- ConvNets 的实现没有最大池化,实际上被卷积步幅所取代。
- 此外,层未完全连接。
- 拉普拉斯金字塔 GAN (LAPGAN):拉普拉斯金字塔是一种线性可逆图像表示,由一组间隔一个八度的带通图像和一个低频残差组成。
- 这种方法使用多个 Generator 和 Discriminator 网络以及不同级别的 Laplacian Pyramid。
- 使用这种方法主要是因为它可以生成非常高质量的图像。图像首先在金字塔的每一层进行下采样,然后在向后传递中再次在每一层上放大,其中图像从这些层的条件 GAN 中获取一些噪声,直到达到其原始大小。
- 超分辨率 GAN (SRGAN):SRGAN,顾名思义,是一种设计 GAN 的方法,其中深度神经网络与对抗网络一起使用,以产生更高分辨率的图像。这种类型的 GAN 在以最佳方式放大原生低分辨率图像以增强其细节以最大限度地减少错误时特别有用。
GAN 的架构
生成对抗网络 (GAN) 由两个主要部分组成,即生成器和判别器。
- 生成器型号
负责在生成对抗网络 (GAN) 中创建新鲜、准确数据的关键元素是生成器模型。生成器将随机噪声作为输入,并将其转换为复杂的数据样本,例如文本或图像。它通常被描述为深度神经网络。
训练数据的基础分布是通过训练在其设计中的可学习参数层来捕获的。生成器调整其输出,以生成与训练时非常相似的样本,方法是使用反向传播来微调其参数。
生成器能够生成高质量、多样化的样本,从而骗过判别器,这就是它成功的原因。
- 生成器损失
GAN 中生成器的目标是生成足够逼真的合成样本,以欺骗判别器。生成器通过最小化其损失函数来实现这一点JG.当对数概率最大化时,即当判别器极有可能将生成的样本归类为真实样本时,损失最小。以下方程式如下:
- JG测量生成器欺骗判别器的能力。