全文共6531字,预计学习时长13分钟
图片来源:pexels.com/@gravitylicious
生成对抗网络(GAN)是生成模型的一种神经网络架构。
生成模型指在现存样本的基础上,使用模型来生成新案例,比如,基于现存的照片集生成一组与其相似却有细微差异的新照片。
GAN是使用两个神经网络模型训练而成的一种生成模型。其中一个称为“生成器”或“生成网络”模型,可学习生成新的可用案例。另一个称为“判别器”或“判别网络”,可学习判别生成的案例与实际案例。
两种模型(从博弈论的意义上来说)处于一种竞争状态,生成器企图愚弄判别器,而判别器则要同时处理生成案例和实际案例。
经学习,生成模型可生成所需的新案例。
生成对抗网络具有极为具体的使用案例,一开始这些案例理解起来会有些困难。
本文将回顾大量GAN的有趣应用,有助于你了解其能够解决的案例类型。以下列表或许并不完整,但其中包含了许多媒体介绍过的GAN使用案例。
应用案例可划分为以下18种类型:
1. 生成图像数据集案例
2014年,Ian Goodfellow等人发表论文《对抗式生成网络》,提出了生成新案例这一应用。文中指出,GAN可为MNIST手写数码数据集、CIFAR-10小件图片数据集、多伦多人像数据集生成新案例。
论文传送门:https://arxiv.org/abs/1406.2661
GAN可为图像数据集生成新案例。图片来自《生成对抗网络》。
2015年,Alec Radford等人在一篇重要论文《使用深度回旋生成对抗网络进行无监督表示学习》,也表达了类似观点。论文指出,深度回旋生成对抗网络展示了大规模培养稳定GAN的方法。论文展示了生成卧室新案例的模型。
论文传送门:https://arxiv.org/abs/1511.06434
GAN根据图像数据集生成的卧室新案例。图片来自《生成对抗网络》。
同时,论文展示了GAN(在潜在空间中)运行向量运算的能力,只需输入生成的卧室案例和人像案例即可。
GAN进行向量运算的案例。图片来自《使用深度回旋生成对抗网络进行无监督表示学习》。
2. 生成人脸照片
Tero Karras等人在2017年发表的论文《GAN质量、稳定性及变化性的提高》展示了生成人脸照片的案例,照片十分逼真。因此,论文引起了媒体的广泛关注。生成照片时以名人的脸作为输入,导致生成的案例具有名人的脸部特征,让人感觉很熟悉,却并不认识。
论文传送门:https://arxiv.org/abs/1710.10196
GAN生成人脸照片的案例。图片来自《GAN质量、稳定性及变化性的提高》。
该方法同样用于生成物品和场景案例。
GAN生成物品和场景的案例。图片来自《GAN质量、稳定性及变化性的提高》。
2018年发表的报告《人工智能的恶意使用:预测、预防及抑制》选用的也是以上案例,显示了2014至2017年GAN的快速发展。
论文传送门:https://arxiv.org/abs/1802.07228
2014至2017年GAN的快速发展。图片来自《人工智能的恶意使用:预测、预防及抑制》。
3. 生成现实照片
Andrew Brock等人在2018年发表了题为《用于高保真自然图像合成的GAN规模化训练》的论文。论文展现了用BigGAN技术生成合成照片的案例。案例照片几乎与真实照片无异。
论文传送门:https://arxiv.org/abs/1809.11096
用BigGAN技术生成合成照片的案例。图片来自《用于高保真自然图像合成的GAN规模化训练》。