最近在学习生成对抗网络的相关知识,首先接触到的当然是Ian Goodfellow的原始论文,文章中作者很简要的阐明了GAN的基本算法,同时也给出该算法可行的理论证明。
该模型通俗点说,就是可以利用已知分布的数据对模型进行训练,训练完成后,该网络能够自动的生成与原始数据分布相似的数据。举例来说,给网络投喂熊猫的照片进行训练,训练完成后,网络会自动生成一组熊猫的照片。在今年的ICLR大会上,就有一篇关于GAN生成图像的文章,利用文章的算法生成的图像十分逼真,某些图片肉眼也很难分清差别。
上图是使用改造过后的GAN算法生成的,可谓是栩栩如生。GAN算法从14年发表到现在,短短五六年,接着深度学习的东风有了长足的发展。GAN的算法很简单,但是对其可行性的证明中用到一些概率相关的数学工具,需要好好的理解。本文中很多的观点是个人的理解,难免有很多的疏漏,希望大家可以在文章下留言指正。
1 生成模型与判别模型
与以往经典的机器学习算法相比,GAN算法最大的创新来自于结合了生成模型和判别模型,以二者的相互对抗进而相互优化。作者将GAN比喻为警察和假币制造者的一场零和博弈,最开始罪犯制造好假币,警察通过技术手段辨认出真伪,后罪犯提高假币的制造水准,警察的辨认能力也不断地提高。就在二者的相互博弈中,罪犯制造假币的能力不断提升,警察的辨认能力也达到了顶峰。这里的罪犯便是网络中的生成器,而警察则是模型中的判别器。
关于生成模型和判别模型不是文章的重点,Ian Goodfellow在原文中提到使用任何一种生成方法和判别方法都是可以的。但是了解生成模型和判别模型有何区别,有助于我们理解文章。
上图是生成模型与判别模型在机器学习中的值观体现,对于二分类问题,判别方法直接学习出决策函数(如左图的决策边界)或者条件概率,但是对于数据确切的分布情况的是未知的。例如我们熟悉的感知机、K近邻算法等。而生成方法则是学习数据的内在分布,通过概率判断分类。
总而言之,判别方法学习得到的是一个判断数据是否属于某一类的模型,而生成方法则学习到数据的分布。
而本文的关键就是生成一个与输入数据分布相似的分布,故核心就是训练一个好的生成器,而怎么训练呢又是一个问题。
2 模型实体
为了让大家对整个模型有个值观的印象,给出是Ian Goodfellow演讲PPT中的一张图&#x