基于生成对抗网络的图像信息隐藏研究
1、GAN的概述
生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 D 都是神经网络,只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D 。一个优秀的GAN应用需要有良好的训练方法,否则可能由于神经网络模型的自由性而导致输出不理想。
GAN包括两个模型,一个是生成模型 G(Generator),一个是判别模型 D(Discriminator)。他们分别的功能是:
G负责生成图片,他接收一个随机的噪声z,通过该噪声生成图片,将生成的图片记为G(z)
D负责判别一张图片是不是“真实的”。它的输入是X,X代表一张图片,输出D(x)表示x为真实图片的概率,如果为1,代表是真实图片的概率为100%,而输出为0,代表不可能是真实的图片(真实实例来源于数据集,伪造实例来源于生成模型)
在训练过程中,生成模型G的目标是尽量生成看起来真的和原始数据相似的图片去欺骗判别模型D。而判别模型D的目标是尽量把生成模型G生成的图片和真实的图片区分开来。这样,生成器试图欺骗判别器,判别器则努力不被生成器欺骗。两个模型经过交替优化训练,互相提升,G和D构成了一个动态的“博弈”,这是GAN的基本思想。
最后博弈的结果是什么?在最理想的状态下,G可以生成足以“以假乱真”的图片G(z)。对于D来说,它难以判定G生成的图片究竟是不是真实的,因此D(G(z))=0.5。此时得到了一个生成式的模型G,它可以用来生成图片。图1-1 GAN网络整体示意图
如上图所示,我们有两个网络,生成网络G(Generayor)和判别网络D(Discriminator)。生成网络接收一个(符合简单分布如高斯分布或者均匀分布的)随机噪声输入,通过这个噪声输出图片,记做G(z)。判别网络的输入是x,x代表一张图片,输出D(x)代表x为真实图片的概率。
2、图像信息隐藏
图像隐写(image steganography)技术属于一种新型技术,融合了计算机网络、信号处理以及 密码学相关的知识,它将信息伪装成不引人注意的普通信息嵌入到图像中,从而达到隐蔽、传递消息的目的。其基本模型如图1所示。
基于传统图像信息隐藏方法存在的难以抵抗基于特征学习的深度神经网络隐写分析技术的问题,可以将生成式对抗网络引入到原始图像隐写方法中,利用 GAN 模型中的博弈对抗策略,为 图像信息隐藏生成更安全的载体信息,更高视觉质量的图像,增强其抵抗隐写分析的性能。
3、基于生成对抗网络的图像信息隐藏研究
有关基于生成对抗网络的图像信息隐藏,目前常用的图像信息隐藏方法主要包括空域和变换域的信息隐藏方法。空域隐藏方法比如图像最低有效位( Least Significant Bit,LSB)隐藏方法[8]、空域通用小波相对失真( Spatial-UNIversal WAvelet RelativeDistortion,S-UNIWARD)方法[9]、HUGO( Highly Undetectable steganography)[10]、WOW( Wavelet Obtained Weights)等; 变换域方法如离散傅里叶变换( Discrete Fourier Transform, DFT )隐藏方法[11]、离散余弦变换( Discrete Cosine Transform, DCT) 隐藏方法[12]、离散小波变换( Discrete Wavelet Transform, DWT) 等。隐藏方法图像信息隐藏技术需具备不可感知性、鲁棒性和嵌入量三个特性[13]。
不可感知性:不可感知性是指利用图像信息隐藏技术将秘密信息加载到载体图像中后,载体图像无法通过视觉感知分辨是否加载了秘密信息。
鲁棒性:如果在经受一定攻击,如裁剪、旋转、滤波攻击、噪声攻击等,仍能将秘密信息完整的提取出来,说明鲁棒性较好。
嵌入量:嵌入量是指在保证不可感知性的前提下能够在载体图像中隐匿的最大秘密信息的信息量。