GAN生成式对抗网络及应用详解
从本节开始,我们将讨论如何将生成对抗网络(GAN)应用于深度学习的某个领域。其核心方法是在训练生成器的同时,也对鉴别器进行训练,以达到改进后者的目的。同样的方法可以应用于图像处理的不同领域中。
Yann LeCun(深度学习创始人之一)提出的 GAN 已经被认为是过去的 10 年里在 ML、领域中最有吸引力的想法。GAN 可以学习如何再现看似真实的合成数据。
例如,计算机可以学习如何绘画和创造逼真的图像。这个想法最初是由 Ian Goodfellow 提出的,他曾就职于蒙特利尔大学的 Google Brain 团队,现就职于 OpenAI 团队。
什么是GAN
GAN 的关键过程很容易理解,就好像制作赝品的过程一样,赝品制作是仿造未被原创者授权艺术品的过程,原创者通常是更有名的艺术家。
GAN 同时训练两个神经网络:
- 生成器 G(Z)是用来生成赝品的模块;
- 鉴别器 D(Y)是可以根据对真实艺术品和副本的观察来判断赝品的真实性的模块。
鉴别器 D(Y)取一个输入 Y(例如一个图像)并发起投票来判断该输入的真实程度。一般来说,数值越接近于 0 表示输入越真实,而数值越接近 1 表示输入越虚假。生成器 G(Z)从一个随机噪声 Z 中生成一个输入并训练自己骗过鉴别器 D,使之认为其生成的输入都是真实的。因此训练鉴别器 D(Y)的目标是使鉴别器 D(Y)最大化来自真实数据分布的图像,并最小化不是来自真实数据分布的图像。所以生成器 G 和鉴别器 D 在玩一个对立的游戏:名为对抗训练。
需要注意的是,以交替方式训练生成器 G 和鉴别器 D,其中每个目标都表示为通过梯度下降优化的损失函数。生成器模块学会如何使输入越来越逼真,而鉴别器模块学会如何越来越准确地识别虚假输入。
鉴别器网络(通常是标准的卷积神经网络)用来界定输入图像是真实的还是生成的。一个重要的新想法是通过倒置鉴别器和发生器来调整生成器的参数,使得生成器可以学习如何在各种情况下骗过鉴别器。最终,生成器将学会如何生成与真实图像无法区分的图像: