您的位置:首页 > 其它

Adversarial Latent Autoencoders

2020-04-29 18:48 2041 查看

一篇GAN与AE结合的文章,用于探索AE相较GAN的生成能力和解耦表示。构建了两种AE:MLP和StyleGAN。结构如下:

把原生GAN中的G分解为F与G的映射,D分解为E与D的映射:

F是一个确定性的映射,将噪声z编码成隐变量w。 E和G是随机的,G同时取决于隐变量w和噪声的输入。E将生成的图像进行编码,然后约束由F生成的分布与由E生成的分布尽可能详尽。这样给定w就可以生成图像,给定图像就可以编码w。在推理时就可以实现重构。可以看到公式7约束的就是隐变量空间w的相似度,而非约束原生AE中的图像(数据空间)相似度。

上式即为目标函数。相比BiGAN重构效果不太受到label filp的影响:

对比在Z空间插值和直接在W空间插值的结果:后者更平滑,较为分离。

基于StyleGan的结构:

各级风格特征(均值方差)经过一个线性层来聚合后放到GAN里,此时的E就可以编码风格,重建效果:

 

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  stylegan