论文笔记——In-Domain GAN Inversion for Real Image Editing

论文笔记——In-Domain GAN Inversion for Real Image Editing

3月 20, 2022 阅读 1989 字数 576 评论 0 喜欢 0

一个对于图像生成GAN逆转域的研究（GAN反演）

以前方法存在的问题：只能把图像逆转为像素，而不是原始的潜在空间(latent space)

创新点：
①可以在语义空间上对latent code编辑再让GAN生成对应图像
②域引导编码器，把图像投影到StyleGAN的潜在空间
③域正则化优化

GAN的反演主要分为两类：

第一类是把GAN生成的图像和产生他的随机潜在代码作为输入和监督来训练一个网络
第二类是基于优化的，每次处理一个实例，通过直接优化潜在代码来最小化像素级重建损失（摸索着找到一个接近的潜在代码）

网络结构

(a)表示GAN反演中，传统卷积编码器和域引导的编码器的比较。蓝色块表示可训练的，红色虚线表示监督。传统网络（上方）采用生成后的图像训练编码器E。本文的网络E采用真实图像训练编码器E，因此称为域引导编码器。生成器G不可训练，因为要保证E生成的语义不因为G改变而变。（作者认为G生成的图像不足以训练E）
(b)表示传统的卷积优化器与本文的域正则化优化器之间的比较。在优化过程中，将训练良好的域引导编码器作为正则化器，将潜在代码引入语义域。（正推再逆推的loss）

损失函数

其中F表示VGG的特征提取模型（用于计算感知损失LPIPS），Pdata表示真实数据的分布，γ表示梯度正则化的超参，λ分布表示感知和判别器的损失权重。

域正则化优化器

x是要反演的目标图像。

发表评论取消回复

相关文章返回顶部 上一篇 下一篇

图像生成评估指标
PSNR 峰值信噪比（越大越好） psnr一般是用于最大值信号和背景噪音之间的一个工程项目。通常在经过影像压缩之后，通常输出的影像都会在某种程度与原始影像不同。为了衡量经过处理...
论文笔记——[ICCV 2021]Learning for Scale-Arbitrary Super-Resolution from Scale-Specific Networks
创新点： ①从固定尺度中学习任意尺度的超分，且能处理不匀称尺度(高宽不成比例)。 ②通过对现有超分网络加入插件模块实现任意尺度的超分，该模块由多尺度感知的特征自适应块和一个...
论文笔记——Transformer in Convolutional Neural Networks
创新点： ①层次多头自注意力机制，减少计算/空间复杂度 ②结合了transformer和CNN的优势总体结构 GAP：全局平均池化 FC：全连接层 DW Conv：深度可分离卷积 IRB：反向残差瓶颈层 ...
StyleGAN和StyleGAN2
StyleGAN StyleGAN是由Nvidia研究人员于2018年12月推出的生成对抗网络，并于2019年2月可用。 StyleGAN依赖于Nvidia的CUDA软件，GPU和Google的TensorFlow。 StyleGAN的第二个版本（...
论文笔记——[AAAI 2022]Less is More: Pay Less Attention in Vision Transformers
创新点： ①在浅层用MLP编码局部特征 ②在深层用自注意力捕获长距离依赖 ③可变形的token融合模块，以非均匀的方式自适应地融合patch。特点：减少计算成本动机：先前在CNNs和Tran...
论文笔记——TVConv: Efficient Translation Variant Convolution for Layout-aware Visual Processing
（CVPR2022论文）以前存在的问题：静态和动态卷积要么与布局无关，要么计算量大，不适用于特定于布局的应用程序，例如人脸识别和医学图像分割。创新点： ①作者观察到人脸识别的...
论文笔记——GAN Prior Embedded Network for Blind Face Restoration in the Wild
创新点： ①训练一个生成高质量人脸的GAN网络，然后放到U型结构的解码侧，再通过低分辨率图像输入U型结构中进行微调（以前的工作没有微调，指pixel2style2pixel）。 ②以前的工作没...