创新点:
①多尺度图像多路径的Transformer,最后汇总以保证局部和全局特征提取
②每个stage多粒度从局部到整体的推理
CNN的多粒度连接:

- 每个阶段分辨率除以4(2*2),channel乘以2,最后输出H/32*W/32
- 在经过LN层之后,分别通过三个路径降采样,之后每个特征图都采用基于窗口的多头自注意方法进行处理,并采用移动窗口划分(SW-MSA)(来自swin Transformer)

实验:用于图像分类和语义分割
创新点:
①多尺度图像多路径的Transformer,最后汇总以保证局部和全局特征提取
②每个stage多粒度从局部到整体的推理
CNN的多粒度连接:


实验:用于图像分类和语义分割
创新点: ①两个循环协作的网络,一个恢复图像,一个评估landmark ②注意力融合模块 解决的痛点:通过低分辨率图片 LR 或者粗超分辨率图片 SR 得到的人脸先验信息不一定准确 大部分...
(CVPR2022论文) 以前存在的问题:静态和动态卷积要么与布局无关,要么计算量大,不适用于特定于布局的应用程序,例如人脸识别和医学图像分割。 创新点: ①作者观察到人脸识别的...
创新点: ①通过距离来算自注意力,距离近的patch比较精细,距离远的比较粗糙,从而减少大分辨率图像的计算量 总体结构 总体结构与传统的Vit相差不大,每个patch大小为4×4,每个s...
创新点: ①从固定尺度中学习任意尺度的超分,且能处理不匀称尺度(高宽不成比例)。 ②通过对现有超分网络加入插件模块实现任意尺度的超分,该模块由多尺度感知的特征自适应块和一个...
创新点: ①空间注意力机制 ②加入鉴别器,可以让网络生成多尺度图像(SPARNetHD) 总体结构 主要由三个模块构成: 降尺度模块 特征提取模块 升尺度模块 低分图像首先经过双线性插...
基础知识:基于3DMM的三维人脸重建技术总结 (潜码和噪声的概念见StyleGAN) (GAN逆转的文章见In-Domain GAN Inversion for Real Image Editing) 大部分的3d人脸重建因为隐私问...
创新点: ①交互式的控制图片的变化 给定一对(handle point, target point),本方法以一种优化的方式执行图像操作。如上图所示,每个优化步骤由两个子步骤组成,包括 1)运动监督...