一.论文采用的新方法

1.AttGan中skip connect的局限性

　　由于encoder中对特征的下采样实际上可能损失部分特征，我们在decoder中进行上采样和转置卷积也无法恢复所有特征，因此AttGan考虑采用了skip connect，这种跳跃连接最初是resnet中为了解决网络层数过深带来的梯度爆炸和梯度消失无法训练的问题，笔者认为在人脸属性编辑这里并非是这一用途，而是为了保持最初人脸的特征。但是这一做法仍然具有其局限性，根据实验，重建图像的质量明显上升，但是控制图像属性的能力却有所下降。

　　为了解决这一问题，在这篇论文中，提出了采用selective transfer units来自适应的选择encoder属性的办法解决这一问题。

　　（对上面这一点的理解，我咨询了师兄，得到了解释。即encoder的结果有一些是不需要改变的，因为有的属性并不需要更改，这个时候把它skip过去就会有利于这部分区域的重建，但如果是需要改变的区域，encoder这块区域的特征直接skip过去的话，decoder就会倾向于利用这块的特征，因为还有GAN Loss和重建Loss在，所以就会导致修改效果很差。所以加上STU，就是让他自适应的选择不需要改的区域传到decoder，而让需要改的区域用的decoder改之后的feature来做生成）

2.采用差分属性向量作为输入

　　在AttGan和StarGan中，都是采用源图像和目标属性完整向量作为generator的输入的，但是这样操作可能会改变一些我们无需改变的属性，为了解决这一问题，我们将差分向量作为generator的输入

　　这么做的好处不仅能使该向量简化，因为目标向量和源向量往往只有细微的不同，从而简化训练过程。而且可以提高生成图像的质量，并且差分向量在实际中更好提供（笔者对这一点持怀疑态度）。

3.选择性转换单元（Selective Transfer Units）

　　上面我们已经讲过了采用STU的原因，STU的结构是在GRU的基础上修改而成的。

　　首先我们采用转置卷积对连接的l+1层的隐状态和差分向量做处理，改变其size。　　

　　然后我们用STU自适应的改变隐状态和transformed encoder feature。

　　重置门r和更新门z的引入使得能自适应的改变encoder feature。

STU GRU

　　上面给出了STU和GRU的结构图，STU和后者的不同是STU同时输出了s^l和f^l_t，而后者只输出了f^l_t，而后者只输出了f^l_t。至于这么做的原因，在后面介绍网络结构的时候就可一目了然

二.论文网络架构

　　本网络主要由generator和discriminator两部分组成，上面展示了generator的主要结构，左边是encoder，右边是decoder。encoder由5个卷积层组成，decoder由5个反卷积层组成。STU用在除了第五个卷积层后。而discriminator有两部分att和adv两部分，adv用来判断图像的真假，att和adv共享卷积参数，并用全连接层用来预测生成图的属性。

　　针对STU，其作用表示如下：

　　除了第五个encoder的结果，其余的encoder feature都通过了STU的处理，部署在不同层的STU不共享参数。

　　我们将encoder看成是一个整体，那么其功能可以写作

　　对于整个generator，其功能为

三.损失函数

1.Reconstruction loss

　　当target图像和source图像的属性完全相同时，reconstruction loss显然为0。根据这一基准，论文定义rec loss为

2.Adversarial loss

　　这里采用了WGAN-GP的方法定义adv loss。

3.Attribute manipulation loss

　　这部分为属性编辑误差，采用了交叉熵损失函数。

4.模型总优化目标

四.代码解析

STGAN: A Unified Selective Transfer Network for Arbitrary Image Attribute Editing 阅读笔记和pytorch代码解读的更多相关文章

《Macro-Micro Adversarial Network for Human Parsing》论文阅读笔记
<Macro-Micro Adversarial Network for Human Parsing> 摘要:在人体语义分割中,像素级别的分类损失在其低级局部不一致性和高级语义不一致性方面 ...
Deep Transfer Network: Unsupervised Domain Adaptation
转自:http://blog.csdn.net/mao_xiao_feng/article/details/54426101 一.Domain adaptation 在开始介绍之前,首先我们需要知道D ...
“Triplet network”三元组网络阅读笔记
记录<DEEP METRIC LEARNING USING TRIPLET NETWORK>阅读笔记文章总体内容: 作者在前人提出的多个特征提取方法的基础上提出Triplet netwo ...
论文阅读笔记（二十一）【CVPR2017】：Deep Spatial-Temporal Fusion Network for Video-Based Person Re-Identiﬁcation
Introduction (1)Motivation: 当前CNN无法提取图像序列的关系特征:RNN较为忽视视频序列前期的帧信息,也缺乏对于步态等具体信息的提取:Siamese损失和Triplet损失 ...
[论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximati
[论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximation 本文结构解决问题主要贡献主要 ...
[论文阅读笔记] Community aware random walk for network embedding
[论文阅读笔记] Community aware random walk for network embedding 本文结构解决问题主要贡献算法原理参考文献 (1) 解决问题先前许多算法都 ...
[论文阅读笔记] LouvainNE Hierarchical Louvain Method for High Quality and Scalable Network Embedding
[论文阅读笔记] LouvainNE: Hierarchical Louvain Method for High Quality and Scalable Network Embedding 本文结构 ...
[论文阅读笔记] Structural Deep Network Embedding
[论文阅读笔记] Structural Deep Network Embedding 本文结构解决问题主要贡献算法原理参考文献 (1) 解决问题现有的表示学习方法大多采用浅层模型,这可能不能 ...
[论文阅读笔记] Unsupervised Attributed Network Embedding via Cross Fusion
[论文阅读笔记] Unsupervised Attributed Network Embedding via Cross Fusion 本文结构解决问题主要贡献算法原理实验结果参考文献 (1 ...

随机推荐

08-flask-使用pymysql
代码 from flask import Flask from flask import render_template import pymysql # 创建flask对象 app = Flask( ...
我用go-zero开发了第一个线上项目
作者:结冰前言说在最前面,我是一个外表谦让,内心狂热,外表斯文,内心贪玩的一个普通人.我的职业是程序员,是一个golang语言爱好者,一半是因为golang好用,一半是因为其他语言学不好.我是 ...
pandas的学习1-基本介绍
''' Numpy 和 Pandas 有什么不同如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式.Pandas是基于N ...
VuePress教程之深入理解插件API
VuePress教程之深入理解插件API 本文目录 1 VuePress教程之深入理解插件API 2 插件 ??? 2.1 暖暖身 2.2 插件如何运作 3 准备 3.1 Markdown 3.2 P ...
burpsuite暴力破解之四种方式
给出字典排列.详情: 1. 2. 第一项:snipper(中译:狙击手) 1.为两个参数添加payload并且选中snipper,同时指定一个字典. 2.开始attack,并且给出响应结果. 可见有两 ...
Winform 去掉最大化最小化关闭按钮（不是关闭按钮变灰）终极解决办法
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...
Semaphore信号量深度解析
1. 使用指南 package com.multthread; import java.util.concurrent.ExecutorService; import java.util.concur ...
MVC和WebApi路由机制比较
1.MVC使用的路由在MVC中,默认路由机制是通过解析url路径来匹配Action.比如:/User/GetList,这个url就表示匹配User控制器下的GetList方法,这是MVC路由的默认解 ...
web版文件管理系统 ——文件图标的获取
需求来源:公司需要一个文件的管理系统,方便管理公司文档以及互相传阅以及一些权限控制的便利,其中极小的一块功能点就是现实文件列表里面的图标获取,从网上找图标太麻烦,而且不现实,不可能用户每次上传文件等你 ...
Go-Zero 短链项目 DevOps 实战，利用 Drone CI/CD 打通上云（Kubernetes）迭代流程
Go-Zero 官方短链项目教程:快速构建高并发微服务关于 go-zero,大家可以看文档.为少认为它是中国目前最好用的 golang 微服务框架. 完整的 Go-Zero ShortUrl Dev ...

STGAN: A Unified Selective Transfer Network for Arbitrary Image Attribute Editing 阅读笔记和pytorch代码解读