SalGAN: Visual saliency prediction with generative adversarial networks

2017-03-17

　　摘要：本文引入了对抗网络的对抗训练机制来进行显著性物体的预测。虽然我们老板很不喜欢显著性，但是，做显著性检测的人还是会说：这是有意义的。如本文说的：恩，显著性可以作为 soft-attention，来引导其他计算机视觉任务的进行，也可以直接引导 marketing 领域。

　　本文区别于其他方法最显著的地方在于：the usage of generatvie adversarial networks。本文将训练分为两个阶段：

　　　　1. 产生器产生一个服从训练集合的伪造的样本；

　　　　2. 判别器就是用于判断给定的样本是真实的还是伪造的。

　　本文中谈到的 data distribution 意思是：实际的图像和对应的显著性图。

　本文总结的贡献点是：

　　　　1. 探索了 GAN 在显著性物体检测上的应用，在某些数据集上取得了不错的效果；

　　　　2. 在训练 DCNN 时，应用二元交叉熵损失函数和下采样显著性图是可以提升效果的。

　　本文的网络框架设计如图所示：

　　网络结构分析：

　　1. 产生器：
　　　　Convolutional encoder-decoder architecture

　　2. 判别器：

　　　　就是一个 CNN 结构。

　　训练（Training）：

　　1. Content Loss

　　　　由于产生器部分的输出是 saliency map，要计算的这部分就是：输出的 saliency map 和 gt saliency map 之间均方差 loss 。

　　　　用的就是两个 map 之间的欧式距离：

　　　　本文中 MSE 就是用来作为 baseline 的，因为大部分显著性检测的方法都是基于这个 loss function。GT saliency maps 被归一化到 0-1 之间。

　　　　这里用到了二元交叉熵损失函数：

　　2. 对抗损失

　　　　关于 GAN 这里就不在介绍了，那么显著性检测和 gan 有什么不同呢？

　　　　1. 首先，目标是拟合一个决策函数来产生实际的 saliency values，而不是从随机的 noise 中得到真实的图像；

　　　　　　　这样的话，输入给产生器的东西就不再是随机的 noise，而是一张图像；

　　　　2. 其次，显著性所对应的图是衡量质量的；

　　　　　　　所以我们将图像和 saliency map 作为输入给产生器

　　　　3. 最后，在 GAN 产生图像的时候，没有 gt 进行对比，属于无监督学习；

　　　　　　　但是，在显著性检测的时候，我们是有现有的 gt 作为对比的。

　　我们发现产生器函数更新的时候，我们发现利用判别器的loss 和对比gt得到的交叉熵损失函数，可以显著地提升对抗训练的稳定性和收敛速度。

　　最终的 loss function 可以定义为：

　　实验结果：

SalGAN: Visual saliency prediction with generative adversarial networks的更多相关文章

GD-GAN: Generative Adversarial Networks for Trajectory Prediction and Group Detection in Crowds
GD-GAN: Generative Adversarial Networks for Trajectory Prediction and Group Detection in Crowds 2019 ...
语音合成论文翻译：2019_MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis
论文地址:MelGAN:条件波形合成的生成对抗网络代码地址:https://github.com/descriptinc/melgan-neurips 音频实例:https://melgan-neu ...
StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 论文笔记
StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 本文将利 ...
论文笔记之：Semi-Supervised Learning with Generative Adversarial Networks
Semi-Supervised Learning with Generative Adversarial Networks 引言:本文将产生式对抗网络(GAN)拓展到半监督学习,通过强制判别器来输出类 ...
《Self-Attention Generative Adversarial Networks》里的注意力计算
前天看了 criss-cross 里的注意力模型仔细理解了在: https://www.cnblogs.com/yjphhw/p/10750797.html 今天又看了一个注意力模型 < ...
Paper Reading: Perceptual Generative Adversarial Networks for Small Object Detection
Perceptual Generative Adversarial Networks for Small Object Detection 2017-07-11 19:47:46 CVPR 20 ...
（转）Introductory guide to Generative Adversarial Networks (GANs) and their promise!
Introductory guide to Generative Adversarial Networks (GANs) and their promise! Introduction Neural ...
Generative Adversarial Networks,gan论文的畅想
前天看完Generative Adversarial Networks的论文,不知道有什么用处,总想着机器生成的数据会有机器的局限性,所以百度看了一些别人的看法和观点,可能我是机器学习小白吧,看完之 ...
论文笔记之：UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS
UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS ICLR 2 ...

随机推荐

yii2开启事务
public function actionAdd() { $model = new Goods(); $model->setScenario('insert'); if ($model-> ...
Python - 3. Input and Output
from:http://interactivepython.org/courselib/static/pythonds/Introduction/InputandOutput.html Input a ...
codeforces 975C Valhalla Siege
题意: 有n个巫师站成一列,每个巫师有自己的血量. 一个人射箭攻击他们,每次造成若干点伤害,巫师按照给定的顺序承受伤害,如果伤害大了,那么死掉,伤害落到下一个巫师身上. 如果一轮攻击之后,所有的巫师都 ...
canvas添加水印
<canvas id="canvas"></canvas><canvas id="water"></canvas> ...
Spark学习之路（二十）SparkSQL的元数据
一.概述 SparkSQL 的元数据的状态有两种: 1.in_memory,用完了元数据也就丢了 2.hive , 通过hive去保存的,也就是说,hive的元数据存在哪儿,它的元数据也就存在哪儿. ...
【Hbase学习之三】Hbase Java API
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-2.6.5 hbase-0.98.12.1-h ...
K-Means算法的Java实现
K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则.K-means算法以欧式距离作为相似 ...
MyEclipse如何配置Struts2源码的框架压缩包
1.MyEclipse如何配置Struts2源码的框架压缩包如本机的Struts2框架压缩包路径为:D:\MyEclipseUserLibraries\struts\struts-2.3.15.3- ...
Linux使用退格键时出现^H解决方法
以前在linux下执行脚本不注意输错内容需要删除时总是出现^H ,以前不知道真相的我没办法只有再重头运行一次脚本,后来发现其实时有解决办法的,所以记录一下. ^H不是H键的意思,是backspace. ...
P3809 【模板】后缀排序
P3809 [模板]后缀排序从这学的后缀数组sa[i]就表示排名为i的后缀的起始位置 x[i]是第i个元素的第一关键字 y[i]表示第二关键字排名为i的数,在第一关键字中的位置 #include& ...

SalGAN: Visual saliency prediction with generative adversarial networks

SalGAN: Visual saliency prediction with generative adversarial networks的更多相关文章

随机推荐

热门专题