一.Abstract 提出了一种end-to-end的做semantic segmentation的方法,也就是FCN,是我个人觉得非常厉害的一个方法. 二.亮点 1.提出了全卷积网络的概念,将Alexnet这种的最后的全连接层转换为卷积层,好处就是可以输入任意的scale. 只不过在输出的scale不同的时候,feature map的大小也不同,因为这里的目的是最piexl的语义分割,所以其实不重要. 在Alexnet基础上, 最后的channel=4096的feature map经过一个1x…
论文阅读——FCOS: Fully Convolutional One-Stage Object Detection 概述 目前anchor-free大热,从DenseBoxes到CornerNet.ExtremeNet,以及最近的FSAF.FoveaBox,避免了复杂的超参数设计,而且具有很好的检测效果.本文作者提出了一种全卷积的单阶段目标检测算法,类似于语义分割的做法使用像素级预测.该检测框架简单有效,而且可以方便地用于其他任务. 简介 再啰嗦一下基于anchor的检测算法的缺陷: 1.检测…
///////////////////////////////////////////推荐学习组////////////////////////////// http://www.robots.ox.ac.uk/~vgg/ //////////////////////////////////////////////////////////////////////////////////////// 多示例学习(Multiple Instance Learning) 今天一直在准备组会semina…
原文链接:http://blog.csdn.net/ikerpeng/article/details/19235391 用到论文,直接看翻译. 文章:Robust object tracking with on-line  multiple instance learning   Boris Babenko, Student Member, IEEE, Ming-Hsuan Yang, Senior Member, IEEE and Serge Belongie, Member, IEEE :P…
多示例学习:包(bags) 和 示例 (instance). 包是由多个示例组成的,举个例子,在图像分类中,一张图片就是一个包,图片分割出的patches就是示例.在多示例学习中,包带有类别标签而示例不带类别标签,最终的目的是给出对新的包的类别预测. 多示例学习是弱监督学习中的一个popular的方法.用于训练分类器的instance是没有类别标记的,但是bags却是有类别标记的,这一点与以往所有框架均不甚相同. 多示例学习中的规则:如果一个bag 里面存在至少一个instance被分类器判定标…
发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量.以AlexNet为代表的经典CNN结构适合于图像级的分类和回归任务,因为它们最后都期望得到整个输入图像的一个数值描述(概率),比如AlexNet的ImageNet模型输出一个1000维的…
这篇论文主要介绍了如何使用图片级标注对像素级分割任务进行训练.想法很简单却达到了比较好的效果.文中所提到的loss比较有启发性. 大体思路: 首先同FCN一样,这个网络只有8层(5层VGG,3层全卷积).不同的是由于图片只有image-level的标注,所以输出图像的清晰度无法保证,所以没有反卷积.图片的分辨率很低很低,但这相对于我们的期望已经很好了. FCN框图 LOSS: 这个loss说明了很多道理,我们先贴原文: 我们只关注1.该图片中有label的dense output2.含有该lab…
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet由Google提出的一种新的卷积计算方法,旨在加速卷积计算过程. 为了减小网络模型大小,提出了两种比较暴力的裁剪方法. (1) 直接对channel进行裁剪,这种随机砍掉一些channel,也太暴力了吧,砍多了效果肯定不好,想想都知道. (2) 减少输入图像的分辨率,也就是减小输入的尺寸大小. 我们还是关…
CBAM: Convolutional Block Attention Module 2018-09-14 21:52:42 Paper:http://openaccess.thecvf.com/content_ECCV_2018/papers/Sanghyun_Woo_Convolutional_Block_Attention_ECCV_2018_paper.pdf GitHub:https://github.com/luuuyi/CBAM.PyTorch 本文提出 channel atten…
1. 摘要 为解决姿态变化的问题,作者提出Pose-driven-deep convolutional model(PDC),结合了global feature跟local feature, 而local feature 还用一个feature weight network(FWN) 进行重要性程度度量,在常用reid数据集 CUHK03 .Market1501.viper 上面取到了非常好的效果. 2. 介绍 这个PDC模型有两个比较重要的子网络:FEN FWN:最后整合global feat…