MIL陷入局部最优,检测到局部,无法完整的检测到物体.将instance划分为空间相关和类别相关的子集.在这些子集中定义一系列平滑的损失近似代替原损失函数,优化这些平滑损失. C-MIL learns instance subsets, where the instances are spatially related, i.e., overlapping with each other, and class related, i.e., having similar object class…
http://openaccess.thecvf.com/content_cvpr_2017/papers/Jie_Deep_Self-Taught_Learning_CVPR_2017_paper.pdf Deep Self-Taught Learning for Weakly Supervised Object Localization. Zequn Jie, Yunchao Wei, Xiaojie Jin, Jiashi Feng, Wei Liu 亮点 监督学习中用难例挖掘,弱监督中靠…
多示例学习:包(bags) 和 示例 (instance). 包是由多个示例组成的,举个例子,在图像分类中,一张图片就是一个包,图片分割出的patches就是示例.在多示例学习中,包带有类别标签而示例不带类别标签,最终的目的是给出对新的包的类别预测. 多示例学习是弱监督学习中的一个popular的方法.用于训练分类器的instance是没有类别标记的,但是bags却是有类别标记的,这一点与以往所有框架均不甚相同. 多示例学习中的规则:如果一个bag 里面存在至少一个instance被分类器判定标…
原文链接:http://blog.csdn.net/ikerpeng/article/details/19235391 用到论文,直接看翻译. 文章:Robust object tracking with on-line  multiple instance learning   Boris Babenko, Student Member, IEEE, Ming-Hsuan Yang, Senior Member, IEEE and Serge Belongie, Member, IEEE :P…
///////////////////////////////////////////推荐学习组////////////////////////////// http://www.robots.ox.ac.uk/~vgg/ //////////////////////////////////////////////////////////////////////////////////////// 多示例学习(Multiple Instance Learning) 今天一直在准备组会semina…
论文原址:https://arxiv.org/pdf/1904.02701.pdf github:https://github.com/OceanPang/Libra_R-CNN 摘要 相比模型的结构,关注度较少的训练过程对于检测器的成功检测也是十分重要的.本文发现,检测性能主要受限于训练时,sample level,feature level,objective level的不平衡问题.为此,提出了Libra R-CNN,用于对目标检测中平衡学习的简单有效的框架.主要包含三个创新点:(1)Io…
这篇论文主要介绍了如何使用图片级标注对像素级分割任务进行训练.想法很简单却达到了比较好的效果.文中所提到的loss比较有启发性. 大体思路: 首先同FCN一样,这个网络只有8层(5层VGG,3层全卷积).不同的是由于图片只有image-level的标注,所以输出图像的清晰度无法保证,所以没有反卷积.图片的分辨率很低很低,但这相对于我们的期望已经很好了. FCN框图 LOSS: 这个loss说明了很多道理,我们先贴原文: 我们只关注1.该图片中有label的dense output2.含有该lab…
本人 组会汇报的一篇关于齿痕舌判定的文章,贴上PPT 涉及多示例学习和神经网络方面知识. 准确率有待提高哈哈.…
中心思想 继Relation Network实现可学习的nms之后,MSRA的大佬们觉得目标检测器依然不够fully learnable,这篇文章类似之前的Deformable ROI Pooling,主要在ROI特征的组织上做文章,文章总结了现有的各种ROI Pooling变体,提出了一个统一的数学表达式,藉由这个表达式,提出完全可学习,无人工设计的Region特征,据Han Hu大佬的讲座所说,这篇文章现在只是提出了一种行得通的方案,还没有研究清楚,性能比Deformable Conv那篇文…
by 南大周志华 摘要 监督学习技术通过学习大量训练数据来构建预测模型,其中每个训练样本都有其对应的真值输出.尽管现有的技术已经取得了巨大的成功,但值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标签这样的强监督信息.因此,能够使用弱监督的机器学习技术是可取的.本文综述了弱监督学习的一些研究进展,主要关注三种弱监督类型:不完全监督,即只有一部分样本有标签:不确切监督,即训练样本只有粗粒度的标签:以及不准确监督,即给定的标签不一定总是真值. 关键词:机器学习,弱监督学习,监督学习…
开篇第一篇就写一个paper reading吧,用markdown+vim写东西切换中英文挺麻烦的,有些就偷懒都用英文写了. Stereo DSO: Large-Scale Direct Sparse Visual Odometry with Stereo Cameras Abstract Optimization objectives: intrinsic/extrinsic parameters of all keyframes all selected pixels' depth Inte…
Link of the Paper: https://arxiv.org/abs/1412.2306 Main Points: An Alignment Model: Convolutional Neural Networks over image regions ( An image -> RCNN -> Top 19 detected locations in addition to the whole image -> the representations based on th…
Relation Networks for Object Detection笔记  写在前面:关于这篇论文的背景知识,请参考我前面的两篇随笔(<关于目标检测>和<关于注意力机制>) 摘要: 所有最先进的物体检测系统仍然依赖于单独识别物体实例, 在学习过程中并没有利用它们的关系.(背景) 这个工作提出了一个目标关系模块.它通过它们的外观特征和几何图形之间的交互来同时处理一组物体,从而对它们之间的关系进行建模.它是轻量级的和就地(in-place)这里的relation module是…
Inside-Outside Net (ION) 论文:Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks 发表时间:2016 发表作者:(Cornell University)Sean Bell, C. Lawrence Zitnick,(Microsoft Research)Kavita Bala, Ross Girshick 论文链接:论文链接 本文…
文章链接:https://arxiv.org/pdf/1509.06451.pdf 1.关于人脸检测的一些小小总结(Face Detection by Literature) (1)Multi-view Face Detection Using Deep Convolutional Neural Network Train face classifier with face (> 0.5 overlap) and background (<0.5 overlap) images. Comput…
Perceptual Generative Adversarial Networks for Small Object Detection 2017-07-11  19:47:46   CVPR 2017 This paper use GAN to handle the issue of small object detection which is a very hard problem in general object detection. As shown in the followin…
研究内容:弱监督时域动作定位 结果:Thumos14 mAP0.5 = 27.0 ActivityNet1.3 mAP0.5 = 34.5 从结果可以看出弱监督这种瞎猜的方式可以PK掉早些时候的一些全监督方法 Code: GitHub P.S.我在机器上复现始终差一点点 Motivation: 发现之前的工作没有考虑到背景类别,会将背景帧误分为动作类别,造成大量FP.本文提出了背景抑制网络BaSNet,引入了额外的背景类,两支镜像网络(一支为base网络,一支为用attention抑制背景的su…
Faster R-CNN 论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 发表时间:2016 发表作者:(Microsoft)Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun 发表刊物/会议:NIPS 论文链接:论文链接 论文代码:Matlab版本点击此处,Python版本点击此处 2015 年微软研究院的任少庆.何恺明以及…
目录 写在前面 目标检测任务与挑战 目标检测方法汇总 基础子问题 基于DCNN的特征表示 主干网络(network backbone) Methods For Improving Object Representation Context Modeling Detection Proposal Methods Other Special Issues Datasets and Performance Evaluation 博客:blog.shinelee.me | 博客园 | CSDN 写在前面…
1. 早期C. Koch与S. Ullman的研究工作. 他们提出了非常有影响力的生物启发模型. C. Koch and S. Ullman . Shifts in selective visual attention: Towards the underlying neural circuitry. Human Neurobiology, 4(4):219-227, 1985. C. Koch and T. Poggio. Predicting the Visual World: Silenc…
Hierarchical Object Detection with Deep Reinforcement Learning NIPS 2016 WorkShop  Paper : https://arxiv.org/pdf/1611.03718v1.pdf Project Page : https://github.com/imatge-upc/detection-2016-nipsws  摘要: 我们提出一种基于深度强化学习的等级物体检测方法 (Hierarchical Object  De…
Learning to Track Any Object 2019-10-28 12:14:49 Paper: https://arxiv.org/abs/1910.11844 1.…
目录 Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection 一. 论文简介 将目标检测Loss和评价指标统一,提升检测精度.这是一篇挺好的论文,下面会将其拓展到其它领域. 主要做的贡献如下(可能之…
Learning Goals: Understand the challenges of Object Localization, Object Detection and Landmark Finding Understand and implement non-max suppression Understand and implement intersection over union Understand how we label a dataset for an object dete…
目录 Single Shot Detectors for Object Detection Deep learning-based object detection with OpenCV   这篇文章只是基于OpenCV使用SSD算法执行目标检测:不涉及到SSD的理论原理.不涉及训练过程:也就是说仅仅使用训练好的模型文件基于OpenCV做测试:包括图片和视频:   只用作笔记,原教程地址:Object detection with deep learning and OpenCV Single…
第一印象 Rank & Sort Loss for Object Detection and Instance Segmentation 这篇文章算是我读的 detection 文章里面比较难理解的,原因可能在于:创新的点跟普通的也不太一样:文章里面比较多公式.但之前也有跟这方面的工作如 AP Loss.aLRPLoss 等.它们都是为了解决一个问题:单阶段目标检测器分类和回归在训练和预测不一致的问题.那么 Rank & Sort Loss 又在以上的工作进行了什么改进呢?又解决了什么问题…
Motivation: The lack of transparency of the deep  learning models creates key barriers to establishing trusts to the model or effectively troubleshooting classification errors Common methods on non-security applications: forward propagation / back pr…
Link of the Paper: https://arxiv.org/abs/1705.03122 Motivation: Compared to recurrent layers, convolutions create representations for fixed size contexts, however, the effective context size of the network can easily be made larger by stacking severa…
Link of the Paper: https://arxiv.org/abs/1806.06422 Innovations: The authors propose a novel learning based discriminative evaluation metric that is directly trained to distinguish between human and machine-generated captions. They train an automatic…
Link of the Paper: https://arxiv.org/pdf/1504.06692.pdf Innovations: The authors propose the Novel Visual Concept learning from Sentences ( NVCS ) task. In this task, methods need to learn novel concepts from sentence descriptions of a few images. Th…