PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

nowgood 2024-09-06 09:53:28 原文

URL: https://arxiv.org/abs/1608.08021
year: 2016

TL;DR

PVANet 一个轻量级多物体目标检测架构, 遵循 “less channels with more layers” 的设计原则, 通过结合 CReLU, Inception, HyperNet 3 个模块构成了一个高效的目标检测架构, 在达到了当时 SOTA.

CReLU 应用于PVANet 早期阶段, 以将计算次数减少一半而不会失去准确性。
Inception 应用于特征生成子网络的剩余部分。 Inception 模块产生不同大小的感受野的输出，因此增加了前一层中感受野大小的多样性。我们观察到堆叠 Inception 模块可以比线性卷积链更有效地捕获大小不同大小的对象。
HyperNet 采用了多尺度表示的概念，它结合了多个中间输出，因此可以同时考虑多个级别的细节和非线性。

Dataset/Algorithm/Model/

CReLU

C.ReLU的设计动机来自对CNN中的激活模式的有趣观察。在CNN早期阶段，输出节点倾向于“成对”出现，使得一个节点的激活是另一个节点的取反。根据这一观察结果，CReLU将输出通道的数量减少了一半，并通过简单地将输出与其取反Concat来使通道加倍，这可以在网络的早期阶段加速2倍而不会失去准确性。

Inception

我们发现Inception可以是用于捕获输入图像中的小对象和大对象的最具成本效益的构建块之一。要学习捕获大型物体的视觉模式，CNN的输出特征应该对应于足够大的感受野，这可以通过堆叠3x3或更大内核的卷积来轻松实现。另一方面，为了捕获小尺寸物体，输出特征应该对应于足够小的感受野，以精确地定位感兴趣的小区域。

HyperNet

多尺度表示及其融合被证明在许多最近的深度学习任务中是有效的。将细粒度细节与特征提取层中的高度抽象信息相结合，有助于以下 RPN(region proposal network) 和分类网络检测不同尺度的对象。

PVANet

Experiment Detail

Thoughts

为设计轻量级多尺度特征检测, 特征融合提供思路

PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection的更多相关文章

[C1W3] Neural Networks and Deep Learning - Shallow neural networks
第三周:浅层神经网络(Shallow neural networks) 神经网络概述(Neural Network Overview) 本周你将学习如何实现一个神经网络.在我们深入学习具体技术之前,我 ...
PVANET----Deep but Lightweight Neural Networks for Real-time Object Detection论文记录
arxiv上放出的物体检测的文章,在Pascal voc数据集上排第二.源码也已放出(https://github.com/sanghoon/pva-faster-rcnn),又可以慢慢把玩了.这篇文 ...
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week4, Deep Neural Networks
Deep Neural Network Getting your matrix dimention right 选hyper-pamameter 完全是凭经验补充阅读: cost 函数的计算公式: ...
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week1, Introduction to deep learning
整个deep learing 系列课程主要包括哪些内容 Intro to Deep learning
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week3, Neural Networks Basics
NN representation 这一课主要是讲3层神经网络下面是常见的 activation 函数.sigmoid, tanh, ReLU, leaky ReLU. Sigmoid 只用在输出0 ...
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week2, Neural Networks Basics
Logistic regression Cost function for logistic regression Gradient Descent 接下来主要讲 Vectorization Logi ...
ReLU——Deep Sparse Rectifier Neural Networks
1. 摘要 ReLU 相比 Tanh 能产生相同或者更好的性能,而且能产生真零的稀疏表示,非常适合自然就稀疏的数据. 采用 ReLU 后,在大量的有标签数据下,有没有无监督预训练模型取得的最好效果是一 ...
DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks
1.Introduction DL解决VO问题:End-to-End VO with RCNN 2.Network structure a.CNN based Feature Extraction 论 ...
Combining STDP and Reward-Modulated STDP in Deep Convolutional Spiking Neural Networks for Digit Recognition
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 灵长类视觉系统激发了深度人工神经网络的发展,使计算机视觉领域发生了革命性的变化.然而,这些网络的能量效率比它们的生物学对 ...

随机推荐

分组排序函数——row_number()
1.MySQL8.0以上版本用法1:无分组排序 Row_number() OVER(ORDER BY 字段 DESC)例如:Row_number() OVER(ORDER BY 学生成绩 DESC) ...
pycharm报错：Process finished with exit code -1073741819 (0xC0000005)解决办法
这个是几个月前的问题了,有小伙伴在CSDN问我咋解决的,那我今天在这边把这个问题解决办法分享下吧,免得大家把很多时间都浪费在安装排坑上面,有些坑虽然解决了还真不知道啥原因. 我的pycharm一直用的 ...
ML.NET Model Builder 更新
ML.NET是面向.NET开发人员的跨平台机器学习框架,而Model Builder是Visual Studio中的UI工具,它使用自动机器学习(AutoML)轻松地允许您训练和使用自定义ML.NET ...
springboot+quartz+数据库存储
Spring整合Quartz a.quartz调度框架是有内置表的进入quartz的官网http://www.quartz-scheduler.org/,点击Downloads, 下载后在目录\do ...
Registering current configuration as safe fallback point
14:28:23,255 |-INFO in ch.qos.logback.core.joran.spi.ConfigurationWatchList@f5f2bb7 - URL [jar:file: ...
CCPC 2019 秦皇岛 Angle Beats
题目给出P个点,然后给出Q个询问,问从P中选出两个点和给的点能组成直角三角形的方法个数.-O2,时间限制5秒. \[2\leqslant P\leqslant 2000,\qquad 1\leqsl ...
一些常用的 redis 的操作配置（对String、hash）
import java.util.List; import java.util.Map; import org.apache.logging.log4j.LogManager; import org. ...
bootstrap-select使用过程中的一些问题
这里总结一下上次使用bootstrap-select的过程中遇到的一些问题.至于bootstrap-select的具体使用方法这里就不介绍了,网上有很多例子. 地址: 官方插件地址:https://d ...
zabbix通过agent监控linux主机
前言: 前几篇博客分别介绍了通过snmp来进行监控linux主机与windows主机,本篇介绍通过agent客户端来进行系统监控. 环境: server:192.168.249.142 client: ...
Git终端命令行的常用操作
一.git源代码管理的优点方便多人协同开发.工作降低代码的管理成本良好的分支管理机制二.结构分析服务端和客户端都有版本控制能力,都能进行代码的提交.合并结构一: 结构二: 三.工作区的创建 ...