MetaAnchor: Learning to Detect Objects with Customized Anchors

Intro

本文我其实看了几遍也没看懂，看了meta以为是一个很高大上的东西，一搜是元学习的范畴，学会如何学习，很绕人。万般无奈之下请教了下老师，才知道他想表达什么。其实作者的想法很简单，就是先把最后anchor预测类别和位置的权重拿出来，这里的权重通过设计另一个网络来预测，而这个网络的参数又可以通过整个网络的训练梯度回传来学习。这样做的好处是，将anchor的配置(w,h)当成了输入，只需要给定一组anchor参数，就可以完成特定的预测任务，也不用事先指定anchor的数量了，确实是好想法。

Anchor Function

我们知道传统神经网络都是通过事先设定好anchor的种类，然后训练，在训练完成后anchor就固定了，如果想要改变anchor的数量，那么就需要重新训练网络了，而本文的方法的好处是，一次训练，稍微更改，就能适应新的任务！

首先这个anchor function是给定输入的某个特征x和参数sita，来表征这个bin在给定参数下的类别置信度和回归offset的。sita cls 和sita reg 其实理解过来就是预测和回归网络的权重，以参数的形式表达了出来。我觉得这里只要理解了后面就没啥问题了。

作者的想法很简单，就是把anchor的配置作为输入来预测这个权重，这样就能很方便的动态调整anchor的尺度。

Anchor Function Generator

作者先做了个下标变换，其本质目的还是为了使得anchor function的通用化，原来每个bin都有自己独立的一套参数，这个参数其实是预先设计好的，即anchor的配置，把bi放到参数sita里，就是上面提到的，将anchor的配置变为输入的参数，而不是预先设计好并且一一对应的。这里的理解是预先设计好的anchor的尺寸其实是预先设计了anchor function，如果sita改变，得重新训练网络。

然后就是提出anchor function generator来预测给定anchor配置下的参数sita_bi，这时候bi就是输入的anchor配置。

然后将上面的公式扩展成下面的子网络形式，这样就能够通过网络来学习这个网络的参数，从而预测网络权重了。

Architecture Details

文章用retina net来做验证，通过将retina net的最后预测层的权重交由另一个子网络来预测，实验证了文章的想法。其中，其网络结构如图：

其中，anchor的配置如下图计算：

Conclusion

MetaAnchor的想法很简单，也很实用，解决的问题也很明确，就是图个方便，每次改配置不用重新训练了，文章说实话不好懂，但是懂了就简单了。几句话其实就说完了。

[论文理解]MetaAnchor: Learning to Detect Objects with Customized Anchors的更多相关文章

[论文理解] CornerNet: Detecting Objects as Paired Keypoints
[论文理解] CornerNet: Detecting Objects as Paired Keypoints 简介首先这是一篇anchor free的文章,看了之后觉得方法挺好的,预测左上角和右下 ...
Deep Learning 17：DBN的学习_读论文“A fast learning algorithm for deep belief nets”的总结
1.论文“A fast learning algorithm for deep belief nets”的“explaining away”现象的解释: 见:Explaining Away的简单理解 ...
Image Processing and Analysis_8_Edge Detection：Learning to Detect Natural Image Boundaries Using Local Brightness, Color, and Texture Cues ——2004
此主要讨论图像处理与分析.虽然计算机视觉部分的有些内容比如特征提取等也可以归结到图像分析中来,但鉴于它们与计算机视觉的紧密联系,以及它们的出处,没有把它们纳入到图像处理与分析中来.同样,这里面也有 ...
[论文理解]关于ResNet的进一步理解
[论文理解]关于ResNet的理解这两天回忆起resnet,感觉残差结构还是不怎么理解(可能当时理解了,时间长了忘了吧),重新梳理一下两点,关于resnet结构的思考. 要解决什么问题论文的一大贡 ...
【论文笔记】Learning Fashion Compatibility with Bidirectional LSTMs
论文:<Learning Fashion Compatibility with Bidirectional LSTMs> 论文地址:https://arxiv.org/abs/1707.0 ...
ICCV2019论文点评：3D Object Detect疏密度点云三维目标检测
ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测 STD: Sparse-to-Dense 3D Object Detector for Point Cloud 论文链 ...
[论文理解]Deep Residual Learning for Image Recognition
Deep Residual Learning for Image Recognition 简介这是何大佬的一篇非常经典的神经网络的论文,也就是大名鼎鼎的ResNet残差网络,论文主要通过构建了一种新 ...
[论文理解] Learning Efficient Convolutional Networks through Network Slimming
Learning Efficient Convolutional Networks through Network Slimming 简介这是我看的第一篇模型压缩方面的论文,应该也算比较出名的一篇吧 ...
[论文理解] Good Semi-supervised Learning That Requires a Bad GAN
Good Semi-supervised Learning That Requires a Bad GAN 恢复博客更新,最近没那么忙了,记录一下学习. Intro 本文是一篇稍微偏理论的半监督学习的 ...

随机推荐

vs.net远程调试
有些时候,不能在本机器启动程序进行调试,例如调试全屏模式,或者调试那些需要在特定运行环境的程序,这时候就只能进行远程调试了. 一般的调试器都支持远程调试,vs也不例外.只需要在远程机器上启动一个应用程 ...
SP1026 FAVDICE - Favorite Dice
题目描述一个\(n(n \leq 1000)\)面的骰子,求期望掷几次能使得每一面都被掷到. 输入输出样例输入样例#1: 2 1 12 输出样例#1: 1.00 37.24 思路:期望\(dp\) ...
shell学习（14）- who
Linux who命令用于显示系统中有哪些使用者正在上面,显示的资料包含了使用者 ID.使用的终端机.从哪边连上来的.上线时间.呆滞时间.CPU 使用量.动作等等. 使用权限:所有使用者都可使用. 语 ...
linux下find查找与批量替换文件中指定内容
经常在部署tomcat时需要替换配置文件中的ip,find命令批量替换还是很方便的查找需要替换的ip,看看哪些文件有配置这个ip,执行下面命令: find ./ -type f -regex &qu ...
angular中[hidden]="expression"注意事项
[hidden]="expression",右侧的表达式尽量使用布尔值:虽然比较运算符也可以达到效果,但时常会出现一些莫名其妙的错误.
HDU 4622 Reincarnation Hash解法详解
今天想学字符串hash是怎么弄的.就看到了这题模板题 http://acm.hdu.edu.cn/showproblem.php?pid=4622 刚开始当然不懂啦,然后就上网搜解法.很多都是什么后缀 ...
(转)SELinux是什么意思，如何关闭？Linux下的防火墙用什么命令打开？
SELinux是什么意思,如何关闭?Linux下的防火墙用什么命令打开? 原文:http://blog.csdn.net/hhcccchh/article/details/12995539 SELin ...
Django学习笔记（13）——Django的用户认证（Auth）组件，视图层和QuerySet API
用户认证组件的学习用户认证是通过取表单数据根数据库对应表存储的值做比对,比对成功就返回一个页面,不成功就重定向到登录页面.我们自己写的话当然也是可以的,只不过多写了几个视图,冗余代码多,当然我们也可 ...
sed 处理一行，替换删除
sed option 'action' filename (文件可多个) option: -i 直接在原文件中修改! -n 安静模式,默认情况所有数据都会被列出,但-n只有经过动作处理的那一行才被列出 ...
PHP的Undefined variable错误怎么解决？
在调试程序时,有可能会出现Undefined variable错误,一般情况下php是不需要定义变量的,但如果服务器什么都报错的,就会出现错误,我们经常接收表单POST过来的数据时报Undefined ...

[论文理解]MetaAnchor: Learning to Detect Objects with Customized Anchors