sface
单步检测方法分为两类:anchor-based如ssd、RetinaNet;2)Anchor-free 如DenseBox、UnitBox;anchor-based处理的尺度范围虽小,更精准;anchor-free范围较大,但检测微小尺度的能力低下。
anchor-based和anchor-free方法的输出在定位方式和置信度得分方面差异显著。
anchor-based方法,ground truth IOU >=0.5锚点被视为正训练样本。锚点框住的区域是人脸的置信度,而不是网络预测的回归框内是人脸。
anchor free方法,网络训练方式类似于目标分割任务。输出的特征图以边界框中心为圆心,半径与边界框尺度成比例的椭圆区域被定义为正样本区域。分类置信度得分实质是像素落在人脸上的置信度。
SFACE 将回归的边界框架和ground truth边界框之间的IOU当作Classfication Subnet 的ground truth 。
FLOPs 39M的Backbone,
Face Attention Network: An Effective Face Detector for the Occluded Faces
segmentation mask 或者saliency map。retinaNet,FAN选择增加一个segmentation分支,对于学到的score map ,做一个exp把 取值范围从[0,1]放缩到[1,e],然后乘以原有的特征图。sefmentation 分支只叠加了2个conv3*3,loss 采用sigmoid cross entropy.
FAN的分层Attention
U-shape 能融合丰富的特征信息和high-level的语义信息。retinaNet(FPN+ResNet).retinaNet包括两个subnet,一个用于f分类,另一个用于回归。
anchor assign strategy
在FAN中,共有5个detector layers,每一个都有特定的scale anchor.另外anchor的长宽比都是1和1.5.论文统计了widerface人脸像素大小占比,用于调整anchors的大小。
attention function
为了解决遮挡的问题,提出了novel anchor-level attention.
可以近似为加了一个segment的branch
data augmentation
提出了随机crop策略,来模拟训练数据的遮挡。we also employ augmentation from random flip and color jitter.
sface的更多相关文章
- 万圣节福利:红孩儿3D引擎开发课程《3ds max导出插件初步》
ds max文件夹,插件文件夹以及3ds max的可执行程序文件夹: 位的,这里要改成x64,否则启动程序后3ds max会提示"不是有效的win32程序"之类的对话框. 然后要将 ...
- uni-app第三方登陆-微信
结合上文全局登陆校验,实现微信授权登录官方手册地址: https://uniapp.dcloud.io/api/plugins/login?id=getuserinfo 一.书写两个界面 login. ...
- main.js中封装全局登录函数
1. 在 main.js 中封装全局登录函数 通过 vue 对象的原型扩展,可以扩展一个函数,这样这个函数就可以在每一个界面通过类似指向对象的方式,去访问这个函数. 如下是 main.js 扩展的函数 ...
- 《anchor-based v.s. anchor-free》
作者:青青子衿链接:https://www.zhihu.com/question/356551927/answer/926659692来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载 ...
- 三维CAD——基于B_rep的建模操作
内容来自高老师的<三维CAD建模>课,本文就主要介绍半边结构和欧拉操作以及代码实现. 1. 边界表示法及其数据结构 · 拓扑结构 a.拓扑元素:面.边.点.体 b.拓扑关系:9种.V{V} ...
- 基于虹软人脸识别,实现RTMP直播推流追踪视频中所有人脸信息(C#)
前言 大家应该都知道几个很常见的例子,比如在张学友的演唱会,在安检通道检票时,通过人像识别系统成功识别捉了好多在逃人员,被称为逃犯克星:人行横道不遵守交通规则闯红灯的路人被人脸识别系统抓拍放在大屏上以 ...
- 目标检测中的anchor-based 和anchor free
目标检测中的anchor-based 和anchor free 1. anchor-free 和 anchor-based 区别 深度学习目标检测通常都被建模成对一些候选区域进行分类和回归的问题.在 ...
- VideoPipe可视化视频结构化框架开源了!
完成多路视频并行接入.解码.多级推理.结构化数据分析.上报.编码推流等过程,插件式/pipe式编程风格,功能上类似英伟达的deepstream和华为的mxvision,但底层核心不依赖复杂难懂的gst ...
随机推荐
- c# 将csv文件转换datatable的两种方式。
第一种: public static DataTable csvdatatable(string path) { DataTable dt = new DataTable(); string conn ...
- 类成员(static)和final修饰符
在Java类里只能包含成员变量.方法.构造器.初始化块.内部类(包括接口.枚举)5种成员,类成员是用static来修饰的,其属于整个类. 当使用实例来访问类成员时,实际上依然是委托给该类来访问类成员, ...
- 打印word文档时遇到标记区如何取消
故障描述:word页面显示正常,打印以及打印预览的时候,页面上会出现部分暗色区域(标记区) 故障原因:简单标记惹的祸 解决办法:word菜单栏-审阅-简单标记 ...
- Hessian序列化的一个潜在问题
一. 最近的用rpc框架的时候,当用hessian序列化对象是一个对象继承另外一个对象的时候,当一个属性在子类和有一个相同属性的时候,反序列化后子类属性总是为null. 二. 示例代码: DTO对象 ...
- asp.net简繁体转换
简繁体转换添加Microsoft.VisualBasic.dll引用 //简转繁 string str= Microsoft.VisualBasic.Strings.StrConv("民生银 ...
- Python模块 3
time模块 在计算中时间共有三种方式: 1.时间戳: 通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量.我们运行“type(time.time())”,返回的是flo ...
- Android ANR(应用无响应)解决分析【转】
本文转载自:https://blog.csdn.net/u014630142/article/details/81709459 来自: http://blog.csdn.net/tjy1985/art ...
- EFI系统引导的一些零碎知识点
EFI目录 下图只有Boot和Microsoft,如果你还装其他系统可能还会有其他的文件夹,比如你还装了Ubuntu(或者manjaro),那么会有个叫Ubuntu(manjaro)的文件夹与Boot ...
- javascript prop和attr的区别
在网上找了一些资料,通过自己去寻找,尝试,此次做一次总结. 1/ attr()是jQuery 1.0版本就有的函数, prop()是jQuery 1.6版本新增的函数.毫无疑问,在1.6之前, ...
- Lintcode155-Minimum Depth of Binary Tree-Easy
155. Minimum Depth of Binary Tree Given a binary tree, find its minimum depth. The minimum depth is ...