sface
单步检测方法分为两类:anchor-based如ssd、RetinaNet;2)Anchor-free 如DenseBox、UnitBox;anchor-based处理的尺度范围虽小,更精准;anchor-free范围较大,但检测微小尺度的能力低下。
anchor-based和anchor-free方法的输出在定位方式和置信度得分方面差异显著。
anchor-based方法,ground truth IOU >=0.5锚点被视为正训练样本。锚点框住的区域是人脸的置信度,而不是网络预测的回归框内是人脸。
anchor free方法,网络训练方式类似于目标分割任务。输出的特征图以边界框中心为圆心,半径与边界框尺度成比例的椭圆区域被定义为正样本区域。分类置信度得分实质是像素落在人脸上的置信度。
SFACE 将回归的边界框架和ground truth边界框之间的IOU当作Classfication Subnet 的ground truth 。
FLOPs 39M的Backbone,
Face Attention Network: An Effective Face Detector for the Occluded Faces
segmentation mask 或者saliency map。retinaNet,FAN选择增加一个segmentation分支,对于学到的score map ,做一个exp把 取值范围从[0,1]放缩到[1,e],然后乘以原有的特征图。sefmentation 分支只叠加了2个conv3*3,loss 采用sigmoid cross entropy.
FAN的分层Attention
U-shape 能融合丰富的特征信息和high-level的语义信息。retinaNet(FPN+ResNet).retinaNet包括两个subnet,一个用于f分类,另一个用于回归。
anchor assign strategy
在FAN中,共有5个detector layers,每一个都有特定的scale anchor.另外anchor的长宽比都是1和1.5.论文统计了widerface人脸像素大小占比,用于调整anchors的大小。
attention function
为了解决遮挡的问题,提出了novel anchor-level attention.
可以近似为加了一个segment的branch
data augmentation
提出了随机crop策略,来模拟训练数据的遮挡。we also employ augmentation from random flip and color jitter.
sface的更多相关文章
- 万圣节福利:红孩儿3D引擎开发课程《3ds max导出插件初步》
ds max文件夹,插件文件夹以及3ds max的可执行程序文件夹: 位的,这里要改成x64,否则启动程序后3ds max会提示"不是有效的win32程序"之类的对话框. 然后要将 ...
- uni-app第三方登陆-微信
结合上文全局登陆校验,实现微信授权登录官方手册地址: https://uniapp.dcloud.io/api/plugins/login?id=getuserinfo 一.书写两个界面 login. ...
- main.js中封装全局登录函数
1. 在 main.js 中封装全局登录函数 通过 vue 对象的原型扩展,可以扩展一个函数,这样这个函数就可以在每一个界面通过类似指向对象的方式,去访问这个函数. 如下是 main.js 扩展的函数 ...
- 《anchor-based v.s. anchor-free》
作者:青青子衿链接:https://www.zhihu.com/question/356551927/answer/926659692来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载 ...
- 三维CAD——基于B_rep的建模操作
内容来自高老师的<三维CAD建模>课,本文就主要介绍半边结构和欧拉操作以及代码实现. 1. 边界表示法及其数据结构 · 拓扑结构 a.拓扑元素:面.边.点.体 b.拓扑关系:9种.V{V} ...
- 基于虹软人脸识别,实现RTMP直播推流追踪视频中所有人脸信息(C#)
前言 大家应该都知道几个很常见的例子,比如在张学友的演唱会,在安检通道检票时,通过人像识别系统成功识别捉了好多在逃人员,被称为逃犯克星:人行横道不遵守交通规则闯红灯的路人被人脸识别系统抓拍放在大屏上以 ...
- 目标检测中的anchor-based 和anchor free
目标检测中的anchor-based 和anchor free 1. anchor-free 和 anchor-based 区别 深度学习目标检测通常都被建模成对一些候选区域进行分类和回归的问题.在 ...
- VideoPipe可视化视频结构化框架开源了!
完成多路视频并行接入.解码.多级推理.结构化数据分析.上报.编码推流等过程,插件式/pipe式编程风格,功能上类似英伟达的deepstream和华为的mxvision,但底层核心不依赖复杂难懂的gst ...
随机推荐
- Literal绑定数据
前台: <asp:Literal ID = "ChiCunShow" runat = "server"></asp:Literal> 后 ...
- 牛客OI周赛7-提高组 A 小睿睿的等式
链接:https://ac.nowcoder.com/acm/contest/371/A来源:牛客网 小睿睿在游戏开始时有n根火柴棒,他想知道能摆成形如“A+B=n”的等式且使用的火柴棒数也恰好等于n ...
- Vue PC后台系统组件大全
1.https://vue.ant.design/ 2.http://element-cn.eleme.io/#/zh-CN 3.https://www.iviewui.com/ 4.https:// ...
- 基于MFC开发的指纹识别系统.
MFC-FingerPrint 基于MFC开发的指纹识别系统. 效果图如下: 在第12步特征入库中,会对当前指纹的mdl数据与databases中所有的mdl进行对比,然后返回识别结果. 一.载入图像 ...
- centos7安装supervisor
安装supervisor cd /root/tools/ wget http://pnxcvm0bq.bkt.clouddn.com/get-pip.py python get-pip.py pip ...
- nginx 1.14.2 配置文件优化精选
user nobody; worker_processes ; worker_rlimit_nofile ; events { use epoll; worker_connections ; } ht ...
- day09内存管理
复习 ''' 文件处理 1.操作文件的三步骤 -- 打开文件:硬盘的空间被操作系统持有 | 文件对象被应用程序持续 -- 操作文件:读写操作 -- 释放文件:释放操作系统对硬盘空间的持有 2.基础的读 ...
- c# mongodb drive IngoreExtraElements and RegisterClassMap
private static void RegisterClassMaps(IEnumerable<Type> clrTypes) { foreach (var clrType in cl ...
- Git初识学习
初始化一个Git仓库,使用git init命令. 添加文件到Git仓库,分两步: 使用命令git add <file>,注意,可反复多次使用,添加多个文件: 使用命令git commit ...
- python中import与from方法总结
一.模块&包简介 模块:所谓模块就是一个.py文件,用来存放变量,方法的文件,便于在其他python文件中导入(通过import或from). 包(package): 包是更大的组织单位,用来 ...