基于三端卷积网络的在线视频目标分割

针对半监督视频目标分割任务，作者采取了和MaskTrace类似的思路，以optical flow为主。

本文亮点在于：

1. 使用共享backbone，三输出的自编码器。

2. 对一些视频中确定性像素建模，分割前后景。

3. 对被遮挡又重新出现的物体使用前后景GMMs损失建模识别，增加正确率。

摘要

半监督的在线视频目标分割任务就是给定第一帧的Mask，然后分割后续的帧。我们可以使用optical flow向量传递前面帧的分割效果到后续帧，但是这样会产生错误。因此作者提出了一个三端网络(CTN)——输出分割概率，确定性前景概率和确定性后景概率，然后使用马尔科夫随机场优化得到最终结果。

Proposed Algorithm

算法流程如下：

1. 首先输入当前帧 t 和前一帧 t-1 的分割mask，前一帧的分割mask在optcal flow的指导下预测出 t 帧的大致样子。

2. 同时对 t 帧和传播后的mask进行crop截取path。经过前景后景抽取的mask和crop后的 t 帧输入到网络得到三张概率map。

3. 对概率图进行MRF优化得到第 t 帧的分割效果。

Propagation of Segmentation Labels

对于像素点p=[x, y]^T，从I^(t-1)到I^(t)的label传播为：

其中S^(t-1)为前一帧的分割label图。[u, v]为I^(t)到I^(t-1)的后向optical flow向量。

Network Architecture

编码结构采用VGG-16，224x224x3为输入，由13个卷积层，3个全链接层和5个池化层组成。

分割概率需要精准风格边界，所以需要shortcut结构获取低层特征信息。确定性前景或后景只判断最可能确定的像素点，所以不需要细节信息。前景后景的输入resize到14x14和VGG输出对齐，因为只是估计确定性像素点，所以相当于低通滤波的resize可以这么设计。卷积层加BN+ReLU。

Training Phase

介绍完网络结构，接下来要说怎么训练，因为原始数据集一般都只带有label mask。

给定输入图片（a），根据边距进行裁剪，与图片的形状大小成正比。然后对mask降质(degrade)，对masked区域填充[0.5)的随机强度，然后遮盖部分或圆形噪声点（e）。对降质后的图片进行高斯smoothing和阈值化得到两个Ground truth。

推理阶段，截取图片和传播后的H输入网络，H需要多截取50像素点然后resize。

Markov Random Field Optimization

优化目标函数：。

其中前景后景的作用点在于一元能量函数：

Reappearing Object Detection

如何定义不连续的像素点来检测重新出现的目标，作者定义了像素点的不连续性

。假设前一帧的像素点为 p_head ，当前帧为 p，大于某阈值即为不连续。

对第一帧和第（t-1）帧使用前景和后景的GMMs。那么一个属于重新出现部分的不连续点的前景高斯损失就会低于后景高斯损失。高斯损失定义在公式（3）。

Experimental Results

作者又提出了一个Fast版本。

实验结果图：

[CVPR2017]Online Video Object Segmentation via Convolutional Trident Network的更多相关文章

泡泡一分钟:SceneCut: Joint Geometric and Object Segmentation for Indoor Scenes
张宁 SceneCut: Joint Geometric and Object Segmentation for Indoor Scenes "链接:https://pan.ba ...
论文笔记：AdaScale: Towards real-time video object detection using adaptive scalingAdaScale
AdaScale: Towards real-time video object detection using adaptive scaling 2019-02-18 16:14:17 Paper: ...
PaperNotes Instance-Level Salient Object Segmentation
title: PaperNotes Instance-Level Salient Object Segmentation comments: true date: 2017-12-20 13:53:1 ...
论文笔记：Capsules for Object Segmentation
Capsules for Object Segmentation 2018-04-16 21:49:14 Introduction: ----
video object detection
先说一下,我觉得近两年最好的工作吧.其他的,我就不介绍了,因为我懂得少. 微软的jifeng dai的工作. Deep Feature Flow github: https://github.co ...
Relation-Shape Convolutional Neural Network for Point Cloud Analysis(CVPR 2019)
代码:https://github.com/Yochengliu/Relation-Shape-CNN 文章:https://arxiv.org/abs/1904.07601 作者直播:https:/ ...
1 - ImageNet Classification with Deep Convolutional Neural Network （阅读翻译）
ImageNet Classification with Deep Convolutional Neural Network 利用深度卷积神经网络进行ImageNet分类 Abstract We tr ...
论文笔记：（CVPR2019）Relation-Shape Convolutional Neural Network for Point Cloud Analysis
目录摘要一.引言二.相关工作基于视图和体素的方法点云上的深度学习相关性学习三.形状意识表示学习 3.1关系-形状卷积建模经典CNN的局限性变换:从关系中学习通道提升映射 3.2性 ...
论文翻译：2020_FLGCNN: A novel fully convolutional neural network for end-to-end monaural speech enhancement with utterance-based objective functions
论文地址:FLGCNN:一种新颖的全卷积神经网络,用于基于话语的目标函数的端到端单耳语音增强论文代码:https://github.com/LXP-Never/FLGCCRN(非官方复现) 引用格式 ...

随机推荐

python基础之反射、面向对象进阶
isinstance(obj,cls)和issubclass(sub,super) isinstance(obj,cls)检查是否obj是否是类 cls 的对象,如果是返回True 1 class F ...
两种方法实现Python二分查找算法
两种方法实现Python二分查找算法一. ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 arr=[1,3,6,9,10,20,30] def findnumber( ...
webpack实践总结
一.Loader写法及执行顺序从webpack2起,loader的格式如下: module: { rules: [ {test: /\.css$/, use: ['style-loader','cs ...
Accept 惊群现象测试perl脚本
$uname -a Linux debian-11-34 3.16.0-4-amd64 #1 SMP Debian 3.16.7-ckt9-3~deb8u1 (2015-04-24) x86_64 G ...
12.0 Excel表格读取
Pycharm安装 xlrd 首先在xuexi目录下创建一个ExcelFile文件,让后在ExcelFile下创建一个Excel表格创建表格时记得把单元格的格式设置为[文本] 我们设置为文本之后,存 ...
linux学习总结----对象
内置对象: Date new Date() --->系统当前时间 var d=new Date() d.getFullYear() getMonth() getDay() getDate() g ...
洛谷P1378油滴扩展
题目描述在一个长方形框子里,最多有N(0≤N≤6)个相异的点,在其中任何一个点上放一个很小的油滴,那么这个油滴会一直扩展,直到接触到其他油滴或者框子的边界. 必须等一个油滴扩展完毕才能放置下一个油滴 ...
ardupilot_gazebo仿真（三）
ardupilot_gazebo仿真(三) 标签(空格分隔): 未分类创建ROS node 实现对无人机的控制(软件在环) MAVROS MAVROS是ROS中的一个能够连接支持MAVLink地面站 ...
Week8 Teamework from Z.XML-Z.XML游戏功能说明
我们小组的游戏终于新鲜出炉了,好开心~ 快来看看有什么功能吧. 游戏目标::=打倒最多的敌人,获得积分,放松心情,获取快乐. 游戏菜单::= 关于+设置+帮助+积分榜+开始游戏吧 (截图还在路上..) ...
JavaScript Map数据结构
Array.prototype.remove = function (s) { for (var i = 0; i < this.length; i++) { if (s == this[i]) ...

[CVPR2017]Online Video Object Segmentation via Convolutional Trident Network