Learning a Discriminative Feature Network for Semantic Segmentation（语义分割DFN，区别特征网络）

tccbj 2024-10-25 12:31:53 原文

1、介绍

语义分割通常有两个问题：类内不一致性（同一物体分成两类）和类间不确定性（不同物体分成同一类）。本文从宏观角度，认为语义分割不是标记像素而是标记一个整体，提出了两个结构解决这两个问题，平滑网络和边界网络（Smooth Network and Border Network）。平滑网络用的是通道注意力块（Channel Attention Block），来解决类内不一致性。边界网络集成了语义边界损失。

2、相关工作

Encoder-Decoder：主要考虑如何恢复由于池化造成的空间信息损失，如 SegNet，U-net，Global Convolutional Network，LRR，Refinenet。这些方法只是把相邻步骤的特征总和起来，没有考虑多样表现性

Global Context（全局上下文信息）：全局平均池化有很大的效果，如 ParseNet，PSPNet，Deeplabv3

Attention Module（注意力模块）：注意力关注不同尺度信息，如 SENet

Semantic Boundary Detection（语义边界检测）：许多方法直接连接不同层的特征提取边界，我们用了自下而上的结构来优化每一步的特征

3、网络结构

平滑网络：用了 global pool 以及通道注意力模块和精细化残差块

边界网络：用传统的 canny 边缘检测算法获得边界，损失函数用的 focal loss，为了平衡正负样本，同时减少简单样本的损失，使网络更易于训练

整体网络：用 deep supervision 对每一层的结果进行上采样计算损失，除了全局池化层，平滑网络用 softmax，边界网络用 focal loss，最后两个加起来用一个平衡参数 L=L(s)+a*L(b)

4、训练

优化器：SGD

batch size：32

动量：0.9

权重衰减：0.0001

学习率：4e-3

学习率衰减：（1-iter/maxiter）^0.9

损失函数比例a：0.1（验证集上效果最好）

数据扩增：减去均值，随机水平翻转，随机缩放

5、看完其实并不太懂具体的实现，只能是知道一个大概的结构，具体的实现结构可以参考github：https://github.com/YuhuiMa/DFN-tensorflow

Border Network主要用于计算 loss 更新权重，

Learning a Discriminative Feature Network for Semantic Segmentation（语义分割DFN，区别特征网络）的更多相关文章

《Learning a Discriminative Feature Network for Semantic Segmentation》解读
旷世18年的CVPR,论文链接:https://arxiv.org/abs/1804.09337 Motivation:针对分割中的“类内不一致”和“类间一致性”的两大问题,设计了结合Smooth n ...
论文阅读笔记十六：DeconvNet:Learning Deconvolution Network for Semantic Segmentation(ICCV2015)
论文源址:https://arxiv.org/abs/1505.04366 tensorflow代码:https://github.com/fabianbormann/Tensorflow-Decon ...
Semantic Segmentation on Remotely Sensed Images Using an Enhanced Global Convolutional Network with Channel Attention and Domain Specific Transfer Learning
创新点: 1.在GCN(global convolutional network)基础上,把他的backbone替换成更多层的,使其适应中分辨率影像,resnet50,101,152 2.利用 cha ...
语义分割(semantic segmentation) 常用神经网络介绍对比-FCN SegNet U-net DeconvNet，语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类；目标检测只有两类,目标和非目标，就是在一张图片中找到并用box标注出所有的目标.
from:https://blog.csdn.net/u012931582/article/details/70314859 2017年04月21日 14:54:10 阅读数:4369 前言在这里, ...
Remote Sensing Images Semantic Segmentation with General Remote Sensing Vision Model via a Self-Supervised Contrastive Learning Method
论文阅读: Remote Sensing Images Semantic Segmentation with General Remote Sensing Vision Model via a Sel ...
Learning Deconvolution Network for Semantic Segme小结
题目:Learning Deconvolution Network for Semantic Segmentation 作者:Hyeonwoo Noh, Seunghoon Hong, Bohyung ...
论文阅读笔记十八：ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation(CVPR2016)
论文源址:https://arxiv.org/abs/1606.02147 tensorflow github: https://github.com/kwotsin/TensorFlow-ENet ...
【Semantic Segmentation】DeepLab V3（转）
原文地址:DeepLabv3 代码: TensorFlow Abstract DeepLabv3进一步探讨空洞卷积,这是一个在语义分割任务中:可以调整滤波器视野.控制卷积神经网络计算的特征响应分辨率的 ...
论文笔记：A Review on Deep Learning Techniques Applied to Semantic Segmentation
A Review on Deep Learning Techniques Applied to Semantic Segmentation 2018-02-22 10:38:12 1. Intr ...

随机推荐

C# 生成随机的6位字母，包含大小写
今天自己做项目需要生成随机的6位字母,于是自己写了一个,下面代码是可以生成任意位数字母的. string _zimu = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefg ...
serviceBehaviors_dataContractSerializer_maxItemsInObjectGraph 关键**Behavior
<behaviors> <serviceBehaviors> <behavior name="STHotel.Product.WCFService.HotelP ...
StatusStrip控件的使用（转：http://blog.sina.com.cn/s/blog_4f18c3ec0100fguf.html）
c# winForm 将窗体状态栏StatusStrip 分成左中右三部分右边显示当前时间实现效果: 通过StatusStrip显示窗体状态栏同时将状态栏分成三部分居左边显示相关文字信息中间 ...
top 命令详解
VIRT:virtual memory usage 虚拟内存 1.进程“需要的”虚拟内存大小,包括进程使用的库.代码.数据等 2.假如进程申请100m的内存,但实际只使用了10m,那么它会增长100m ...
mysql 设置局域网内可访问
今天同事要连我电脑的数据库我以为只要127.0.0.1 可以访问就是运行通过ip访问的... 然而并不是..这里记录下方法 1.打开命令行进入你电脑的 mysql的bin 目录下 mys ...
fastjson反序列化漏洞研究(下)
之前的文章显示字符太多拒绝显示只好分为两篇了这样我们只需要找到可以利用的类,构造poc链就好了,这个和以前的java反序列化漏洞类似,先不说.网上最早的poc是使用com.sun.org.ap ...
如何通过Restful API的方式读取SAP Commerce Cloud的Product Reference
从SAP官网上找到api的说明: https://api.sap.com/api/commerce_services/resource api endpoint: /rest/v2/electroni ...
Jupyter Notebook环境安装
Jupyter Notebook环境安装一.什么是jupyter Notebook 1.简介 Jupyter Notebook 是基于网页的用于交互计算机的应用程序器可被应用程序. 能让用户将说明文 ...
Elasticsearch 7.x - IK分词器插件（ik_smart，ik_max_word）
一.安装IK分词器 Elasticsearch也需要安装IK分析器以实现对中文更好的分词支持. 去Github下载最新版elasticsearch-ik https://github.com/medc ...
C++（三十八） — 继承方式、访问控制、构造和析构、虚继承
派生类继承了基类的所有成员,但不包含构造函数.析构函数.默认赋值运算符. 1.继承方式.访问控制 (1)protected属性:类的对象不能访问该属性成员,但派生类的成员函数可以访问基类的prot ...