Dual Attention Network for Scene Segmentation 在本文中,我们通过 基于自我约束机制捕获丰富的上下文依赖关系来解决场景分割任务.       与之前通过多尺度特征融合捕获上下文的工作不同,我们提出了一种双重注意网络(DANet)来自适应地集成局部特征及其全局依赖性. 具体来说,我们在传统的扩张FCN之上附加两种类型的注意力模块,它们分别对空间和通道维度中的语义相互依赖性进行建模. 位置力关注模块通过所有位置处的特征的加权和来选择性地聚合每个位置处的特征…
Dual Attention Network for Scene Segmentation 原始文档 https://www.yuque.com/lart/papers/onk4sn 在本文中,我们通过 基于自我约束机制捕获丰富的上下文依赖关系来解决场景分割任务. 与之前通过多尺度特征融合捕获上下文的工作不同,我们提出了一种双重注意网络(DANet)来自适应地集成局部特征及其全局依赖性. 具体来说,我们在传统的扩张FCN之上附加两种类型的注意力模块,它们分别对空间和通道维度中的语义相互依赖性进行…
CVPR2020:4D点云语义分割网络(SpSequenceNet) SpSequenceNet: Semantic Segmentation Network on 4D Point Clouds 论文地址: https://openaccess.thecvf.com/content_CVPR_2020/papers/Shi_SpSequenceNet_Semantic_Segmentation_Network_on_4D_Point_Clouds_CVPR_2020_paper.pdf 摘要…
Semi-Supervised Semantic Segmentation with High- and Low-level Consistency TPAMI 2019 论文原文 code 创新点: 利用两个分支结构分别处理low-level和high-level的特征,进行半监督语义分割 网络结构 上分支:Semi-Supervised Semantic Segmentation GAN (s4GAN) 下分支:Multi-Label Mean Teacher (MLMT) s4GAN 训练…
1.介绍 语义分割通常有两个问题:类内不一致性(同一物体分成两类)和类间不确定性(不同物体分成同一类).本文从宏观角度,认为语义分割不是标记像素而是标记一个整体,提出了两个结构解决这两个问题,平滑网络和边界网络(Smooth Network and Border Network).平滑网络用的是通道注意力块(Channel Attention Block),来解决类内不一致性.边界网络集成了语义边界损失. 2.相关工作 Encoder-Decoder:主要考虑如何恢复由于池化造成的空间信息损失,…
简介 语义分割:给图像的每个像素点标注类别.通常认为这个类别与邻近像素类别有关,同时也和这个像素点归属的整体类别有关.利用图像分类的网络结构,可以利用不同层次的特征向量来满足判定需求.现有算法的主要区别是如何提高这些向量的分辨率,以及如何组合这些向量. 几种结构 全卷积网络FCN:上采样提高分割精度,不同特征向量相加.[3] UNET:拼接特征向量:编码-解码结构:采用弹性形变的方式,进行数据增广:用边界加权的损失函数分离接触的细胞.[4] SegNet:记录池化的位置,反池化时恢复.[3] P…
引言 之前一段时间在参与语义分割的项目,最近有时间了,正好把这段时间的所学总结一下. 在代码上,语义分割的框架会比目标检测简单很多,但其中也涉及了很多细节.在这篇文章中,我以PSPNet为例,解读一下语义分割框架的代码.搞清楚一个框架后,再看别人的框架都是大同小异. 工程来自https://github.com/speedinghzl/pytorch-segmentation-toolbox 框架中一个非常重要的部分是evaluate.py,即测试阶段.但由于篇幅较长,我将另开一篇来阐述测试过程…
多篇开源CVPR 2020 语义分割论文 前言 1. DynamicRouting:针对语义分割的动态路径选择网络 Learning Dynamic Routing for Semantic Segmentation 作者团队:中科院&国科大&西安交大&旷视 论文链接:https://arxiv.org/abs/2003.10401 代码链接:https://github.com/yanwei-li/DynamicRouting 近年来,大量的人工搜索网络被应用于语义分割.然而,以…
基于YOLO和PSPNet的目标检测与语义分割系统 源代码地址 概述 这是我的本科毕业设计 它的主要功能是通过YOLOv5进行目标检测,并使用PSPNet进行语义分割. 本项目YOLOv5部分代码基于 ultralytics YOLO V5 tag v5.0 . 相应地,我也使用了ultralytics/YOLOv5的预训练模型. 我通常使用两个最简单的预训练模型--yolov5s.pt和yolov5s.pt.你可以在./weights中直接看到它们. 在语义分割部分,我使用了PSPNet(全称…
Weilin Huang--[TIP2015]Text-Attentional Convolutional Neural Network for Scene Text Detection) 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 作者补充信息 参考文献 作者和相关链接 论文下载 作者: tong he, 黄伟林,乔宇,姚剑 方法概括 使用改进版的MSER(CE-MSERs,contrast-enhancement)提取候选字符区域: 使用新的CN…