【论文笔记#2】Farseg++：用于高空间分辨率遥感图像地理空间对象分割的前景感知关系网络

论文来源	IEEE Transactions on Pattern Analysis and Machine Intelligence
作者	Zhuo Zheng; Yanfei Zhong; Junjue Wang等
发表年代	2023
使用方法	多分支金字塔编码、前景-场景关系、前景感知解码、前景感知优化
期刊层次	CCF A；计算机科学1区；IF 23.6

原文链接：

Zheng Z, Zhong Y, Wang J, et al. FarSeg++: Foreground-aware relation network for geospatial object segmentation in high spatial resolution remote sensing imagery[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023.

要解决什么问题？

高分遥感图像面临三大问题

（1）尺度变化

（2）较大的背景类内变化

（3）前景-背景不平衡
通用的语义分割方法只关注尺度变化，忽略假警报和前景-背景不平衡问题

提出的方法：

关系的角度：前景-场景关系模块

（1）学习场景和前景之间的共生关系，获得前景相关上下文

（2）提高前景特征，减轻误警报问题
优化的角度：前景感知优化

抑制背景中的大量简单样本，减轻前景-背景不平衡问题
对象性的角度：前景感知解码器

采用辅助对象性解码器来改进对象性表示，并且可以在训练后丢弃

具体的结构：

1. FarSeg++的整体结构

2. 多分支编码器

通过自上而下的路径和横向连接，可以增强浅层的高空间细节和深层的强语义特征图，这有助于恢复对象的细节和多尺度上下文建模。
C6是通过全局上下文聚合（全局平均池化）得到的地理空间场景特征

3. 前景场景关系模块

为了解决假警报问题，通过与物景关系相关的前景相关上下文来增强对前景特征的识别。

主要思想：潜在的地理空间场景空间是上下文和场景之间的桥梁。同时，上下文特征可以增强前景特征。

4. 前景感知解码器

（1）基本轻量解码器：以轻量级的方式从前景-场景关系模块恢复关系增强的语义特征图的空间分辨率。

（2）改进FarSeg的经验上界分析：表明在改进的FarSeg中应该进一步考虑丢失对象问题

（3）双任务解码器：额外引入辅助对象性解码器来预测每一个像素的对象性得分

5. 前景感知优化

关注前景的网络和背景中的困难样本，来实现平衡的优化

（1）困难样本评估：通过获得样本困难程度的权重，来调整逐像素损失的分布

（2）动态加权：缓解早期训练中因为困难样本评估不确定而导致的不稳定性

（3）反向传播

6. UV6K:一个城市汽车分割数据集

7. 实验

【论文笔记#2】Farseg++：用于高空间分辨率遥感图像地理空间对象分割的前景感知关系网络的更多相关文章

【超分辨率】—图像超分辨率(Super-Resolution)技术研究
一.相关概念 1.分辨率图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做像素每英寸.一般情况下,图像分辨率越高,图像中包 ...
python地理空间(1)--概念引入
1 python与地理空间分析 1.1 与我们的生活 ushahidi是一个优秀的地理空间地图应用,回寝FQ看一下. ushahidi有一个python库-ushapy 地理空间救灾建模程序是最近比较 ...
IoU-Net论文笔记
原论文标题:Acquisition of Localization Confidence for Accurate Object Detection 1. 前言 Megvii在ECCV 2018上的一 ...
深度学习论文笔记：Fast R-CNN
知识点 mAP:detection quality. Abstract 本文提出一种基于快速区域的卷积网络方法(快速R-CNN)用于对象检测. 快速R-CNN采用多项创新技术来提高训练和测试速度,同时 ...
论文笔记（8）：BING: Binarized Normed Gradients for Objectness Estimation at 300fps
译文: <基于二值化赋范梯度特征的一般对象估计> 摘要: 通过训练通用的对象估计方法来产生一组候选对象窗口,能够加速传统的滑动窗口对象检测方法.我们观察到一般对象都会有定义完好的封闭轮廓, ...
论文笔记（2）：Deep Crisp Boundaries: From Boundaries to Higher-level Tasks
---------------------------------------------------------------------------------------------------- ...
论文笔记(1)：Deep Learning.
论文笔记1:Deep Learning 2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...
论文笔记系列-Neural Network Search ：A Survey
论文笔记系列-Neural Network Search :A Survey 论文笔记 NAS automl survey review reinforcement learning Bayesia ...
Video Frame Synthesis using Deep Voxel Flow 论文笔记
Video Frame Synthesis using Deep Voxel Flow 论文笔记 arXiv 摘要:本文解决了模拟新的视频帧的问题,要么是现有视频帧之间的插值,要么是紧跟着他们的探索. ...
论文笔记：Mastering the game of Go with deep neural networks and tree search
Mastering the game of Go with deep neural networks and tree search Nature 2015 这是本人论文笔记系列第二篇 Nature ...

随机推荐

手撕Vuex-安装模块数据
前言根据上一篇,[手写Vuex]-提取模块信息,我们已经可以获取到模块的信息了,将模块信息变成了我们想要的数据结构,接下来我们就要根据模块的信息,来安装模块的数据. 在上一篇当中我们定义了一个 Mo ...
Windows_Cmd常用操作配置
目录特定功能执行命令显示系统当前版本电源管理历史命令相关显示路由表显示本地 ARP 缓存测试主机联通性查看网卡信息修改DOS窗口中的编码格式诊断域名系统 (DNS) 基础结构的信 ...
【VMware vCenter】使用cmsso-util命令进行链接、删除、修改多个vCenter Server(VCSA)的SSO域。
VMware vCenter Server 支持新安装的时候选择将vCenter SSO域加入到另外一个现有的SSO域中,同时也支持使用cmsso-util命令将现有的两个或多个vCenter SSO ...
Modbus转Profinet 网关 TS-180
产品简介实现 PROFINET 网络与串口网络之间的数据通信,三个串口可分别连接具有 RS232 或 RS485 接口的设备到 PROFINET 网络.即将串口设备转换为 PROFINET 设备. ...
vertx的学习总结三
一.event bus是什么各个verticle的通信二.point-to-point, request-reply, publish/subscribe 通过 the event bus 例题一 ...
2021AI量化投资训练营重磅升级，自带编程的优势显而易见
量化交易规模突破万亿大关国内量化交易规模快速发展,今年量化基金已突破万亿大关,并且量化私募的整体业绩十分亮眼,过去5年一线量化私募的超额收益基本在20%~30%,量化交易的占比已达到20%-30%( ...
深入理解 Docker 核心原理：Namespace、Cgroups 和 Rootfs
通过这篇文章你可以了解到 Docker 容器的核心实现原理,包括 Namespace.Cgroups.Rootfs 等三个核心功能. 如果你对云原生技术充满好奇,想要深入了解更多相关的文章和资讯,欢迎 ...
安装Zabbix客户端zabbix-agent2
Ubuntu系统:下载链接:http://mirrors.aliyun.com/zabbix/zabbix/6.0/ubuntu/pool/main/z/zabbix/?spm=a2c6h.25603 ...
cookie的一些知识点总结
一.cookie的种类 sessionID 这个ID是会话性的,只要关闭了当前浏览器,这个ID会消失,需要调用getSessoin重新获取一个新的session 会话性cookie 这个cookie也 ...
深入了解RC4 Drop加密技术
一.引言在网络安全领域,加密技术始终是重中之重.随着计算机技术的发展,加密算法也在不断更新换代.RC4(Rivest Cipher 4)加密算法因其高效.简洁的特性,在信息安全领域得到了广泛的应用. ...