【论文笔记#2】Farseg++:用于高空间分辨率遥感图像地理空间对象分割的前景感知关系网络
| 论文来源 | IEEE Transactions on Pattern Analysis and Machine Intelligence |
|---|---|
| 作者 | Zhuo Zheng; Yanfei Zhong; Junjue Wang等 |
| 发表年代 | 2023 |
| 使用方法 | 多分支金字塔编码、前景-场景关系、前景感知解码、前景感知优化 |
| 期刊层次 | CCF A;计算机科学1区;IF 23.6 |
原文链接:
要解决什么问题?
- 高分遥感图像面临三大问题
(1)尺度变化
(2)较大的背景类内变化
(3)前景-背景不平衡 - 通用的语义分割方法只关注尺度变化,忽略假警报和前景-背景不平衡问题
提出的方法:
- 关系的角度:前景-场景关系模块
(1)学习场景和前景之间的共生关系,获得前景相关上下文
(2)提高前景特征,减轻误警报问题 - 优化的角度:前景感知优化
抑制背景中的大量简单样本,减轻前景-背景不平衡问题 - 对象性的角度:前景感知解码器
采用辅助对象性解码器来改进对象性表示,并且可以在训练后丢弃
具体的结构:
1. FarSeg++的整体结构

2. 多分支编码器
- 通过自上而下的路径和横向连接,可以增强浅层的高空间细节和深层的强语义特征图,这有助于恢复对象的细节和多尺度上下文建模。
- C6是通过全局上下文聚合(全局平均池化)得到的地理空间场景特征
3. 前景场景关系模块
为了解决假警报问题,通过与物景关系相关的前景相关上下文来增强对前景特征的识别。

主要思想:潜在的地理空间场景空间是上下文和场景之间的桥梁。同时,上下文特征可以增强前景特征。

4. 前景感知解码器
(1)基本轻量解码器:以轻量级的方式从前景-场景关系模块恢复关系增强的语义特征图的空间分辨率。

(2)改进FarSeg的经验上界分析:表明在改进的FarSeg中应该进一步考虑丢失对象问题
(3)双任务解码器:额外引入辅助对象性解码器来预测每一个像素的对象性得分

5. 前景感知优化
关注前景的网络和背景中的困难样本,来实现平衡的优化
(1)困难样本评估:通过获得样本困难程度的权重,来调整逐像素损失的分布
(2)动态加权:缓解早期训练中因为困难样本评估不确定而导致的不稳定性
(3)反向传播
6. UV6K:一个城市汽车分割数据集
7. 实验







【论文笔记#2】Farseg++:用于高空间分辨率遥感图像地理空间对象分割的前景感知关系网络的更多相关文章
- 【超分辨率】—图像超分辨率(Super-Resolution)技术研究
一.相关概念 1.分辨率 图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做像素每英寸.一般情况下,图像分辨率越高,图像中包 ...
- python地理空间(1)--概念引入
1 python与地理空间分析 1.1 与我们的生活 ushahidi是一个优秀的地理空间地图应用,回寝FQ看一下. ushahidi有一个python库-ushapy 地理空间救灾建模程序是最近比较 ...
- IoU-Net论文笔记
原论文标题:Acquisition of Localization Confidence for Accurate Object Detection 1. 前言 Megvii在ECCV 2018上的一 ...
- 深度学习论文笔记:Fast R-CNN
知识点 mAP:detection quality. Abstract 本文提出一种基于快速区域的卷积网络方法(快速R-CNN)用于对象检测. 快速R-CNN采用多项创新技术来提高训练和测试速度,同时 ...
- 论文笔记(8):BING: Binarized Normed Gradients for Objectness Estimation at 300fps
译文: <基于二值化赋范梯度特征的一般对象估计> 摘要: 通过训练通用的对象估计方法来产生一组候选对象窗口,能够加速传统的滑动窗口对象检测方法.我们观察到一般对象都会有定义完好的封闭轮廓, ...
- 论文笔记(2):Deep Crisp Boundaries: From Boundaries to Higher-level Tasks
---------------------------------------------------------------------------------------------------- ...
- 论文笔记(1):Deep Learning.
论文笔记1:Deep Learning 2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...
- 论文笔记系列-Neural Network Search :A Survey
论文笔记系列-Neural Network Search :A Survey 论文 笔记 NAS automl survey review reinforcement learning Bayesia ...
- Video Frame Synthesis using Deep Voxel Flow 论文笔记
Video Frame Synthesis using Deep Voxel Flow 论文笔记 arXiv 摘要:本文解决了模拟新的视频帧的问题,要么是现有视频帧之间的插值,要么是紧跟着他们的探索. ...
- 论文笔记:Mastering the game of Go with deep neural networks and tree search
Mastering the game of Go with deep neural networks and tree search Nature 2015 这是本人论文笔记系列第二篇 Nature ...
随机推荐
- OpenAI宫斗,尘埃落定,微软成最大赢家
周末被OpenAI董事会闹剧刷屏,ChatGPT之父Sam Altman前一天被踢出董事会,免职CEO,后一天重返OpenAI,目前结局未知. 很多同学想要围观,缺少背景知识,这里老章为大家简单介绍前 ...
- LOG日志系统
# coding=utf-8 import datetime import logging import os import sys from logging.handlers import Time ...
- 用友U8和旺店通·企业奇门单据接口对接
用友U8和旺店通·企业奇门单据接口对接 对接系统旺店通·企业奇门 旺店通是北京掌上先机网络科技有限公司旗下品牌,国内的零售云服务提供商,基于云计算SaaS服务模式,以体系化解决方案,助力零售企业数字化 ...
- JAVA学习week1
本周: 认识到Java是一门面向对象的编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承.指针等概念,因此Java语言具有功能强大和简单易用两个特征.Java语言作为静态面向对 ...
- AutoCAD ObjectARX 二次开发(2020版)--4,使用ARX向导创建CAD二次开发项目(编程框架)--
手动创建ObjectARX应用程序非常麻烦,在此步骤中,将介绍ObjectARX向导. 在这里,我们将使用ObjectARX向导创建我们的ObjectARX应用程序. 本节的程序的需求是,接收CAD用 ...
- Axure实战应用:Axure设计可视化大屏!
Axure是一款功能强大的原型设计工具,可以用于设计可视化大屏.设计一个有效的可视化大屏需要考虑多个方面,包括布局规划.信息展示.交互设计等. 以下是一个详细的描述,希望对你有所帮助. 第一部分:可视 ...
- Datainside数据分析,基于大数据分析学生成绩综合评价
Datainside是一种基于大数据分析的学生成绩综合评价方法,通过对海量学生成绩数据进行深度挖掘和分析,为学生的学习表现提供全面.客观的评价.以下是对Datainside数据分析学生成绩综合评价的详 ...
- STM32外设:最小系统、低功耗模式
最小系统 启动引脚 BOOT0.BOOT1:用于设置系统的启动方式 下载引脚 JTAG的IO:JTMS.JTCK.JTDI.JTDO.NJTRST SW的IO:SWDIO.SWCLK 硬件设计 NUC ...
- [ABC268G] Random Student ID
Problem Statement Takahashi Elementary School has $N$ new students. For $i = 1, 2, \ldots, N$, the n ...
- Microsoft Edge 分屏 推荐
前言: 很早之前就在 Edge Dev 频道的更新公告中看到过 Edge 的新分屏功能,当时没怎么注意,昨天看文档的时候发现 Edge 的侧边栏可以拖动当作一个"虚假的"分屏页面来 ...