《3-D Deep Learning Approach for Remote Sensing Image Classification》论文笔记
论文题目《3-D Deep Learning Approach for Remote Sensing Image Classification》
论文作者:Amina Ben Hamida, Alexandre Benoit , Patrick Lambert, and Chokri Ben Amar, Senior Member , IEEE
论文发表年份:2018
网络简称:3D-CNN
发表期刊:IEEE Transactions on geoscience and remote sensing
Motivation
现有的方法仍然局限于当今大型数据集中丰富的空间光谱内容。然而,遥感数据集中光谱和空间内容共存所带来的特异性扩大了将DL方法应用于这些背景的挑战范围。因此,本文的目的是首先探索用于RS高光谱数据集分类的DL体系结构的性能,然后引入一种新的三维DL方法,使光谱和空间信息处理相结合。
Challenges
1)高维数据:当处理高维数据时,DL方法的计算成本变得很高。这些高成本主要是由于学习数据抽象和建立从低层次到最高语义解释的有效表示需要缓慢的学习过程。
2)重型模型:目前DL模型依靠深度和广度模型取得了显著的成果。因此,需要大量参数从数据本身学习复杂的特征和表示。此外,这种重模型在标记数据方面是贪婪的。这一要求很难建立,因为该领域严重缺乏丰富的高光谱标注数据。
3)架构优化:今天支持使用DL的关键点是它能够处理大量的应用程序。然而,这导致建立深度模型的任务变得更加困难和复杂,而这些模型在处理数据时既便宜又有效。
Proposed 3-D Deep Architecture

该体系结构使用真实的3-D卷积同时处理空间和光谱成分,从而在可训练参数较少的少数可用样本中获得更好的效果。该方案将问题分解为对图像的一系列体积表示的处理。因此,每个像素都与n × n个空间邻域和f个光谱波段相关联。因此,每个像素被视为n × n × f的体积块。通过三维卷积对原始输入数据(每个像素都包含n*n*f)进行特征提取,逐步转化为一维向量,再通过一维卷积对一维向量进行特征提取。最后通过全连接层和softmax进行分类处理。
下图为每一层的特征形状(SizeOut)的演化(example):

Experiment
本文设计了多种不同层次结构的网络来进行对比,以选择最优的网络结构。


实验证明,八层网络架构取得最好的效果和计算性能,它不仅减少了参数的数量,而且提高了准确率。。原因:多的Conv层确保了数据的更高语义级表示,而Pooling层则保证了表示的降维。这样,FC层入口的向量维数显著降低,从而显著减少了参数的数量。随着准确率的提高,参数数量显著减少。这些测试还证明了空间邻域的选择高度依赖于数据内容。在拥有3 × 3邻域的Pavia Center数据集的情况下,同一模型可以优于中的结果,而在Pavia University的情况下,即使使用5 × 5邻域,它也不能达到最先进的方法结果。 下图为不同层数的网络的训练迭代次数等统计:

本文还测试了高光谱图像分类迁移学习的可能,在帕维亚大学和帕维亚中心之间进行迁移学习(微调)实验:

深度神经网络在进行微调和从零开始训练时,能够保持几乎相同的精度水平(98.4%对98.9%和90.4%对92.9%)。基本上,本文提出的预训练体系结构具有很强的泛化能力。
Conclusion
一般来说,高光谱数据的处理是一个非常微妙的过程,需要有效地利用空间和光谱成分。本文所介绍的三维体系结构不仅能对高光谱数据进行准确的分类,而且能以较低的成本建立对图像的深度理解。最有价值的结果之一是能够高效地优化小型标注数据集上的深度网络,从而降低数据的成本。现在的主要关注点是研究如何创新和增强所创建的模型,以便处理更大更重的数据集。为了解决这一问题,残差网络和密集网络都能够融合不同的表示层次。因此,它们似乎是增强现有CNN体系结构的一个很有吸引力的解决方案。
《3-D Deep Learning Approach for Remote Sensing Image Classification》论文笔记的更多相关文章
- 《Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition》论文笔记
论文题目:<Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition> 论文作者:Qibin ...
- [place recognition]NetVLAD: CNN architecture for weakly supervised place recognition 论文翻译及解析(转)
https://blog.csdn.net/qq_32417287/article/details/80102466 abstract introduction method overview Dee ...
- 论文笔记系列-Auto-DeepLab:Hierarchical Neural Architecture Search for Semantic Image Segmentation
Pytorch实现代码:https://github.com/MenghaoGuo/AutoDeeplab 创新点 cell-level and network-level search 以往的NAS ...
- 论文笔记——Rethinking the Inception Architecture for Computer Vision
1. 论文思想 factorized convolutions and aggressive regularization. 本文给出了一些网络设计的技巧. 2. 结果 用5G的计算量和25M的参数. ...
- 论文笔记:Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
- 论文笔记:ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware
ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware 2019-03-19 16:13:18 Pape ...
- 论文笔记:DARTS: Differentiable Architecture Search
DARTS: Differentiable Architecture Search 2019-03-19 10:04:26accepted by ICLR 2019 Paper:https://arx ...
- 论文笔记:Progressive Neural Architecture Search
Progressive Neural Architecture Search 2019-03-18 20:28:13 Paper:http://openaccess.thecvf.com/conten ...
- 论文笔记:Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation
Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation2019-03-18 14:4 ...
- 论文笔记系列-DARTS: Differentiable Architecture Search
Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了 ...
随机推荐
- python3学习笔记之字符串
字符串 1.一个个字符组成的有序的序列,是字符的集合: 2.使用单引号.双引号.三引号引住的字符序列 3.字符串是不可变对象 4.python3起,字符串就是Unicode类型: 字符串特殊举例: 不 ...
- HtmlAgilityPack中使用xpath获取属性值
HtmlAgilityPack介绍 HtmlAgilityPack是一个专门用来解析Html的库,它可以使用xml的方式来解析html. 有人说了,html本身不就是xml?是的,html就是xml, ...
- 青山不遮,毕竟东流,集成Web3.0身份钱包MetaMask以太坊一键登录(Tornado6+Vue.js3)
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_213 上世纪九十年代,海湾战争的时候,一位美军军官担心他们的五角大楼会被敌人的一枚导弹干掉,从而导致在全球的美军基地处于瘫痪状态. ...
- MultiSpehere类定义
再等等,把这个定义完了,就到了我们展示代码环节了. 这个类是多个球体的碰撞检测的,其实就是单个球体的改装版本,基本一摸一样的. 类定义: #pragma once #ifndef __MULTISPH ...
- k8s暴露集群内和集群外服务的方法
集群内服务 一般 pod 都是根据 service 资源来进行集群内的暴露,因为 k8s 在 pod 启动前就已经给调度节点上的 pod 分配好 ip 地址了,因此我们并不能提前知道提供服务的 pod ...
- 使用CSS实现多种Noise噪点效果
声明:本文涉及图文和模型素材仅用于个人学习.研究和欣赏,请勿二次修改.非法传播.转载.出版.商用.及进行其他获利行为. 背景 在插画中添加噪点肌理可以营造出一种自然的氛围.噪点肌理可以用于塑造阴影.高 ...
- LuoguP4165 [SCOI2007]组队
化式子,然后两个指针平\(A\)过去 #include <cstring> #include <cstdio> #include <algorithm> #incl ...
- POJ3903Stock Exchange (LIS)
学了下BIT,炸了... #include <iostream> #include <cstdio> #include <cstring> #include < ...
- 国产时序数据库IotDB安装、与SpringBoot集成
一.简介: 本文将完成一个真实业务中的设备上报数据的一个例子,完整的展示后台服务接收到设备上报的数据后,将数据添加到时序数据库,并且将数据查询出来的一个例子.本文所有代码已经上传GitHub:http ...
- postgresql使用group by进行数据去重-2022新项目
一.业务场景 数据去重是web开发中经常会遇到的方式之一,数据库操作中有一个关键字distinct主要就是用来做这件事,用来进行去重. 比如进行统计查询的时候,可以这样写 select count(d ...