Python依据遥感影像的分幅筛选出对应的栅格文件
本文介绍基于Python语言,结合已知研究区域中所覆盖的全部遥感影像的分幅条带号,从大量的遥感影像文件中筛选落在这一研究区域中的遥感影像文件的方法。
首先,先来明确一下本文所需实现的需求。现已知一个研究区域(四川省),且已知覆盖这一研究区域所需的全部遥感影像的分幅条带号(这里就以Sentinel-2数据所采用的分幅规则为例来介绍),如下图所示。

其中,矢量图层上的标签(Label)就是所需的遥感影像的分幅条带号;且这一矢量要素的属性表中,有具体每一个分幅条带号的具体字段(如上图红色方框所示的那一列)。
同时,我们还下载好了大量的遥感影像——这些遥感影像数量众多,既有位于这一研究区域内的遥感影像,同时还有位于研究区域外的。其中,这里所有的遥感影像都保存在一个大文件夹下,而这一大文件夹下还有多个子文件夹,具体遥感影像就存在于子文件夹中;如下图所示。

其中,红色框内的文件夹即为前述“大文件夹”,紫色框内的每一个文件夹即为前述“子文件夹”。此外,每一个子文件夹的命名也是和遥感影像的分幅条带号对应的,比如43LCC这一个子文件夹就是保存了UTM编号为43的网格内的全部遥感影像。这里关于Sentinel-2遥感影像分幅条带号的介绍,如果大家有需要,可以参考哨兵2号Sentinel-2分幅条带介绍与MGRS网格矢量文件获取这篇文章。
同时,在每一个遥感影像文件的文件名中,都有分幅条带号这一字段;例如,打开43LCC这一子文件夹,如下图所示。

我们希望实现的,就是基于上图所示的研究区域内遥感影像的分幅条带号信息,在大量的遥感影像中筛选出这些分幅对应的遥感影像文件,并将其通过复制的方式放入到一个新的结果文件夹中。
了解了具体需求,我们就可以开始代码的撰写。首先,本文所需的完整代码如下所示。
# -*- coding: utf-8 -*-
"""
Created on Fri Feb 3 18:33:11 2023
@author: fkxxgis
"""
import os
import xlrd
import shutil
xls_file = r"E:\02_Project\Sentinel.xls"
tif_path = r"G:\S2_CSI_LCC_product\LCC_10days_2020"
result_path = r"G:\Select"
book = xlrd.open_workbook(xls_file)
sh = book.sheet_by_index(0)
row_num = sh.nrows
for row in range(1, row_num):
mgrs = sh.cell(row,6).value
utm = mgrs[0:2]
for root, dirs, files in os.walk(tif_path):
for name in dirs:
if name[0:2] == utm:
for root_1, dirs_1, files_1 in os.walk(os.path.join(root, name)):
for name_1 in files_1:
if name_1.find(mgrs) != -1:
if not os.path.exists(os.path.join(result_path, mgrs)):
os.makedirs(os.path.join(result_path, mgrs))
print("Make " + mgrs + " path.")
shutil.copy(os.path.join(root, name, name_1), os.path.join(result_path, mgrs, name_1))
其中,我们需要导入os、xlrd与shutil等3个Python库,分别实现系统文件遍历、Excel数据读取与研究区域内遥感影像数据的复制。其中,关于xlrd库的配置,如果大家是用的Anaconda环境,可以参考Python表格处理模块xlrd在Anaconda中的安装这篇文章。此外,我们首先需要将本文开头提及的表示遥感影像数据分幅条带号的矢量文件的属性表导出(通过“System Toolboxes”→“Conversion Tools.tbx”→“Excel”→“Table To Excel”选项,如下图所示),保存为.xls格式的表格文件,从而方便我们后期代码对数据的读取。

在代码中,xls_file表示我们将属性表导出后得到的.xls格式的表格文件,tif_path表示存放所有遥感影像的大文件夹,result_path则表示找到我们所需的结果遥感影像文件后,希望将其复制到的路径。
随后,我们通过xlrd.open_workbook()函数打开.xls格式的表格文件,读取其中的数据并获取其行数row_num;接下来,我们即可对这一表格文件的单元格数据加以遍历,也就是代码中的第1个for循环——我们从第2行开始(因为第1行是表头),读取每一行第7列的数据(也就是存放有遥感影像分幅条带号的那一列),从而依次获取所需的遥感影像条带号。
接下来,由于遥感影像的分幅条带号的前两位,以及前述子文件夹名称的前两位,都是表示UTM编号的两位数字,因此我们通过utm = mgrs[0:2]这句代码,截取当前遥感影像分幅条带号的前两位,并通过os.walk()函数进行遍历,通过一个if判断语句找到大文件夹下对应的子文件夹;随后,在这一子文件夹中同样通过os.walk()函数,进行遥感影像文件的遍历——也就是代码中第2个、第3个、第4个for循环所做的事情。
接下来,针对遍历得到的子文件夹中每一个遥感影像文件,我们通过.find()函数找到所有满足这一分幅条带号的遥感影像文件,也就是代码中第5个for循环与第2个if判断语句的工作。找到符合当前分幅条带号的遥感影像文件后,我们即可开始将其复制到目标文件夹中。
这里还有一个需求,因为我们这里保存的是多时相遥感影像数据(即每一个分幅条带号对应着多个不同时相的遥感影像文件),因此我们希望在目标文件夹中,同样用各个分幅条带号作为名称,创建多个子文件夹;然后将当前分幅条带号对应的全部遥感影像数据放入这一文件夹中。基于此,我们通过os.path.exists()函数判断是否存在指定的子文件夹,如果不存在的话就新建这一文件夹;随后,通过shutil.copy()函数复制这些遥感影像文件。
运行上述代码,最终我们得到的结果如下图所示;其中,每一个子文件夹都表示一个分幅条带号,子文件夹内即为这一分幅条带号所对应的全部时相的遥感影像文件。

至此,大功告成。
Python依据遥感影像的分幅筛选出对应的栅格文件的更多相关文章
- Python核对遥感影像批量下载情况的方法
本文介绍批量下载遥感影像时,利用Python实现已下载影像文件的核对,并自动生成未下载影像的下载链接列表的方法. 批量下载大量遥感影像数据对于GIS学生与从业人员可谓十分常见.然而,对于动辄成 ...
- Python gdal读取MODIS遥感影像并结合质量控制QC波段掩膜数据
本文介绍基于Python中GDAL模块,实现MODIS遥感影像数据的读取.计算,并基于质量控制QC波段进行图像掩膜的方法. 前期的文章Python GDAL读取栅格数据并基于质量评估波段QA对 ...
- Python ArcPy批量掩膜、重采样大量遥感影像
本文介绍基于Python中ArcPy模块,对大量栅格遥感影像文件进行批量掩膜与批量重采样的操作. 首先,我们来明确一下本文的具体需求.现有一个存储有大量.tif格式遥感影像的文件夹:且其中除了 ...
- Python中用max()筛选出列表中出现次数最多的元素
1 List = [1,2,3,4,2,3,2] # 随意创建一个只有数字的列表 2 maxTimes = max(List,key=List.count) # maxTimes指列表中出现次数最多的 ...
- 批量下载Landsat遥感影像的方法
本文介绍在USGS网站批量下载Landsat系列遥感影像的方法. 首先,打开EarthExplorer的官网,首先完成注册与登录. 接下来,点击左侧"Search Criteri ...
- 使用Python以优雅的方式实现根据shp数据对栅格影像进行切割
目录 前言 涉及到的技术 优雅切割 总结 一.前言 前面一篇文章(使用Python实现子区域数据分类统计)讲述了通过geopandas库实现对子区域数据的分类统计,说白了也就是如何根据一 ...
- 基于VC++ Win32+CUDA+OpenGL组合与VC++ MFC SDI+CUDA+OpenGL组合两种方案的遥感影像显示:获得的重要结论!
1.基于VC++ Win32+CUDA+OpenGL组合的遥感影像显示 在该组合方案下,初始化时将OpenGL设置为下面两种方式,效果一样 //设置方式1 glutInitDisplayMode (G ...
- Earthdata批量下载MODIS遥感影像的方法
本文介绍在Earthdata网站中,批量下载MODIS遥感影像的方法. 首先,打开网页:https://search.earthdata.nasa.gov/search ,如果没有Earthd ...
- HDF格式遥感影像批量转为TIFF格式:ArcPy实现
本文介绍基于Python中ArcPy模块,实现大量HDF格式栅格图像文件批量转换为TIFF格式的方法. 首先,来看看我们想要实现的需求. 在一个名为HDF的文件夹下,有五个子文件夹:每一个 ...
- 遥感影像滤波处理软件 — timesat3.2
最近因为要做遥感影像的滤波处理,经过女神推荐,决定用Timesat,可是该软件3.1版本只适合xp系统以及2011的matlab,后来在官网上找到了最新的3.2版本.支持64位操作系统以及2014的m ...
随机推荐
- mysql 必知必会整理—全球化与本地化[十六]
前言 简单介绍一下字符集. 数据库表被用来存储和检索数据.不同的语言和字符集需要以不同的方式存储和检索. 因此,MySQL需要适应不同的字符集(不同的字母和字符),适应不同的排序和检索数据的方法. 字 ...
- nginx 均衡负载
前言 在此只介绍一些nginx的简单的负载均衡. 正文 在这篇之前,请看我的nginx反向代理这一篇,是接着上面的例子写的. 我在上个例子中,分别是两个a.html 和 b.html 现在我把他们的名 ...
- PolarDB-X 2.1 新版本发布 让“MySQL 原生分布式”触手可及
简介: PolarDB-X 2.1 是 PolarDB-X 非常重要的版本,也是第一次 PolarDB-X 分布式数据库的产品可以作为企业级的分布式数据库真正部署到客户的生产环境使用. PolarDB ...
- MAE 自监督算法介绍和基于 EasyCV 的复现
简介:自监督学习(Self-Supervised Learning)能利用大量无标注的数据进行表征学习,然后在特定下游任务上对参数进行微调.通过这样的方式,能够在较少有标注数据上取得优于有监督学习方 ...
- DataV 3D 平面地图 2.0 焕新上线
简介:DataV3月,3D平面地图2.0现已上线~ 3D 平面地图 2.0 现已上线~ 让我们来看看更新了哪些功能吧! 01 交互升级,省市区自由下钻 自带行政区域数据,无需配置: 甚至,可以通 ...
- 如何进行基于Anolis OS的企业级Java应用规模化实践?|龙蜥技术
简介:提供了7×24小时的专属钉钉或者电话支持,响应时间保证到在业务不可用情况下10分钟响应,业务一般的问题在一小时可以获得响应,主要城市可以两小时内得到到达现场的服务. 本文作者郁磊,是Java语 ...
- Flink + Iceberg + 对象存储,构建数据湖方案
简介: 上海站 Flink Meetup 分享内容,如何基于Flink.对象存储.Iceberg 来构建数据湖生态. 本文整理自 Dell 科技集团高级软件研发经理孙伟在 4 月 17 日 上海站 ...
- 基于Delta lake、Hudi格式的湖仓一体方案
简介: Delta Lake 和 Hudi 是流行的开放格式的存储层,为数据湖同时提供流式和批处理的操作,这允许我们在数据湖上直接运行 BI 等应用,让数据分析师可以即时查询新的实时数据,从而对您的 ...
- embedding models 是什么
embedding models 是一类机器学习模型,它们的核心功能是将高维.离散的输入数据(如词汇.类别标签.节点或实体)映射到低维.连续的向量空间中. 这些向量(即 embeddings)通常具有 ...
- [FE] iframe 相关选项 x-frame-options: 设置 meta 标签无效 & helmet
The X-Frame-Options HTTP 响应头是用来给浏览器 指示允许一个页面 可否在 <frame>, <iframe>, <embed> 或者 < ...