(数据科学学习手札143)为geopandas添加gdb文件写出功能
本文示例代码已上传至我的
Github仓库https://github.com/CNFeffery/DataScienceStudyNotes
1 简介
  大家好我是费老师,很多读者朋友跟随着我先前写作的基于geopandas的空间数据分析系列教程文章(快捷访问地址:https://www.cnblogs.com/feffery/tag/geopandas/),掌握了有关geopandas的诸多实用方法,从而更方便地在Python中处理分析GIS数据。其中在文件IO篇中给大家介绍过针对ESRI GeoDataBase格式的文件(也就是大家简称的gdb文件),可以在指定图层名layer参数后进行读取,但无法进行gdb文件的写出操作。
  实际上geopandas是具有写出矢量数据到gdb文件的能力的,只是需要额外配置一些软件库,今天的文章中,我就来带大家学习如何简单快捷地给geopandas补充gdb文件写出功能。

2 为geopandas补充gdb文件写出功能
2.1 为gdal添加FileGDB插件
  在geopandas0.11版本之后,针对矢量文件的读写有默认的'fiona'和可选的'pyogrio'两种引擎,请注意,本文的方案仅适用于默认的'fiona'引擎。
  而fiona底层依赖的则是著名的栅格矢量数据转换框架gdal,因此我们要给geopandas添加gdb写出功能,本质上是需要给gdal添加相关功能。
  搞清楚问题的关键后,下面我们开始操作,这里为了方便演示测试,我们利用conda新建一个geopandas虚拟环境,顺便把jupyterlab也装上,全部命令如下,直接全部粘贴到终端执行即可:
conda create -n geopandas-write-gdb-test python=3.8 -c https://mirrors.sjtug.sjtu.edu.cn/anaconda/pkgs/main -y
conda activate geopandas-write-gdb-test
conda install geopandas -c https://mirrors.sjtug.sjtu.edu.cn/anaconda/cloud/conda-forge -y
pip install jupyterlab -i https://pypi.tuna.tsinghua.edu.cn/simple
  全部执行完之后,我们可以先查看默认情况下fiona有哪些已有的读写驱动:
import fiona
fiona.supported_drivers
  可以看到其中列出的'OpenFileGDB'就是gdal中默认自带的针对gdb文件的驱动,其对应的值为'r'说明它只能针对gdb文件进行读取,我们要想写出gdb文件,需要额外配置添加Esri官方开发的FileGDB驱动。

  第一步,我们需要去下载FileGDB驱动文件,Esri官方Github仓库:https://github.com/Esri/file-geodatabase-api,按照https://www.lfd.uci.edu/~gohlke/pythonlibs/#gdal上有关gdal使用FileGDB插件的额外说明,我选择下载FileGDB的版本为https://github.com/Esri/file-geodatabase-api/blob/master/FileGDB_API_1.5.1/FileGDB_API_1_5_1-VS2015.zip。

  下载到本地解压后,因为我是64位windows系统,所以从bin64目录下复制FileGDBAPI.dll文件,粘贴到我们前面利用conda新建的虚拟环境根目录下的Library\bin里。
  这个目录找起来很简单,因为所有用conda建立的虚拟环境,默认都位于你的conda安装根目录的envs目录下,我的conda安装根目录在C:\Conda,因此我需要粘贴前面文件的目标目录为C:\Conda\envs\geopandas-write-gdb-test\Library\bin:

  第二步,我们还需要下载ogr_FileGDB.dll这个文件,我是通过OSGeo4W下载的,有些麻烦,为了方便广大读者朋友使用,我在百度云盘分享了一个备份(链接:https://pan.baidu.com/s/1VEtN6JAReFsDhnWl_8v6Eg
提取码:w2s7),大家将其下载下来放置于前面FileGDBAPI.dll同级目录下的gdalplugins目录中即可:

  第三步,完成了这些操作后,我们就已经搞定了,这时回到fiona中再次查看支持的驱动,可以看到多了FileGDB,且值为'raw',这代表我们已经拥有了写出gdb文件的能力:

2.2 在geopandas中测试写出gdb文件
  至此我们就可以进行gdb文件的写出了,只需要在to_file()中指定driver='FileGDB',并设置好对应的图层名layer参数即可:
import geopandas as gpd
from shapely.geometry import Point, LineString, Polygon
demo_point_layer = gpd.GeoDataFrame(
    {
        '数据字段测试': ['点要素测试数据字段测试'],
        'geometry': [Point(0, 0)]
    },
    crs='EPSG:4326'
)
demo_linestring_layer = gpd.GeoDataFrame(
    {
        '数据字段测试': ['线要素测试数据字段测试'],
        'geometry': [LineString([(0, 0), (1, 1)])]
    },
    crs='EPSG:4326'
)
demo_polygon_layer = gpd.GeoDataFrame(
    {
        '数据字段测试': ['面要素测试数据字段测试'],
        'geometry': [Polygon([(0, 0), (1, 1), (1, 0)])]
    },
    crs='EPSG:4326'
)
# 写出到示例gdb文件中
demo_point_layer.to_file('./demo.gdb', layer='点图层测试', driver='FileGDB')
demo_linestring_layer.to_file('./demo.gdb', layer='线图层测试', driver='FileGDB')
demo_polygon_layer.to_file('./demo.gdb', layer='面图层测试', driver='FileGDB')
  查看目标gdb文件的所有图层名:

  读入查看矢量,在读入时建议不设置driver参数,因为默认的OpenFileGDB驱动读取gdb文件要更快:

  其中线要素与面要素读进来不知为何变成了多部件要素类型,这其实不影响在geopandas中进行分析使用,但如果实在介意,可以直接基于数值唯一的某个字段进行dissolve()操作即可恢复原样:

  以上操作适用于windows系统,至于linux系统,且容我日后研究出来后再分享给大家。
以上就是本文的全部内容,欢迎在评论区与我进行讨论~
(数据科学学习手札143)为geopandas添加gdb文件写出功能的更多相关文章
- (数据科学学习手札89)geopandas&geoplot近期重要更新
		
本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 最近一段时间(本文写作于2020-07-1 ...
 - (数据科学学习手札111)geopandas 0.9.0重要新特性一览
		
本文示例文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 就在几天前,geopandas释放了其最新正式版 ...
 - (数据科学学习手札139)geopandas 0.11版本重要新特性一览
		
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 大家好我是费老师,就在几天前,geopandas ...
 - (数据科学学习手札129)geopandas 0.10版本重要新特性一览
		
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 就在前不久,我们非常熟悉的Python地理 ...
 - (数据科学学习手札146)geopandas中拓扑非法问题的发现、诊断与修复
		
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 大家好我是费老师,geopandas作为在Pyt ...
 - (数据科学学习手札134)pyjanitor:为pandas补充更多功能
		
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 pandas发展了如此多年,所包含的功能已 ...
 - (数据科学学习手札75)基于geopandas的空间数据分析——坐标参考系篇
		
本文对应代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 在上一篇文章中我们对geopandas中的数据结 ...
 - (数据科学学习手札80)用Python编写小工具下载OSM路网数据
		
本文对应脚本已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 我们平时在数据可视化或空间数据分析的过程中经常会 ...
 - (数据科学学习手札50)基于Python的网络数据采集-selenium篇(上)
		
一.简介 接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文 ...
 
随机推荐
- 5-20   Web服务器和Nginx
			
什么是Web服务器 简单来说 Web服务器就是一个能够接收http请求并作出响应的java程序 我们再二阶段编写的webServer项目其实就是我们手写的Web服务器 我们现在开发的标准SpringB ...
 - esp8266模拟输入(ADC)检测问题
			
今天使用esp12f读取A0数据时一直出现错误; Serial.println(analogRead(A0));读取值一直为1024 因为前段时间一直用的是开发板,读取电压值正常 而从昨天换为了esp ...
 - 剑指offer——day-1
			
今天开始记录一下剑指offer的题目训练,提升一下自己的编程能力吧 题目一: 用两个栈实现一个队列.队列的声明如下,请实现它的两个函数 appendTail 和 deleteHead ,分别完成在队列 ...
 - 筛 sigma_k
			
问题 定义 \(\sigma_k(n)\) 表示 \(n\) 的所有约数的 \(k\) 次方和,即 \[\sigma_k(n)=\sum_{d\mid n}d^k \] 问题:求 \(\sigma_k ...
 - 【原创】医鹿APP九价HPV数据抓包分析
			
本文所有教程及源码.软件仅为技术研究.不涉及计算机信息系统功能的删除.修改.增加.干扰,更不会影响计算机信息系统的正常运行.不得将代码用于非法用途,如侵立删! 医鹿APP九价HPV数据抓包分析 操作环 ...
 - JVM学习之 内存结构
			
目录 一.引言 1.什么是JVM? 2.学习JVM有什么用 3.常见的JVM 4.学习路线 二.内存结构 1. 程序计数器 1.1 定义 1.2作用 2. 虚拟机栈 2.1定义 2.2栈内存溢出 2. ...
 - Redis 01 概述
			
参考源 https://www.bilibili.com/video/BV1S54y1R7SB?spm_id_from=333.999.0.0 版本 本文章基于 Redis 6.2.6 简介 NoSQ ...
 - 解决linux下U盘变成只读模式
			
在最近的一个项目里,需要将linux下的些文件拷贝出来.插入U盘后,发现是只读模式. U盘可以写出,不能写入. 折腾了一翻: 最后这样解决的: 将U盘插入到windows下 执行 chkdsk g: ...
 - ATOM使用的一点心得与技巧——在一个窗口打开多个项目
			
atom作为一个后起之秀,我个人是觉得越用越好用.虽然sublimet也很棒,但是在ubuntu里不能使用中文很是恼火.网上关于修复这个bug的办法实在太多了.果断选择省事的atom.虽然比起subl ...
 - Word 常识备忘录
			
一句科普 名词解释 左右页边距 正文到纸左右两边之间的间距. 分页符 分页符是分页的一种符号,上一页结束以及下一页开始的位置. 分栏符 分栏的页面使用分栏符可以使一列分栏的段落排列到另一栏. 邮件合并 ...