(数据科学学习手札154)geopandas 0.14版本新特性一览
本文示例代码已上传至我的
Github
仓库https://github.com/CNFeffery/DataScienceStudyNotes
1 简介
大家好我是费老师,就在前两天,Python
生态中的GIS
运算神器geopandas
发布了其0.14.0
新版本,在这次新版本更新中,不仅是新增了许多矢量计算API
,还开始为日后正式发布1.0
版本做准备,对一些底层依赖版本进行改动。今天的文章中,我就将为大家一一介绍相关的更新内容:
2 geopandas 0.14版本更新内容
2.1 安装新版本geopandas
需要注意的是,从0.14
版本开始,geopandas
将最低支持的python
版本提升至3.9
:
因此,推荐大家以3.9
版本作为建立GIS
运算Python
环境的基础,这里我们以conda
为例,直接建立新的虚拟环境来做演示(下面的命令中为了加速下载过程使用到相关国内conda
资源镜像):
conda create -n geopandas-demo python=3.9 -c https://mirrors.sustech.edu.cn/anaconda/pkgs/main/ -y
conda activate geopandas-demo
conda install geopandas pyogrio jupyterlab -c https://mirrors.sustech.edu.cn/anaconda/cloud/conda-forge -y
直接在终端中执行上述命令即可一步到位完成虚拟环境的创建,以及新版geopandas
、jupyterlab
的安装:
2.2 geopandas 0.14版本底层依赖变动
在0.14
版本中,geopandas
底层将默认使用shapely
(>=2.0版本)进行高性能矢量运算,因此geopandas
仅会在shapely
缺失但pygeos
已安装时,才会调用pygeos
。且geopandas
将会在未来要发布的1.0
正式版本中,直接移除对pygeos
,以及旧版shapely
(<2.0版本)的支持:
2.3 新增一系列矢量计算方法
在这次新版本中,基于shapely
为GeoSeries/GeoDataFrame
新引入了一系列矢量计算方法,具体有:
2.3.1 新增concave_hull()方法
有别于先前已有的convex_hull
方法,新增的concave_hull()
方法用于为矢量列中的每个要素计算最小凹多边形,与convex_hull
计算结果的对比示例如下:
import random
from shapely.geometry import MultiPoint
# 示例GeoSeries
demo_geometries = gpd.GeoSeries(
[
MultiPoint([(random.uniform(0, 1), random.uniform(0, 1)) for i in range(25)])
]
)
ax = demo_geometries.plot()
# concave_hull()计算结果
demo_geometries.concave_hull().plot(ax=ax, facecolor='none', edgecolor='red')
# 对比convex_hull()计算结果
demo_geometries.convex_hull.plot(ax=ax, facecolor='none', edgecolor='green');
2.3.2 新增delaunay_triangles()方法
新增了用于计算Delaunay三角网的delaunay_triangles()
方法,计算示例如下:
2.3.3 新增extract_unique_points()方法
新增extract_unique_points()
方法,用于直接从任意类型目标矢量中提取全部折点要素:
2.3.4 新增frechet_distance()方法
新增frechet_distance()
方法,用于计算弗雷歇距离(fréchet distance),是一种用来度量路径之间相似度的经典数学方法:
举个例子,我们构造如下的四条路径线要素,肉眼上很容易看出a
与b
,c
与d
各自相似度最高:
而通过frechet_distance()
计算两两之间的弗雷歇距离,也可以从数值计算角度准确计算得到彼此最相似的路径:
2.3.5 新增minimum_rotated_rectangle()方法
新增minimum_rotated_rectangle()
方法,用于为矢量列中各个要素计算最小外接矩形,譬如:
2.3.6 新增offset_curve()方法
新增offset_curve()
方法,用于为目标要素构建偏移曲线,即与原始要素相似但偏移一定的距离:
2.3.7 新增remove_repeated_points()方法
新增remove_repeated_points()
方法,用于沿要素坐标串定义方向,将距离在阈值以内的坐标点视作重复点要素进行移除,默认阈值为0,你可以在实际应用中灵活调整阈值,从而起到简化要素的目的:
2.3.8 新增segmentize()方法
新增segmentize()
方法,用于对目标矢量列中的各要素,按照设定的等间距进行增密操作,譬如在原有仅起点终点连成线要素基础上,按照1单位距离进行增密的结果如下:
2.3.9 新增shortest_line()方法
新增shortest_line()
方法,用于计算任意两个要素之间最短距离连线:
2.4 sjoin_nearest()新增exclusive参数
新版本中为sjoin_nearest()
新增参数exclusive
,默认为False
,当设置为True
时,会在计算过程中自动忽略与自身要素相同的最近邻要素,非常的实用,省得我们在做sjoin_nearest()
最近邻搜索计算之前手动排除要素自身:
更多有关geopandas
0.14版本的更新内容,请移步https://geopandas.org/en/stable/docs/changelog.html
了解更多。
以上就是本文的全部内容,欢迎在评论区与我进行讨论~
(数据科学学习手札154)geopandas 0.14版本新特性一览的更多相关文章
- (数据科学学习手札75)基于geopandas的空间数据分析——坐标参考系篇
本文对应代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 在上一篇文章中我们对geopandas中的数据结 ...
- (数据科学学习手札72)用pdpipe搭建pandas数据分析流水线
1 简介 在数据分析任务中,从原始数据读入,到最后分析结果出炉,中间绝大部分时间都是在对数据进行一步又一步的加工规整,以流水线(pipeline)的方式完成此过程更有利于梳理分析脉络,也更有利于查错改 ...
- (数据科学学习手札55)利用ggthemr来美化ggplot2图像
一.简介 R中的ggplot2是一个非常强大灵活的数据可视化包,熟悉其绘图规则后便可以自由地生成各种可视化图像,但其默认的色彩和样式在很多时候难免有些过于朴素,本文将要介绍的ggthemr包专门针对原 ...
- (数据科学学习手札50)基于Python的网络数据采集-selenium篇(上)
一.简介 接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文 ...
- (数据科学学习手札49)Scala中的模式匹配
一.简介 Scala中的模式匹配类似Java中的switch语句,且更加稳健,本文就将针对Scala中模式匹配的一些基本实例进行介绍: 二.Scala中的模式匹配 2.1 基本格式 Scala中模式匹 ...
- (数据科学学习手札47)基于Python的网络数据采集实战(2)
一.简介 马上大四了,最近在暑期实习,在数据挖掘的主业之外,也帮助同事做了很多网络数据采集的内容,接下来的数篇文章就将一一罗列出来,来续写几个月前开的这个网络数据采集实战的坑. 二.马蜂窝评论数据采集 ...
- (数据科学学习手札44)在Keras中训练多层感知机
一.简介 Keras是有着自主的一套前端控制语法,后端基于tensorflow和theano的深度学习框架,因为其搭建神经网络简单快捷明了的语法风格,可以帮助使用者更快捷的搭建自己的神经网络,堪称深度 ...
- (数据科学学习手札42)folium进阶内容介绍
一.简介 在上一篇(数据科学学习手札41)中我们了解了folium的基础内容,实际上folium在地理信息可视化上的真正过人之处在于其绘制图像的高度可定制化上,本文就将基于folium官方文档中的一些 ...
- (数据科学学习手札40)tensorflow实现LSTM时间序列预测
一.简介 上一篇中我们较为详细地铺垫了关于RNN及其变种LSTM的一些基本知识,也提到了LSTM在时间序列预测上优越的性能,本篇就将对如何利用tensorflow,在实际时间序列预测任务中搭建模型来完 ...
- (数据科学学习手札36)tensorflow实现MLP
一.简介 我们在前面的数据科学学习手札34中也介绍过,作为最典型的神经网络,多层感知机(MLP)结构简单且规则,并且在隐层设计的足够完善时,可以拟合任意连续函数,而除了利用前面介绍的sklearn.n ...
随机推荐
- ASP.NET Core 6框架揭秘实例演示[36]:HTTPS重定向
HTTPS是确保传输安全最主要的手段,并且已经成为了互联网默认的传输协议.不知道读者朋友们是否注意到当我们利用浏览器(比如Chrome)浏览某个公共站点的时候,如果我们输入的是一个HTTP地址,在大部 ...
- 配置VsCode的QT工程
配置VsCode的QT工程 VsCode + qmake 环境(Environment): Windows11 Qt5.12.11+ MinGW64 编译套件 VsCode (version = 1. ...
- flutter 的 in_app_web_view实现下载功能
flutter与前端交互,利用in_app_web_view实现下载功能: 首先下载库,终端输入 flutter pub add flutter_inappwebview 之后导出 import 'p ...
- 常用的Java Enum JdbcType
常用的Java Enum JdbcType ARRAY BIGINT BINARY BIT BLOB BOOLEAN CHAR CLOB CURSOR DATE DECIMAL DOUBLE FLOA ...
- 一文掌握Python多线程与多进程
Python的多线程和多进程 一.简介 并发是今天计算机编程中的一项重要能力,尤其是在面对需要大量计算或I/O操作的任务时.Python 提供了多种并发的处理方式,本篇文章将深入探讨其中的两种:多线程 ...
- 发布一个Visual Studio 2022 插件,可以自动完成构造函数依赖注入代码
赖注入(DI)在开发中既是常见的也是必需的技术.它帮助我们优化了代码结构,使得应用更加灵活.易于扩展,同时也降低了各个模块之间的耦合度,更容易进行单元测试,提高了编码效率和质量.不过,手动注入依赖项也 ...
- Android 巧用ImageView属性实现选中和未选中效果
原文地址: Android 巧用ImageView属性实现选中和未选中效果 - Stars-One的杂货小窝 选中和未选中状态变更是很常见需求,UI那边出的两个不同状态的图片,然后开发这边去实现 通常 ...
- SQL ERVER 表转化为C#实体(SQL 代码)
本文推出SqlServer表转化为实体的sql代码 在VS中有可以自带生成实体类的快捷操作,但是生成的代码比较杂乱,很多东西都是不需要的,一个一个去敲又很浪费时间,关键太无聊了 在闲暇之余写一份代码供 ...
- Open LLM 排行榜近况
Open LLM 排行榜是 Hugging Face 设立的一个用于评测开放大语言模型的公开榜单.最近,随着 Falcon 的发布并在 Open LLM 排行榜 上疯狂屠榜,围绕这个榜单在推特上掀起了 ...
- 即构✖叮咚课堂:行业第一套AI课堂解决方案是怎么被实现的?
AI走进教育,是传统教育的一次迭代进化 在教育问题上,我们看到两类话题最容易引发公众讨论:教育公平和个性化教育,"互联网+教育"有可能解决第一类话题,"AI教育" ...