本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes

1 简介

　　大家好我是费老师，我写过很多篇介绍geopandas相关技术的文章，而geopandas之所以如此高效易用，成为Python GIS生态中的翘楚，离不开其底层依赖库shapely对其矢量计算功能的支持。

　　不仅是作为geopandas的基石，直接使用shapely中极其丰富的各种矢量操作API，也可以帮助我们轻松实现各种细致入微的矢量操作。而就在几天前，shapely发布了其颇具里程碑意义的2.0正式版本，为我们带来了更加澎湃的运算性能提升，以及更稳定更丰富的新功能，今天的文章费老师我就来带大家一览shapely 2.0版本中的主要新特性。

2 shapely 2.0重要新特性一览

　　通常我们不会专门去安装shapely，在安装geopandas的过程中它就顺带被安装上了，在我的本地示例虚拟环境中shapely原先的版本为1.8.5，通过执行conda update shapely -c conda-forge -y可将其稳定升级到2.0.0以上的正式版本：

　　接下来我们来看看本次大的版本更新中带来了哪些重要内容：

2.1 向量化矢量操作带来高达百倍的性能提升

　　新版shapely重写了底层对C++库GEOS的封装方式，大幅度降低了冗余计算成本，并且吸收了pygeos中的底层逻辑，对各种常用接口进行ufunc向量化运算支持，使得我们可以配合numpy快速实现，以contains()为例，基于shapely的顶级API接口：

　　在上面的例子中，相较于标量一对一运算和列表批量运算，新的向量化运算分别取得了500多倍和70多倍的运算加速。

　　目前shapely的所有顶级API，以及shapely.ops等子模块下的顶级API均已支持向量化运算特性，具体见shapely中的API文档是否如下图所示提及ufunc：

2.2 矢量对象不可变

　　在以前的版本中，shapely中的矢量要素对象是可变的，譬如对于LineString要素，可以在被创建后，通过为其coords属性赋值新的坐标串信息以改变其矢量信息：

　　而从2.0.0开始，shapely中所有的矢量要素变为不可变对象，这意味着它们可hash，譬如可以作为字典的键，或pandas分组运算的分组依据等：

2.3 矢量要素类可作为顶级API使用

　　从上面的几个例子中你也可以发现，新版shapely中我们可以直接从shapely导入常用的各种矢量要素类，这将作为from shapely.geometry import XXX方式的备选方式：

2.4 多部件要素不再可视作序列型对象

　　在以前的版本中，多部件要素譬如MultiPoint可以直接视作数组对象来直接按位置索引或迭代，而从2.0.0开始，原有的方式会引发错误，请注意更换为使用其geoms属性实现相关操作：

2.5 矢量要素支持精度控制

　　从2.0.0开始，shapely新增API接口set_precision()和get_precision()用于针对矢量要素进行坐标精度设置和精度查询，非常的方便：

2.6 基于GEOS新增大量新功能函数

　　随着对底层GEOS依赖库的版本更新（当前依赖版本：3.11.1），一大批新的实用功能函数得以被添加到shapely中，由于数量非常众多，下面我仅对其中的部分典型新功能函数做介绍：

extract_unique_points()

　　通过新增的函数extract_unique_points()，我们可以从指定要素中快速提取去重后的折点要素：

node()

　　通过新增的函数node()，我们可以轻松地从线要素中提取出彼此不交叉的片段：

minimum_bounding_circle()与minimum_bounding_radius()

　　通过minimum_bounding_circle()和minimum_bounding_radius()我们可以快速得到目标要素的最小外接圆及其对应半径：

dwithin()

　　通过dwithin()，我们可以快速判断要素之间的距离是否小于所给定的阈值：

2.7 新增force_2d()、force_3d()函数

　　通过新增的快捷函数force_2d()和force_3d()，我们可以直接为指定要素移除/添加z轴信息：

　　篇幅有限，本文只针对shapely 2.0中一些比较重要的内容进行介绍，更多新特性请移步其更新说明文档页：https://shapely.readthedocs.io/en/stable/release/2.x.html

　　以上就是本文的全部内容，欢迎在评论区与我进行讨论~

（数据科学学习手札147）Python GIS利器shapely全新2.0版本一览的更多相关文章

（数据科学学习手札47）基于Python的网络数据采集实战（2）
一.简介马上大四了,最近在暑期实习,在数据挖掘的主业之外,也帮助同事做了很多网络数据采集的内容,接下来的数篇文章就将一一罗列出来,来续写几个月前开的这个网络数据采集实战的坑. 二.马蜂窝评论数据采集 ...
（数据科学学习手札80）用Python编写小工具下载OSM路网数据
本文对应脚本已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介我们平时在数据可视化或空间数据分析的过程中经常会 ...
（数据科学学习手札50）基于Python的网络数据采集-selenium篇（上）
一.简介接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库,CSS,正则表达式等),在那篇文 ...
（数据科学学习手札32）Python中re模块的详细介绍
一.简介关于正则表达式,我在前一篇(数据科学学习手札31)中已经做了详细介绍,本篇将对Python中自带模块re的常用功能进行总结: re作为Python中专为正则表达式相关功能做出支持的模块,提供 ...
（数据科学学习手札90）Python+Kepler.gl轻松制作时间轮播图
本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 Kepler.gl作为一款强大的开源地理信 ...
（数据科学学习手札55）利用ggthemr来美化ggplot2图像
一.简介 R中的ggplot2是一个非常强大灵活的数据可视化包,熟悉其绘图规则后便可以自由地生成各种可视化图像,但其默认的色彩和样式在很多时候难免有些过于朴素,本文将要介绍的ggthemr包专门针对原 ...
（数据科学学习手札49）Scala中的模式匹配
一.简介 Scala中的模式匹配类似Java中的switch语句,且更加稳健,本文就将针对Scala中模式匹配的一些基本实例进行介绍: 二.Scala中的模式匹配 2.1 基本格式 Scala中模式匹 ...
（数据科学学习手札40）tensorflow实现LSTM时间序列预测
一.简介上一篇中我们较为详细地铺垫了关于RNN及其变种LSTM的一些基本知识,也提到了LSTM在时间序列预测上优越的性能,本篇就将对如何利用tensorflow,在实际时间序列预测任务中搭建模型来完 ...
（数据科学学习手札69）详解pandas中的map、apply、applymap、groupby、agg
*从本篇开始所有文章的数据和代码都已上传至我的github仓库:https://github.com/CNFeffery/DataScienceStudyNotes 一.简介 pandas提供了很多方 ...
（数据科学学习手札61）xpath进阶用法
一.简介 xpath作为对网页.对xml文件进行定位的工具,速度快,语法简洁明了,在网络爬虫解析内容的过程中起到很大的作用,除了xpath的基础用法之外(可参考我之前写的(数据科学学习手札50)基于P ...

随机推荐

css过渡样式
transition: 2s;//过渡两秒用法: .div{ transition: 2s; }
关于aws账单数据中几个重要的与费用相关的字段的意义分析
今天在看aws账号的详细信息时,看到字段很多,大多数字段,根据名称可以知道代表的意义对于如下几个字段的概念有点模糊(位于"UsageStartDate","UsageE ...
C++面向对象编程之类模板、函数模板等一些补充
1.static数据和 static函数: 对于非static函数在内存中只有一份,当类对象调用时,其实会有该对象的this pointer传进去,那个函数就知道要对那个对象进行操作: stat ...
vue2.x核心源码深入浅出，我还是去看源码了
平常的工作就是以vue2.x进行开发,因为我是个实用主义者,以前我就一直觉得,你既然选择了这个框架开发你首先就要先弄懂这玩意怎么用,也就是先熟悉vue语法和各种api,而不是去纠结实现它的原理是什么. ...
手写编程语言-如何为 GScript 编写标准库
版本更新最近 GScript 更新了 v0.0.11 版本,重点更新了: Docker 运行环境新增了 byte 原始类型新增了一些字符串标准库 Strings/StringBuilder 数组 ...
通过QQ抓IP查询地址
使用工具: Wireshark 可以直接搜索官网获取,个人用的免费的,也可以直接在kali中也是可以直接用的.这里就不介绍怎么安装了,网上很多. 步入正题: 通过wireshark进行抓包查地址,需要 ...
【番外篇】Rust环境搭建+基础开发入门+Rust与.NET6、C++的基础运算性能比较
前言:突然想打算把Rust作为将来自己主要的副编程语言.当然,主语言还是C#,毕竟.NET平台这么强大,写起来就是爽.缘起:之前打算一些新的产品或者新的要开发的东西,由于没有历史包袱,就想重新选型一下 ...
Response对象页面重定向、时间的动态显示
Response对象 response对象主要用于对客户端的请求进行回应,将web服务器处理后的结果发回给客户端,封装了jsp产生的响应,并发送到客户端响应客户端的请求,请求的数据可以是各种数据类型, ...
《吐血整理》高级系列教程-吃透Fiddler抓包教程(30)-Fiddler如何抓取Android7.0以上的Https包-番外篇
1.简介通过宏哥前边几篇文章的讲解和介绍想必大家都知道android7.0以上,有android的机制不在信任用户证书,导致https协议无法抓包.除非把证书装在系统信任的证书里,此时手机需要roo ...
.Net Core - 使用事务IDbtransaction操作DBData
New一个流程获取数据库连接字符串,实例化SqlConnection 打来数据库连接 Begin当前连接的事务(IDbTransaction) 操作数据库(操作数据库的时候一定要使用当前连接和事务修 ...

（数据科学学习手札147）Python GIS利器shapely全新2.0版本一览