(数据科学学习手札133)利用geopandas绘制拓扑着色地图
本文示例代码及文件已上传至我的
Github
仓库https://github.com/CNFeffery/DataScienceStudyNotes
1 简介
我们在绘制某些地图时,为了凸显出每个独立的区域,需要满足拓扑着色
要求,即所有相邻的区域不可以用同一种颜色绘制
,以前的手绘地图需要绘制者自行思考设计具体的着色规则,而现如今通过计算机的辅助,我们可以快速生成大量的着色方案。
今天我们就来学习配合geopandas
如何快速实现地图的拓扑着色。
2 基于mapclassify的地图拓扑着色
对于着色方案的生成,我们需要使用到mapclassify
这个第三方库,以前我的geopandas
系列文章分层设色篇也介绍过其中的诸多功能,而本文需要使用到其特殊的greedy
功能。
以中国县级单元矢量边界数据为例,它包含了共2900个县级单元的行政区划面矢量要素:
对于这样一个典型的面要素众多的地图,利用mapclassify.greedy()
,我们可以基于面要素之间的邻接拓扑关系,快速生成一定配色数量的方案出来,greedy()
的主要参数如下:
- gdf:GeoDataFrame型,用于传入待处理的地理数据框
- strategy:str型,用于设定拓扑着色所采取的具体策略,默认为
balanced
(这也是QGIS
中拓扑着色所使用的方法),其余可选策略有'largest_first'
、'random_sequential'
、'smallest_last'
、'independent_set'
、'connected_sequential_bfs'
、'connected_sequential_dfs'
、'connected_sequential'
、'saturation_largest_first'
、'DSATUR'
等,详细介绍见https://networkx.github.io/documentation/stable/reference/algorithms/generated/networkx.algorithms.coloring.greedy_color.html
- balance:str型,当
strategy='balanced'
时,用于设定如何进行“平衡”着色,默认为'count'
,可选项如下,其中除了'count'
方式以外,其余方式均需要输入的GeoDataFrame
为投影坐标系:- count:尽量保持每种颜色对应的面要素数量平衡
- area:尽量保持每种颜色对应的面要素面积之和平衡
- centroid:尽量保持每种颜色对应的面要素之间重心距离平衡
- distance:尽量保持每种颜色对应的面要素之间拓扑距离平衡
- min_colors:int型,当
strategy='balanced'
时,用于设置色彩方案至少的色彩数量,最后运算产生的色彩划分结果可能会大于这个参数 - sw:str型,用于设定拓扑邻接关系判定策略,
'rook'
表示共边邻接,'queen'
表示共点邻接,默认为'queen'
- min_distance:数值型,默认为
None
,有时由于数据质量、精度的原因,可能会导致肉眼看起来的邻接实际上仍然存在一定的“间距”,这时就可以使用min_distance
参数来设定距离阈值来帮助greedy
捕捉相邻面要素关系,即面要素两两之间拓扑距离小于min_distance
时也视作“邻接”
知晓了greedy()
的主要参数后,我们下面来演示如何使用它来辅助制作拓扑着色地图。
首先我们需要向greedy()
中传入对应的面要素GeoDataFrame
,greedy()
会根据我们的参数设定为每一个面生成一个标签,我们只需要将此标签列作为绘图着色映射列即可,可以看到最终得到的标签方案中共有7种不同标签,虽然按照四色问题的猜想,任何拓扑着色地图只需要4种颜色即可完成色彩填充,但在有限的计算时间内,greedy()
给出了还不错的方案:
按照标签进行颜色分配:
放大仔细发现,每个邻接的区域的确实现了颜色不重合:
而如果你希望用自定义色彩值来配合标签字段进行映射,则可以参考我下面的做法,将具体的颜色值譬如16进制色彩字符串传入color
参数,这里使用到以前介绍过多次的配色库palettable
:
以上就是本文的全部内容,欢迎在评论区与我进行讨论~
(数据科学学习手札133)利用geopandas绘制拓扑着色地图的更多相关文章
- (数据科学学习手札146)geopandas中拓扑非法问题的发现、诊断与修复
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 大家好我是费老师,geopandas作为在Pyt ...
- (数据科学学习手札111)geopandas 0.9.0重要新特性一览
本文示例文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 就在几天前,geopandas释放了其最新正式版 ...
- (数据科学学习手札129)geopandas 0.10版本重要新特性一览
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 就在前不久,我们非常熟悉的Python地理 ...
- (数据科学学习手札89)geopandas&geoplot近期重要更新
本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 最近一段时间(本文写作于2020-07-1 ...
- (数据科学学习手札139)geopandas 0.11版本重要新特性一览
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 大家好我是费老师,就在几天前,geopandas ...
- (数据科学学习手札75)基于geopandas的空间数据分析——坐标参考系篇
本文对应代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 在上一篇文章中我们对geopandas中的数据结 ...
- (数据科学学习手札55)利用ggthemr来美化ggplot2图像
一.简介 R中的ggplot2是一个非常强大灵活的数据可视化包,熟悉其绘图规则后便可以自由地生成各种可视化图像,但其默认的色彩和样式在很多时候难免有些过于朴素,本文将要介绍的ggthemr包专门针对原 ...
- (数据科学学习手札42)folium进阶内容介绍
一.简介 在上一篇(数据科学学习手札41)中我们了解了folium的基础内容,实际上folium在地理信息可视化上的真正过人之处在于其绘制图像的高度可定制化上,本文就将基于folium官方文档中的一些 ...
- (数据科学学习手札40)tensorflow实现LSTM时间序列预测
一.简介 上一篇中我们较为详细地铺垫了关于RNN及其变种LSTM的一些基本知识,也提到了LSTM在时间序列预测上优越的性能,本篇就将对如何利用tensorflow,在实际时间序列预测任务中搭建模型来完 ...
随机推荐
- Oracle完整的压测记录
问题描述:对oracle进行一次完整的数据压测,从制造数据到压测的过程,路上踩了一些坑,现在分享出来 1.下载swingbenh软件,一个比较好用的oracle压测软件 2.利用oewizard工具( ...
- javaSE高级篇5 — java8新特性详解———更新完毕
java8新特性 在前面已经见过一些东西了,但是:挖得有坑儿 1.lambda表达式 lambda表达式是jdk1.8引入的全新语法特性 它支持的是:只有单个抽象方法的函数式接口.什么意思? 就是说: ...
- 12. Fedora 中文乱码问题
1. Rhythmbox(音乐播放器乱码) yum install python-mutagen mid3iconv -e GBK *.mp3 2. totem电影播放机播放列表乱码解决1).修改to ...
- EntityFramework Core (一)记一次 .net core 使用 ef 6
使用传统的sql去操作数据库虽然思路更加清晰,对每一步数据库读写操作都能监控到,但是对大数据存储,或存储规则复杂的程序就需要编写大量的SQL语句且不易维护..orm大大方便了复杂的数据库读写操作, 让 ...
- 调整markdown 图片大小和对齐方式
[博客园]调整markdown 图片大小和对齐方式 图片大小 例 <img src="https://img2020.cnblogs.com/blog/2199257/202101/2 ...
- &和nohup
目录 一.简介 二.& 三.nohup 一.简介 当我们在终端或控制台工作时,可能不希望由于运行一个作业而占住了屏幕,因为可能还有更重要的事情要做,比如阅读电子邮件.对于密集访问磁盘的进程,我 ...
- KubeCon 2021|使用 eBPF 代替 iptables 优化服务网格数据面性能
作者 刘旭,腾讯云高级工程师,专注容器云原生领域,有多年大规模 Kubernetes 集群管理及微服务治理经验,现负责腾讯云服务网格 TCM 数据面产品架构设计和研发工作. 引言 目前以 Istio[ ...
- 为什么要用urlencode()函数进行url编码
URLEncode就是将URL中特殊部分进行编码.URLDecoder就是对特殊部分进行解码. 因为当字符串数据以url的形式传递给web服务器时,字符串中是不允许出现空格和特殊字符的 譬如:你要传的 ...
- [BUUCTF]PWN——picoctf_2018_rop chain
picoctf_2018_rop chain 附件 步骤: 例行检查,32位,开启了NX保护 试运行一下程序,看到输入太长数据会崩溃 32位ida载入,习惯性的检索程序里的字符串,看见了flag.tx ...
- ASP.NET WebApi 依赖 SAP Connector dll 报错
说明 本地 VS 开发 ASP.NET WebApi 调试运行没有问题,但发布到服务器 IIS 上就报错.结果发现是 SAP 依赖库的问题:sapnco.dll.sapnco_utils.dll. 错 ...