一、简介

  Shp格式是GIS中非常重要的数据格式,主要在Arcgis中使用,但在进行很多基于网页的空间数据可视化时,通常只接受GeoJSON格式的数据,众所周知JSON(JavaScript Object Nonation)是利用键值对+嵌套来表示数据的一种格式,以其轻量、易解析的优点,被广泛使用与各种领域,而GeoJSON就是指在一套规定的语法规则下用JSON格式存储矢量数据,本文就将针对GeoJSON的语法规则,以及如何利用Python完成Shp格式到GeoJSON格式的转换进行介绍。

二、Shp转GeoJSON

2.1 GeoJSON格式说明

  GeoJSON本质依旧是JSON,其基本格式如下:

{
"type": "FeatureCollection",
"features": []
}

  一个完整的GeoJSON文件最外层为一个字典,把整个GeoJSON文件看做自顶向下的树状结构的话,其根目录包含键值对"type":"FeaturesCollection",以及存放所有要素的键值对"features":[],所有矢量要素都存放在这个列表中,每个要素都是一个字典,下面我们来认识一下各种矢量要素在GeoJSON中的规范格式:

点要素(Point):

  对于单个点要素,其格式如下:

{"type":"Feature",
"properties":{value1,value2},
"geometry":{
"type":"Point",
"coordinates":[经度,纬度]
}
}

  其中properties对应的值为这个要素对应的属性表中按顺序存放的值,geometry对应的值中type指明了要素类型,coordinates传入一个包含两个元素的列表,第一个元素代表经度,第二个元素代表纬度。

多点要素(MultiPoint):

  多点要素是点要素的特殊情况,其geometry下的type属性传入"MultiPoint",其coordinates属性传入的是一个二维列表,其最内层列表定义了每个点的经纬度,如下:

{"type":"Feature",
"properties":{value1,value2},
"geometry":{
"type":"MultiPoint",
"coordinates":[[经度1,纬度1],
[经度2,纬度2]
]
}
}

线要素(LineString):

  线要素记录的是一条线上所有折点的经纬度信息,只需要按顺序连接这些折点就可以还原一条线的形态,在GeoJSON中线要素与多点要素在coordinates属性上格式相同,区别在于geometry属性需要传入"LineString",如下:

{"type":"Feature",
"properties":{value1,value2},
"geometry":{
"type":"LineString",
"coordinates":[[经度1,纬度1],
[经度2,纬度2],
[经度3,纬度3],
[经度4,,纬度4]]
}
}

多线要素(MultiLineString):

  多线要素是多个线要素的组合,因此其coordinates传入三维列表,来组合多条线,对应的geometry下type属性为"MultiLineString",如下:

{"type":"Feature",
"properties":{value1,value2},
"geometry":{
"type":"MultiLineString",
"coordinates":
[
[
[经度1,纬度1],
[经度2,纬度2],
[经度3,纬度3],
[经度4,纬度4]
],
[
[经度5,纬度5],
[经度6,纬度6]
]
]
}
}

多边形要素(Polygon):

  多边形要素记录了构成一个多边形所有边缘折点的经纬度信息,其coordinates属性传入"Polygon",其geometry下type属性格式为三维列表,其第三层列表中嵌套的所有列表记录的经纬度按顺序连接即构成了一个多边形,但需要注意的是,多边形头尾折点的经纬度需要相同,才能构成一个闭合的多边形,如下:

{"type":"Feature",
"properties":{value1,value2},
"geometry":{
"type":"Polygon",
"coordinates":[
[
[经度1,纬度1],
[经度2,纬度2],
[经度3,纬度3],
[经度4,纬度4],
[经度1,纬度1]
]
]
}
}

多多边形要素(MultiPolygon):

  多多边形的格式为四维列表,其geometry下type属性传入"MultiPloygon",由于多多边形要素中存在几种特殊情况,下面我们在geojson.io中进行对应GeoJSON数据的可视化以便于理解:

  互不重叠的两个多边形:

  下面是互不重叠的两个多边形的示例:

  对应的GeoJSON数据如下:

{
"type": "Feature",
"properties": {},
"geometry": {
"type": "MultiPolygon",
"coordinates":
[
[
[
[102.74414062499999,36.217687122250574],
[102.7001953125,35.585851593232356],
[104.8590087890625,35.496456056584165],
[104.96337890625,36.24427318493909],
[102.74414062499999,36.217687122250574]
]
],
[
[
[102.6397705078125,35.074964853989556],
[103.0352783203125,34.23905366851639],
[105.00732421875,34.24813554589752],
[105.3973388671875,35.77771427205079],
[104.556884765625,35.05698043137265],
[102.711181640625,35.16931803601131],
[102.6397705078125,35.074964853989556]
]
]
]
}
}

  可以看到在多个多边形不重叠时,直接将两个多边形要素对应的三维列表存放在最外层列表下即可。

  互有重叠的两个多边形:

  互有重叠的多个多边形要素格式同多个不重叠的多边形,效果如下:

  对应的GeoJSON数据如下:

{
"type": "Feature",
"properties": {},
"geometry": {
"type": "MultiPolygon",
"coordinates": [
[
[
[101.6455078125,27.68352808378776],
[114.78515624999999,27.68352808378776],
[114.78515624999999, 35.209721645221386],
[101.6455078125,35.209721645221386],
[101.6455078125,27.68352808378776]
]
],
[
[
[104.2822265625,30.107117887092357],
[108.896484375,30.107117887092357],
[108.896484375,33.76088200086917],
[104.2822265625,33.76088200086917],
[104.2822265625,30.107117887092357]
]
]
]
}
}

  有孔的多边形:

  有孔的多边形在类别上也是归类到MultiPolygon,下面是一个示例:

  对应的GeoJSON数据如下,可以看出其与多个重叠的多边形的区别在于多边形矢量信息嵌套在第二层列表中:

{
"type": "Feature",
"properties": {},
"geometry": {
"type": "MultiPolygon",
"coordinates":
[
[
[
[101.6455078125,27.68352808378776],
[114.78515624999999,27.68352808378776],
[114.78515624999999,35.209721645221386],
[101.6455078125,35.209721645221386],
[101.6455078125,27.68352808378776]
],
[
[104.2822265625,30.107117887092357],
[108.896484375,30.107117887092357],
[108.896484375,33.76088200086917],
[104.2822265625,33.76088200086917],
[104.2822265625,30.107117887092357]
]
]
]
}
}

 


2.2 将Shp格式转换为GeoJSON

  在2.1中我们较为详细的了解到矢量数据在GeoJSON数据中具体的表现形式,通过下面的自编函数,以Shp文件名称(去除文件拓展名)、Shp文件编码、GeoJSON文件编码为输入参数:

def Shp2JSON(filename,shp_encoding='utf-8',json_encoding='utf-8'):
'''
这个函数用于将shp文件转换为GeoJSON文件
:param filename: shp文件对应的文件名(去除文件拓展名)
:return:
''' '''创建shp IO连接'''
reader = shapefile.Reader(filename,encoding=shp_encoding) '''提取所有field部分内容'''
fields = reader.fields[1:] '''提取所有field的名称'''
field_names = [field[0] for field in fields] '''初始化要素列表'''
buffer = [] for sr in tqdm(reader.shapeRecords()):
'''提取每一个矢量对象对应的属性值'''
record = sr.record '''属性转换为列表'''
record = [r.decode('gb2312','ignore') if isinstance(r, bytes)
else r for r in record] '''对齐属性与对应数值的键值对'''
atr = dict(zip(field_names, record)) '''获取当前矢量对象的类型及矢量信息'''
geom = sr.shape.__geo_interface__ '''向要素列表追加新对象'''
buffer.append(dict(type="Feature",
geometry=geom,
properties=atr)) '''写出GeoJSON文件'''
geojson = codecs.open(filename + "-geo.json","w", encoding=json_encoding)
geojson.write(json.dumps({"type":"FeatureCollection",
"features":buffer}) + '\n')
geojson.close()
print('转换成功!')

  下面我们通过一个示例来展示实际转换效果,使用到的Shp数据为中国省份数据,在arcgis中效果如下:

import shapefile
import json
import codecs def Shp2JSON(filename,shp_encoding='utf-8',json_encoding='utf-8'):
'''
这个函数用于将shp文件转换为GeoJSON文件
:param filename: shp文件对应的文件名(去除文件拓展名)
:return:
''' '''创建shp IO连接'''
reader = shapefile.Reader(filename,encoding=shp_encoding) '''提取所有field部分内容'''
fields = reader.fields[1:] '''提取所有field的名称'''
field_names = [field[0] for field in fields] '''初始化要素列表'''
buffer = [] for sr in tqdm(reader.shapeRecords()):
'''提取每一个矢量对象对应的属性值'''
record = sr.record '''属性转换为列表'''
record = [r.decode('gb2312','ignore') if isinstance(r, bytes)
else r for r in record] '''对齐属性与对应数值的键值对'''
atr = dict(zip(field_names, record)) '''获取当前矢量对象的类型及矢量信息'''
geom = sr.shape.__geo_interface__ '''向要素列表追加新对象'''
buffer.append(dict(type="Feature",
geometry=geom,
properties=atr)) '''写出GeoJSON文件'''
geojson = codecs.open(filename + "-geo.json","w", encoding=json_encoding)
geojson.write(json.dumps({"type":"FeatureCollection",
"features":buffer}) + '\n')
geojson.close()
print('转换成功!') if __name__ == '__main__':
import os
os.chdir(r'C:\Users\hp\Desktop\飞线图素材')
Shp2JSON(filename='bou2_4p.shp',
shp_encoding='gbk',
json_encoding='utf-8')

  运行之后同一目录下出现对应的json文件:

  导入到Kepler.gl中进行可视化:

from keplergl import KeplerGl
import json with open('bou2_4p.shp-geo.json') as b:
data = json.load(b) map1 = KeplerGl(height=700,data={'layer1':data});map1

  

  以上就是本文的全部内容,如有笔误望指出!

(数据科学学习手札65)利用Python实现Shp格式向GeoJSON的转换的更多相关文章

  1. (数据科学学习手札90)Python+Kepler.gl轻松制作时间轮播图

    本文示例代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 Kepler.gl作为一款强大的开源地理信 ...

  2. (数据科学学习手札32)Python中re模块的详细介绍

    一.简介 关于正则表达式,我在前一篇(数据科学学习手札31)中已经做了详细介绍,本篇将对Python中自带模块re的常用功能进行总结: re作为Python中专为正则表达式相关功能做出支持的模块,提供 ...

  3. (数据科学学习手札06)Python在数据框操作上的总结(初级篇)

    数据框(Dataframe)作为一种十分标准的数据结构,是数据分析中最常用的数据结构,在Python和R中各有对数据框的不同定义和操作. Python 本文涉及Python数据框,为了更好的视觉效果, ...

  4. (数据科学学习手札85)Python+Kepler.gl轻松制作酷炫路径动画

    本文示例代码.数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 Kepler.gl相信很多人都听说过,作为 ...

  5. (数据科学学习手札102)Python+Dash快速web应用开发——基础概念篇

    本文示例代码与数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 这是我的新系列教程Python+Dash快 ...

  6. (数据科学学习手札108)Python+Dash快速web应用开发——静态部件篇(上)

    本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 这是我的系列教程Python+Dash快速web ...

  7. (数据科学学习手札109)Python+Dash快速web应用开发——静态部件篇(中)

    本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 这是我的系列教程Python+Dash快速web ...

  8. (数据科学学习手札115)Python+Dash快速web应用开发——交互表格篇(上)

    本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 这是我的系列教程Python+Dash快速web ...

  9. (数据科学学习手札116)Python+Dash快速web应用开发——交互表格篇(中)

    本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 这是我的系列教程Python+Dash快速web ...

随机推荐

  1. 开源库(要不要重新制造轮子)—— C/C++、Java、Python

    谷歌近期开源的SLAM方案:Cartographer Boost:准标准的C++库. Eigen3: 准标准的线性代数库. Lua:非常轻量的脚本语言,主要用来做Configuration Ceres ...

  2. python短信轰炸机版本smsbomb----------部分(post)

    用一些用手机号注冊且须要发送验证码的站点的漏洞.能够向不论什么人的手机号发送短信,当然短信内容,我们无法控制.所以主要工作还是寻找这种站点.然后利用Fiddler或者HttpWatch分析请求.使用p ...

  3. 在 Swift 中实现单例方法

    我们通常在进行开发的时候,会用到一个叫做 单例模式 的东西.相信大家也都对这种模式非常熟悉了.而且单例的使用在平时的开发中也非常频繁. 比如我们常用到的 NSUserDefaults.standard ...

  4. dumpbin判断windows程序是32还是64位(包括DLL)

    http://blog.csdn.net/csfreebird/article/details/10105681 dumpbin /HEADERS gdal18.dll(or xxx.exe) 如果安 ...

  5. 基于 CSP 的设计思想和 OOP 设计思想的异同

    LinkerLin Go语言推崇的CSP编程模型和设计思想,并没有引起很多Go开发者包括Go标准库作者的重视.标准库的很多设计保留了很浓的OOP的味道.本篇Blog想比较下从设计的角度看,CSP和OO ...

  6. Lexer的设计--中(4)

    设计一个小型的内存池以及链表 上一节撸到万事俱备只欠真正的lex, 但是lex的作用是将源代码转化为Token流, 用什么保存Token? 这就涉及到我们要接触的第一个数据结构-链表, 虽然标准库中很 ...

  7. Android各版本对应的SDK和JDK版本

    原文:Android各版本对应的SDK和JDK版本 一.Android各版本对应的SDK版本: 平台版本 SDK版本 版本名称 Android 8.0 26 Oreo Android 7.1 25 N ...

  8. SQL Server 阻止组件 xp_cmdshell

    错误信息描述 消息 15281,级别 16,状态 1,过程 xp_cmdshell,第 1 行SQL Server 阻止了对组件 'xp_cmdshell' 的 过程 'sys.xp_cmdshell ...

  9. WPF事件(一)内置路由事件

    原文:WPF事件(一)内置路由事件 Windows是消息驱动的操作系统,运行其上的程序也遵照这个机制运行,随着面向对象开发平台日趋成熟,微软把消息机制封装成了更容易让人理解的事件模型,一个事件包含3个 ...

  10. 图像滤镜艺术---(Punch Filter)交叉冲印滤镜

    原文:图像滤镜艺术---(Punch Filter)交叉冲印滤镜 (Punch Filter)交叉冲印滤镜 本文介绍一种交叉冲印效果的代码实现,至于原理,不在累赘,直接看代码:  int f_TPun ...