geotrellis使用(三十八)COG 写入和读取
前言
上一篇中简单介绍了 COG 的概念和 Geotrellis 中引入 COG 的原因及简单的原理,本文为大家介绍如何在 Geotrellis 中使用 COG 来写入和读取 GeoTIFF数据。
一、写入数据——ETL
1.1 实现方案
其实这与之前的普通 ETL 操作在概念上是相似的,都是将原始数据转换成系统能用的数据的过程,这是宽泛的 ETL 的定义。在 Geotrellis 中实现很简单,与之前代码基本一致,只要切换一下 writer 类型以及最后建立金字塔额时候略有不同。实现方案如下:
val inputPath = "file://" + new File("in.tif").getAbsolutePath
val outputPath = "/your/catalog/path"
def main(args: Array[String]): Unit = {
// Setup Spark to use Kryo serializer.
val conf =
new SparkConf()
.setMaster("local[*]")
.setAppName("Spark Tiler")
.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
.set("spark.kryo.registrator", "geotrellis.spark.io.kryo.KryoRegistrator")
val sc = new SparkContext(conf)
try {
run(sc)
} finally {
sc.stop()
}
}
def run(implicit sc: SparkContext) = {
val inputRdd: RDD[(ProjectedExtent, MultibandTile)] =
sc.hadoopMultibandGeoTiffRDD(inputPath)
val (_, rasterMetaData) =
TileLayerMetadata.fromRdd(inputRdd, FloatingLayoutScheme(256))
val tiled: RDD[(SpatialKey, MultibandTile)] =
inputRdd
.tileToLayout(rasterMetaData.cellType, rasterMetaData.layout, Bilinear)
.repartition(100)
val layoutScheme = ZoomedLayoutScheme(WebMercator, tileSize = 256)
val (zoom, reprojected): (Int, RDD[(SpatialKey, MultibandTile)] with Metadata[TileLayerMetadata[SpatialKey]]) =
MultibandTileLayerRDD(tiled, rasterMetaData)
.reproject(WebMercator, layoutScheme, Bilinear)
val attributeStore = FileAttributeStore(outputPath)
val writer = FileCOGLayerWriter(attributeStore)
val layerName = "layername"
val cogLayer =
COGLayer.fromLayerRDD(
reprojected,
zoom,
compression = NoCompression,
maxTileSize = 4096
)
val keyIndexes =
cogLayer.metadata.zoomRangeInfos.
map { case (zr, bounds) => zr -> ZCurveKeyIndexMethod.createIndex(bounds) }.
toMap
writer.writeCOGLayer(layerName, cogLayer, keyIndexes)
}
执行 main 函数即可实现 COG 方式的 ETL 操作,其他部分与之前介绍过的 ingest 相同,主要区别在于 writer,此处为 FileCOGLayerWriter 实例,从名字可以看出这是一个文件系统的 COG writer,目前 Geotrellis 实现了三种,分别为 S3、Hadoop、File,这三种后端理论上都是对大量小文件支持不好的。
1.2 背后逻辑
下面来详细分析一下 Geotrellis 中 COG 实现原理。
首先看上面的 cogLayer 对象:
val cogLayer =
COGLayer.fromLayerRDD(
reprojected,
zoom,
compression = NoCompression,
maxTileSize = 4096
)
cogLayer 对象是 COGLayer 实例,fromLayerRDD 源码如下:
def fromLayerRDD[
K: SpatialComponent: Ordering: JsonFormat: ClassTag,
V <: CellGrid: ClassTag: ? => TileMergeMethods[V]: ? => TilePrototypeMethods[V]: ? => TileCropMethods[V]: GeoTiffBuilder
](
rdd: RDD[(K, V)] with Metadata[TileLayerMetadata[K]],
baseZoom: Int,
compression: Compression = Deflate,
maxTileSize: Int = 4096,
minZoom: Option[Int] = None
): COGLayer[K, V] = {
if(minZoom.getOrElse(Double.NaN) != baseZoom.toDouble) {
if(rdd.metadata.layout.tileCols != rdd.metadata.layout.tileRows) {
sys.error("Cannot create Pyramided COG layer for non-square tiles.")
}
if(!isPowerOfTwo(rdd.metadata.layout.tileCols)) {
sys.error("Cannot create Pyramided COG layer for tile sizes that are not power-of-two.")
}
}
val layoutScheme =
ZoomedLayoutScheme(rdd.metadata.crs, rdd.metadata.layout.tileCols)
if(rdd.metadata.layout != layoutScheme.levelForZoom(baseZoom).layout) {
sys.error(s"Tile Layout of layer and ZoomedLayoutScheme do not match. ${rdd.metadata.layout} != ${layoutScheme.levelForZoom(baseZoom).layout}")
}
val keyBounds =
rdd.metadata.bounds match {
case kb: KeyBounds[K] => kb
case _ => sys.error(s"Cannot create COGLayer with empty Bounds")
}
val cogLayerMetadata: COGLayerMetadata[K] =
COGLayerMetadata(
rdd.metadata.cellType,
rdd.metadata.extent,
rdd.metadata.crs,
keyBounds,
layoutScheme,
baseZoom,
minZoom.getOrElse(0),
maxTileSize
)
val layers: Map[ZoomRange, RDD[(K, GeoTiff[V])]] =
cogLayerMetadata.zoomRanges.
sorted(Ordering[ZoomRange].reverse).
foldLeft(List[(ZoomRange, RDD[(K, GeoTiff[V])])]()) { case (acc, range) =>
if(acc.isEmpty) {
List(range -> generateGeoTiffRDD(rdd, range, layoutScheme, cogLayerMetadata.cellType, compression))
} else {
val previousLayer: RDD[(K, V)] = acc.head._2.mapValues { tiff =>
if(tiff.overviews.nonEmpty) tiff.overviews.last.tile
else tiff.tile
}
val tmd: TileLayerMetadata[K] = cogLayerMetadata.tileLayerMetadata(range.maxZoom + 1)
val upsampledPreviousLayer =
Pyramid.up(ContextRDD(previousLayer, tmd), layoutScheme, range.maxZoom + 1)._2
val rzz = generateGeoTiffRDD(upsampledPreviousLayer, range, layoutScheme, cogLayerMetadata.cellType, compression)
(range -> rzz) :: acc
}
}.
toMap
COGLayer(layers, cogLayerMetadata)
}
此函数返回类型正是 COGLayer,其两个属性分别为 layers 和 cogLayerMetadata。
cogLayerMetadata 是 COGLayerMetadata 对象,表示 COG 层的元数据信息,包含每层对应的瓦片范围等,这个与传统的元数据很接近,唯一不同的在于此处使用了 ZommRange 的概念,即“ 1 层”可能对应多个 Zoom,而不再是 1 对 1 的关系,这样能够更进一步的节省存储空间,在处理速度和存储空间上做了综合考虑。
layers 是 Map[ZoomRange, RDD[(K, GeoTiff[V])]] 对象,ZoomRange 即为上述元数据中的每层的 zoom 最大和最小值,RDD[(K, GeoTiff[V])] 是 spark rdd 对象,即每一个层级范围对应一个 Tiff 对象,从此可以看出,COG 方式 ETL 后每层存储的不再是 Tile,而是 Tiff 文件,这个 Tiff 文件是 COG 类型的,当用户请求某个瓦片的时候直接从对应的 Tiff 文件中读出需要的部分即可。
最后调用 writer.writeCOGLayer(layerName, cogLayer, keyIndexes) 即可将元数据信息和 Tiff 数据写入相应的位置,完成 ETL 过程。
此处还需要注意的是为了防止单个 Tiff 文件过大, Geotrellis 对每一层进行了分割处理,这样每一层可能会得到多个 Tiff 文件,而为了达到 COG 的真实效果,又引入了 GDAL 中 VRT 的概念(参见http://www.gdal.org/gdal_vrttut.html),其中很详细的讲述了 VRT 的格式和意义,简单来说 VRT 就是将多个 Tiff 文件合并成一个虚拟的 Tiff 文件。
二、读取数据
数据做了 ETL 后,就可以读取出来并进行相应的处理。
2.1 实现方案
其实现方式也基本与传统方式相同,代码如下:
val catalogPath = new java.io.File("/your/catalog/path").getAbsolutePath
val fileValueReader = FileCOGValueReader(catalogPath)
val key = SpatialKey(x, y)
val tile = fileValueReader.reader(LayerId("layername", z)).read(key)
这样就能根据瓦片的 x、y 编号和 z(zoom)取到对应的瓦片。
2.2 原理
主要代码在 COGValueReader 类中的 baseReader 方法中 read 方法,如下:
GeoTiffReader[V].read(uri, decompress = false, streaming = true)
.getOverview(overviewIndex)
.crop(gridBounds)
.tile
传统方式存储的是切割好的瓦片,可以直接定位到确定的瓦片,这里是完全符合 COG 方式的读取方式。getOverview 获取到对应层(z)的 Tiff 文件,crop 对 Tiff 根据需要的范围(x、y)进行切割,tile 函数将其转为瓦片。
三、总结
本文介绍了如何在 Geotrellis 中如何进行 COG 方式的 ETL 操作,实现了全新的数据写入和读取方式。
Geotrellis系列文章链接地址http://www.cnblogs.com/shoufengwei/p/5619419.html
geotrellis使用(三十八)COG 写入和读取的更多相关文章
- 《手把手教你》系列技巧篇(三十八)-java+ selenium自动化测试-日历时间控件-下篇(详解教程)
1.简介 理想很丰满现实很骨感,在应用selenium实现web自动化时,经常会遇到处理日期控件点击问题,手工很简单,可以一个个点击日期控件选择需要的日期,但自动化执行过程中,完全复制手工这样的操作就 ...
- NeHe OpenGL教程 第三十八课:资源文件
转自[翻译]NeHe OpenGL 教程 前言 声明,此 NeHe OpenGL教程系列文章由51博客yarin翻译(2010-08-19),本博客为转载并稍加整理与修改.对NeHe的OpenGL管线 ...
- Java进阶(三十八)快速排序
Java进阶(三十八)快速排序 前言 有没有既不浪费空间又可以快一点的排序算法呢?那就是"快速排序"啦!光听这个名字是不是就觉得很高端呢. 假设我们现在对"6 1 2 7 ...
- SQL注入之Sqli-labs系列第三十八关、第三十九关,第四十关(堆叠注入)
0x1 堆叠注入讲解 (1)前言 国内有的称为堆查询注入,也有称之为堆叠注入.个人认为称之为堆叠注入更为准确.堆叠注入为攻击者提供了很多的攻击手段,通过添加一个新 的查询或者终止查询,可以达到修改数据 ...
- 微信小程序把玩(三十八)获取设备信息 API
原文:微信小程序把玩(三十八)获取设备信息 API 获取设备信息这里分为四种, 主要属性: 网络信息wx.getNetWorkType, 系统信息wx.getSystemInfo, 重力感应数据wx. ...
- bp(net core)+easyui+efcore实现仓储管理系统——入库管理之二(三十八)
abp(net core)+easyui+efcore实现仓储管理系统目录 abp(net core)+easyui+efcore实现仓储管理系统——ABP总体介绍(一) abp(net core)+ ...
- Deep learning:三十八(Stacked CNN简单介绍)
http://www.cnblogs.com/tornadomeet/archive/2013/05/05/3061457.html 前言: 本节主要是来简单介绍下stacked CNN(深度卷积网络 ...
- Java并发编程原理与实战三十八:多线程调度器(ScheduledThreadPoolExecutor)
在前面介绍了java的多线程的基本原理信息:线程池的原理与使用 本文对这个java本身的线程池的调度器做一个简单扩展,如果还没读过上一篇文章,建议读一下,因为这是调度器的核心组件部分. 我们如果要用j ...
- 【FastDev4Android框架开发】打造QQ6.X最新版本号側滑界面效果(三十八)
转载请标明出处: http://blog.csdn.net/developer_jiangqq/article/details/50253925 本文出自:[江清清的博客] (一).前言: [好消息] ...
随机推荐
- 数据系统的未来------《Designing Data-Intensive Applications》读书笔记17
终于来到这本书最后的一章了<Designing Data-Intensive Applications>大部头,这本书应该是我近两年读过最棒的技术书籍.作者Martin Kleppmann ...
- Orcle查询优化改写-----单表查询
1.将空值转化为实际值 coalesce 返回第一个不是null的参数 2.查询满足多个条件的行 需要注意,对于多个条件组合,要使用括号,这样在更改维护语句时可以不吸烟再考虑优先级问题,而且可以很容 ...
- android中include标签使用详解
android中include标签是为了便于控件的覆用的一个很好解决方案. 但是也有一些需要注意的地方,下面是本人在项目中碰到过的一个问题,做此记录,便于以后查看. include标签用法. ...
- [活动] 【奖品撩人】部落守卫者集结令·这一回同程SRC的安全由“我”守卫!
i春秋SRC部落联合同程SRC发布首届部落守卫者漏洞提交任务(代号G001)! 你准备好了吗! [部落守卫者集结令]拿巨额奖金?上白帽子排行榜?近距离膜拜大佬?学技术?掌握窍门?又或者你是个责任感爆棚 ...
- (译文)学习ES6非常棒的特性-深入研究var, let and const
Var var firstVar; //firstVar被声明,它的默认值是undefined var secondVar = 2; //secondVar被声明,被赋值2 先看一个例子: var i ...
- JavaEE GenericServlet 解析
从 上一篇 文章中可以看到,直接实现 Servlet 接口需要实现其所有方法,而这通常不是好的做法.相反,一种相对较好的做法是给出一个实现类来默认实现其所有方法或者部分方法,并开放给子类.而子类再在此 ...
- 测试工作中经常用到的几个Linux命令(第一弹)
自己平时测试工作中经常要在Linux下搭建测试环境,有涉及到启动/终止服务器,修改tomcat配置文件,偶尔碰到端口被占用... 这时就不得不需要一些基本的Linux命令来处理遇到的这些问题(顺便迈向 ...
- %f使用时的注意事项
1不是所有定义都用int,使用浮点函数需要把int改成float才能正常工作 2保留一位小数时要打入%0.1f,保留两位小数时要打入%0.2f,而不是%0.01f
- alpha冲刺第八天
一.合照 二.项目燃尽图 三.项目进展 首页文章显示部分 首页小功能福大地图完成 四.明日规划 发现爬取的数据是一整个网页的内容,而我们需要的仅仅是教务处通知的文章,在筛选方面还需要改进,查找如何进行 ...
- 201621123050 《Java程序设计》第5周学习总结
1. 本周学习总结 1.1 写出你认为本周学习中比较重要的知识点关键词 答:接口.has-a.comparable 1.2 尝试使用思维导图将这些关键词组织起来.注:思维导图一般不需要出现过多的字. ...