前言

前面介绍过了如何在 ETL 的时候更新 Layer,使得能够在大数据量的时候完成 ETL 操作,同时前两篇文章也介绍了 COG 以及如何在 Geotrellis 中实现 COG 的读取。本文介绍如何在进行 COG 方式 ETL 的时候实现 Layer 的更新。

一、实现

1.1 原理分析

其实实现 COG 方式的 Layer 更新就是把上述两种方式结合起来,唯一的区别在于普通的 ETL 操作更新的时候需要合并的是同一个 Layer 下编号相同的瓦片,而 COG 方式的 ETL 更新的时候需要合并的是同一个 Layer 下编号相同的 GeoTiff 文件,明白了这一点实现起来就很容易了。

1.2 实现方案

上一篇文章中讲了如何实现 COG 的数据写入,执行写入操作的是最后一行代码:

writer.writeCOGLayer(layerName, cogLayer, keyIndexes)

其中 writer 是 FileCOGLayerWriter 实例或者其他 COGLayerWriter 实例,layerName 表示写入的层,cogLayer 为需要写入的数据。

所以理论上实现方式为首先判断此 Layer 是否存在,如果存在则更新之,否则执行上述 writeCOGLayer 方法。

其实 writeCOGLayer 方法已经帮我们实现了这一步,只需要传入一个 GeoTiff 的 merge 方法即可。merge 的类型为 (GeoTiff[V], GeoTiff[V]) => GeoTiff[V],V 为 Tile 或者 MultibandTile 类型,其实就是如何将两个 GeoTiff 合并成一个 GeoTiff。

这就很简单了,只需要写一个此方法即可,如下:

def merge(v1: GeoTiff[V], v2: GeoTiff[V]) = {
val tile: V = v2.tile merge v1.tile
val extent = v2.extent combine v1.extent
val crs = v2.crs
GeoTiffBuilder[V].makeGeoTiff(
tile, extent, crs, Tags(Map(), Nil), GeoTiffOptions.DEFAULT
)
}

只需要将此方法传入即可,在 writeCOGLayer 方法中的下述方法会自动完成 update 操作:

case Some(merge) if uriExists(path) =>
val old = GeoTiffReader[V].read(path, decompress = false, streaming = true)
val merged = merge(cog, old)
merged.write(path, true)
// collect VRT metadata
(0 until merged.bandCount)
.map { b =>
val idx = Index.encode(keyIndex.toIndex(key), maxWidth)
(idx.toLong, vrt.simpleSource(s"$idx.$Extension", b + 1, merged.cols, merged.rows, merged.extent))
}
.foreach(samplesAccumulator.add)

这也正与我们的分析一样,此方法将两个 tiff 合并成一个写入。

1.3 效果

编译执行两次数据 COG 方式导入,可以看到两个数据完美的拼接在一起,继续放大,然而居然出问题了,中间有些 zoom 下的结合处瓦片不翼而飞了,这是什么原因?为什么仅仅是有些 zoom 下的丢失了?

其实静下心来分析就不难知道,存在的问题一定在我们自己写的 merge 方法中,并且是合并后的 Tiff 文件未实现 COG 造成的,因为没有实现 COG 导致有些 zoom 下无法读取,所以取不到数据。

1.4 优化

明白了这一点优化起来就很容易了,只需要看一下 Geotrellis 是如何生成 COG 方式的 Tiff 的,我们也按照此方式生成合并后的 Tiff 即可。

private def generateGeoTiffRDD[
K: SpatialComponent: Ordering: JsonFormat: ClassTag,
V <: CellGrid: ClassTag: ? => TileMergeMethods[V]: ? => TilePrototypeMethods[V]: ? => TileCropMethods[V]: GeoTiffBuilder
](
rdd: RDD[(K, V)],
zoomRange: ZoomRange ,
layoutScheme: ZoomedLayoutScheme,
cellType: CellType,
compression: Compression
): RDD[(K, GeoTiff[V])] = {
val kwFomat = KryoWrapper(implicitly[JsonFormat[K]])
val crs = layoutScheme.crs val minZoomLayout = layoutScheme.levelForZoom(zoomRange.minZoom).layout
val maxZoomLayout = layoutScheme.levelForZoom(zoomRange.maxZoom).layout val options: GeoTiffOptions =
GeoTiffOptions(
storageMethod = Tiled(maxZoomLayout.tileCols, maxZoomLayout.tileRows),
compression = compression
) rdd.
mapPartitions { partition =>
partition.map { case (key, tile) =>
val extent: Extent = key.getComponent[SpatialKey].extent(maxZoomLayout)
val minZoomSpatialKey = minZoomLayout.mapTransform(extent.center) (key.setComponent(minZoomSpatialKey), (key, tile))
}
}.
groupByKey(new HashPartitioner(rdd.partitions.length)).
mapPartitions { partition =>
val keyFormat = kwFomat.value
partition.map { case (key, tiles) =>
val cogExtent = key.getComponent[SpatialKey].extent(minZoomLayout)
val centerToCenter: Extent = {
val h = maxZoomLayout.cellheight / 2
val w = maxZoomLayout.cellwidth / 2
Extent(
xmin = cogExtent.xmin + w,
ymin = cogExtent.ymin + h,
xmax = cogExtent.xmax - w,
ymax = cogExtent.ymax - h)
}
val cogTileBounds: GridBounds = maxZoomLayout.mapTransform.extentToBounds(centerToCenter)
val cogLayout: TileLayout = maxZoomLayout.layoutForBounds(cogTileBounds).tileLayout val segments = tiles.map { case (key, value) =>
val SpatialKey(col, row) = key.getComponent[SpatialKey]
(SpatialKey(col - cogTileBounds.colMin, row - cogTileBounds.rowMin), value)
} val cogTile = GeoTiffBuilder[V].makeTile(
segments.iterator,
cogLayout,
cellType,
Tiled(cogLayout.tileCols, cogLayout.tileRows),
compression) val cogTiff = GeoTiffBuilder[V].makeGeoTiff(
cogTile, cogExtent, crs,
Tags(Map("GT_KEY" -> keyFormat.write(key).prettyPrint), Nil),
options
).withOverviews(NearestNeighbor) (key, cogTiff)
}
}
}

这是 Geotrellis 中的 COG Tiff 生成代码,重点在于最下面的 GeoTiffBuilder[V].makeGeoTiff 方法,可以看到与我们上面的方式稍微有些不同,只需要按照其修改即可。如下:

def merge(v1: GeoTiff[V], v2: GeoTiff[V]) = {
val tile: V = v2.tile merge v1.tile
val extent = v2.extent combine v1.extent
val crs = v2.crs
GeoTiffBuilder[V].makeGeoTiff(
tile, extent, crs, v2.tags, v2.options), GeoTiffOptions.DEFAULT
).withOverviews(NearestNeighbor)
}

主要变化在于 Tiff 的 tag 使用已有 Tiff 的 tag,这样会添加 GT_KEY 标签,添加了已有 Tiff 的options,并添加了 withOverviews 方法,这样就能满足 COG 的要求,生成符合 COG 格式的 Geotrellis 下的 Tiff 文件。

三、总结

本文介绍了如何实现 COG 模式下 ETL 的 Layer 更新操作,只要想明白原理,其实代码本就不复杂,这也是我对待码农工作的个人感悟:重要的在于编程思维、解决问题能力的培养,而不是具体的代码。

Geotrellis系列文章链接地址http://www.cnblogs.com/shoufengwei/p/5619419.html

我的博客即将搬运同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=3tczwqg3smw44

geotrellis使用(三十九)COG 写入更新的更多相关文章

  1. Gradle 1.12用户指南翻译——第三十九章. IDEA 插件

    本文由CSDN博客万一博主翻译,其他章节的翻译请参见: http://blog.csdn.net/column/details/gradle-translation.html 翻译项目请关注Githu ...

  2. NeHe OpenGL教程 第三十九课:物理模拟

    转自[翻译]NeHe OpenGL 教程 前言 声明,此 NeHe OpenGL教程系列文章由51博客yarin翻译(2010-08-19),本博客为转载并稍加整理与修改.对NeHe的OpenGL管线 ...

  3. WPF,Silverlight与XAML读书笔记第三十九 - 可视化效果之3D图形

    原文:WPF,Silverlight与XAML读书笔记第三十九 - 可视化效果之3D图形 说明:本系列基本上是<WPF揭秘>的读书笔记.在结构安排与文章内容上参照<WPF揭秘> ...

  4. 《手把手教你》系列技巧篇(三十九)-java+ selenium自动化测试-JavaScript的调用执行-上篇(详解教程)

    1.简介 在做web自动化时,有些情况selenium的api无法完成,需要通过第三方手段比如js来完成实现,比如去改变某些元素对象的属性或者进行一些特殊的操作,本文将来讲解怎样来调用JavaScri ...

  5. Java进阶(三十九)Java集合类的排序,查找,替换操作

    Java进阶(三十九)Java集合类的排序,查找,替换操作 前言 在Java方向校招过程中,经常会遇到将输入转换为数组的情况,而我们通常使用ArrayList来表示动态数组.获取到ArrayList对 ...

  6. SQL注入之Sqli-labs系列第三十八关、第三十九关,第四十关(堆叠注入)

    0x1 堆叠注入讲解 (1)前言 国内有的称为堆查询注入,也有称之为堆叠注入.个人认为称之为堆叠注入更为准确.堆叠注入为攻击者提供了很多的攻击手段,通过添加一个新 的查询或者终止查询,可以达到修改数据 ...

  7. 第三百三十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式

    第三百三十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式 我们自定义一个main.py来作为启动文件 main.py #!/usr/bin/en ...

  8. centos shell编程5 LANMP一键安装脚本 lamp sed lnmp 变量和字符串比较不能用-eq cat > /usr/local/apache2/htdocs/index.php <<EOF重定向 shell的变量和函数命名不能有横杠 平台可以用arch命令,获取是i686还是x86_64 curl 下载 第三十九节课

    centos shell编程5  LANMP一键安装脚本 lamp  sed  lnmp  变量和字符串比较不能用-eq  cat > /usr/local/apache2/htdocs/ind ...

  9. “全栈2019”Java第三十九章:构造函数、构造方法、构造器

    难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...

  10. 微信小程序把玩(三十九)navigation API

    原文:微信小程序把玩(三十九)navigation API 演示效果也看到了小程序也就提供这几个处理导航控制.值得注意的是只能同时导航五个页面 主要属性: 导航条一些方法 wx.setNavigati ...

随机推荐

  1. linux小白成长之路2————yum安装火狐浏览器

    1.使用终端: CentOS左上角:应用程序>收藏>终端  2.使用root权限安装软件: 输入:sudo -i 输入密码(上篇安装linux虚拟机时设定的登录密码,也是超级管理员密码) ...

  2. springMVC框架+POI组件导出Excel

    目的:访问url(http://localhost:8080/POIOutputExcel/outputexcel.do)实现excel导出,效果图如下: 文件目录(配置文件就不多说了,跟前面的随笔一 ...

  3. 2017年PHP程序员未来路在何方——韩天峰

    PHP 从诞生到现在已经有20多年历史,从Web时代兴起到移动互联网退潮,互联网领域各种编程语言和技术层出不穷, Node.js . GO . Python 不断地在挑战 PHP 的地位.这些技术的推 ...

  4. Windows下Apache的下载安装启动停止

    一:下载 打开任意浏览器,输入网址:http://httpd.apache.org/ 进入如下界面: 我们选择最新版Apache httpd 2.4.12Released,点击Download,进入如 ...

  5. beta冲刺5-咸鱼

    昨天的问题: 登陆页面的整合重新制作 各主机版本更迭 我的社团显示功能修改调整 主页的头部替换掉 +修复帖子无法显示内容的问题 +试着将邮箱等判定用正则表达式进行实时判定. 今天的完成: 主要是线下进 ...

  6. Alpha冲刺第十二天

    Alpha冲刺第十二天 站立式会议 项目进展 项目核心功能,如学生基本信息管理模块,学生信用信息模块,奖惩事务管理模块等等都已完成,测试工作大体结束. 问题困难 项目结束后对项目的阶段性总结缺乏一定的 ...

  7. 团队作业4——第一次项目冲刺(Alpha版本)2017.11.19

    第三次会议:2017-11-16 第二次会议讨论的还没有完全实现,于是在第三次会议上对此进行了一些对我们工作上的看法,得出结论:多花时间啊!!!! 又没照照片图: 会议主要内容: 1.登录注册完善 2 ...

  8. django搭建web (四) models.py

    demo 该demo模型主要是用于问题,选择单个或多个答案的问卷形式应用 # -*- coding: utf-8 -*- from __future__ import unicode_literals ...

  9. 树莓派3启动wifi并且配置wifi

    概述 树莓派3内置了wifi和蓝牙模块,我们不用像以前的版本那样,再去购买一个外接的模块练到raspberry上. 当我们第一次启动了树莓派的时候,必然使用了网线,但是之后的每一次使用,我们当然更希望 ...

  10. 项目Beta冲刺Day4

    项目进展 李明皇 今天解决的进度 因服务器端未完成登录态维护,故无法进行前后端联动. 明天安排 前后端联动调试 林翔 今天解决的进度 因上课和实验室事务未完成登录态维护 明天安排 完成登录态维护 孙敏 ...