geotrellis使用（五）使用scala操作Accumulo

要想搞明白Geotrellis的数据处理情况，首先要弄清楚数据的存放，Geotrellis将数据存放在Accumulo中。

Accumulo是一个分布式的Key Value型NOSQL数据库，官网为（https://accumulo.apache.org/），在使用Ambari安装hadoop集群一文中已经介绍了如何安装Hadoop集群以及Accumulo。

Accumulo以表来分区存放数据，结构为Key Value，其中Key又包含RowID和Column，Column又包含Family、Qualifier、Visibility。

闲话莫谈，首先介绍一下如何在accumulo shell中操作Accumulo。

1、进入accumulo shell控制台

accumulo shell -u [username]

username就是具有操作accumulo的用户

2、查看所有表

tables

3、创建表

createtable mytable

4、删除表

deletetable mytable

5、扫描表，查看数据

scan

6、插入数据插入数据的时候要在当前表的工作域中

insert row1 colf colq value1

只要rowID family qualifier有一个不重复即可，如果重复会覆盖掉原来的value。

7、切换表

table mytable

下面介绍一下如何使用Scala语言操作Accumulo，也比较简单，先贴出全部代码

 object Main {

   val token = new PasswordToken("pass")

   val user = "root"

   val instanceName = "hdp-accumulo-instance"

   val zooServers = "zooserver"

   val table = "table"

   def main(args: Array[String]) {

 //    write

     read

   }

   def read = {

     val conn = getConn

     val auths = Authorizations.EMPTY// new Authorizations("Valid")

     val scanner = conn.createScanner(table, auths)

     val range = new org.apache.accumulo.core.data.Range("row1", "row2") // start row --- end row  即row ID

     scanner.setRange(range)

 //    scanner.fetchColumnFamily()

     //    println(scanner.iterator().next().getKey)

     val iter = scanner.iterator()

     while (iter.hasNext){

       var item = iter.next()

       //Accumulo中数据存放在table中，分为Key Value，其中Key又包含RowID和Column，Column包含Family Qualifier Visibility

       println(s"key  row:${item.getKey.getRow} fam:${item.getKey.getColumnFamily} qua:${item.getKey.getColumnQualifier} value:${item.getValue}")

     }

 //    for(entry <- scanner) {

 //      println(entry.getKey + " is " + entry.getValue)

 //    }

   }

   def write {

     val mutation = createMutation

     val writer = getWriter

     writer.addMutation(mutation)

 //    writer.flush()

     writer.close

   }

   def createMutation = {

     val rowID = new Text("row2")

     val colFam = new Text("myColFam")

     val colQual = new Text("myColQual")

     //  val colVis = new ColumnVisibility("public")  //不需要加入可见性

     var timstamp = System.currentTimeMillis

     val value = new Value("myValue".getBytes)

     val mutation = new Mutation(rowID)

     mutation.put(colFam, colQual, timstamp, value)

     mutation

   }

   def getConn = {

     val inst = new ZooKeeperInstance(instanceName, zooServers)

     val conn = inst.getConnector("root", token)

     conn

   }

   def getWriter() = {

     val conn = getConn

     val config = new BatchWriterConfig

     config.setMaxMemory(10000000L)

     val writer: BatchWriter = conn.createBatchWriter(table, config)

     writer

   }

 }

以上代码主要实现了Accumulo的读写操作，其中zooServers是安装的zookeeper的主节点地址。instanceName是accumulo的实例名称。read的Range实现了范围内查找，但是此处的范围需要输入的是RowID的起始值，由于Accumulo是自动排序的，所以此处输入范围会将该范围内的数据全部返回。其他代码均通俗易懂（自认为，哈哈），所以不在这里赘述。

本文简单介绍了Accumulo的操作，仅是为了方便理解Geotrellis的工作原理以及阅读Geotrellis的源代码做准备，若是有人恰好需要将数据存放到集群中，不妨可以试一下存入到Accumulo中。

参考链接

一、geotrellis使用初探
二、geotrellis使用（二）geotrellis-chatta-demo以及geotrellis框架数据读取方式初探
三、geotrellis使用（三）geotrellis数据处理过程分析四、geotrellis使用（四）geotrellis数据处理部分细节

五、geotrellis使用（五）使用scala操作Accumulo

geotrellis使用（五）使用scala操作Accumulo的更多相关文章

Gradle 1.12用户指南翻译——第二十五章. Scala 插件
其他章节的翻译请参见: http://blog.csdn.net/column/details/gradle-translation.html 翻译项目请关注Github上的地址: https://g ...
Scala操作Hbase空指针异常java.lang.NullPointerException处理
Hbase版本:Hortonworks Hbase 1.1.2 问题描述:使用Scala操作Hbase时,发生空指针异常(java.lang.RuntimeException: java.lang.N ...
{Django基础八之cookie和session}一会话跟踪二 cookie 三 django中操作cookie 四 session 五 django中操作session
Django基础八之cookie和session 本节目录一会话跟踪二 cookie 三 django中操作cookie 四 session 五 django中操作session 六 xxx 七 ...
ES6学习笔记<五> Module的操作——import、export、as
import export 这两个家伙对应的就是es6自己的 module功能. 我们之前写的Javascript一直都没有模块化的体系,无法将一个庞大的js工程拆分成一个个功能相对独立但相互依赖的小 ...
Scala操作MongoDB
Scala操作MongoDB // Maven <dependencies> <dependency> <groupId>org.mongodb</group ...
Python学习系列（五）(文件操作及其字典)
Python学习系列(五)(文件操作及其字典) Python学习系列(四)(列表及其函数) 一.文件操作 1,读文件在以'r'读模式打开文件以后可以调用read函数一次性将文件内容全部读出 ...
Scala操作外部数据
Scala操作外部数据: 1.操作文件 2.操作XML 3.操作MySQL 读取文件: object FileApp { def main(args: Array[String]): Unit = { ...
五、Python操作redis
五.Python操作redis 一.python对redis基本操作 (1)连接redis # 方式1 import redis r = redis.Redis(host='127.0.0.1', p ...
大数据笔记（二十五）——Scala函数式编程
===================== Scala函数式编程 ======================== 一.Scala中的函数 (*) 函数是Scala中的头等公民,就和数字一样,可以在变 ...

随机推荐

spring和Hibernate整合
首先导入spring和Hibernate的jar包,以及JDBC和c3p0的jar包, 然后就是Hibernate的XML配置文件,不需要加入映射文件,这里用spring容器管理了. Hibernat ...
Windows下搭建Spark+Hadoop开发环境
Windows下搭建Spark+Hadoop开发环境需要一些工具支持. 只需要确保您的电脑已装好Java环境,那么就可以开始了. 一. 准备工作 1. 下载Hadoop2.7.1版本(写Spark和H ...
Metaio在Unity3D中报错 Start: failed to load tracking configuration: TrackingConfigGenerated.xml 解决方法
报错:Start: failed to load tracking configuration: TrackingConfigGenerated.xml Start: failed to load t ...
maven内部运行原理解析
maven至今还是Java编程语言构建的事实标准,大部分项目还在使用maven来进行构建,因此了解maven内部运行的原理对定位和分析问题还是很有裨益的.本篇文章主要介绍一些maven内部运行过程中的 ...
Mybatis generator的使用
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE generatorConfiguration ...
MyEclipse部署到tomcat的问题
开发环境为MyEclipse2014,tomcat版本为8.0,部署tomcat时,出现以下问题: 这时,解决方法如下: 1.右击项目,选择export,弹出框后,在上方输入WAR file,下方会出 ...
Oracle EBS - Form DEV Env
1. 创建文件夹resource与forms, 以便存放pll与forms(主要用到APSTAND.fmb, APPSTAND.fmb, TEMPLATE.fmb)文件; 2. 修改注册表 HKEY_ ...
Unity学习疑问记录之向量基础
这里写得非常好了: http://blog.gamerisker.com/archives/347.html
vs中“Stack around the variable was corrupted”的解决方案
把 project->配置属性->c/c++->代码生成->基本运行时检查为默认值就不会报本异常.具体原因正在研究中... 如果改为其他就有exception. exce ...
CSS尺寸和字体单位-em、px还是%
在页面整体布局中,页面元素的尺寸大小(长度.宽度.内外边距等)和页面字体的大小也是重要的工作之一.一个合理设置,则会让页面看起来层次分明,重点鲜明,赏心悦目.反之,一个不友好的页面尺寸和字体大小设置, ...

geotrellis使用（五）使用scala操作Accumulo

geotrellis使用（五）使用scala操作Accumulo的更多相关文章

随机推荐

热门专题