scala操作hbase案例

案例取自streaming-app项目

package com.asiainfo.ocdc.streaming.tools

import org.apache.hadoop.hbase.HBaseConfiguration

import org.apache.hadoop.conf.Configuration

import org.apache.hadoop.hbase.client.{Put, Result, Get, HTable}

import org.apache.hadoop.hbase.util.Bytes

import scala.collection.mutable

object HbaseTool {

  val table = new mutable.HashMap[String,HTable]()

  var conf = HBaseConfiguration.create()

  def setConf(c:Configuration)={

    conf = c

  }

  def getTable(tableName:String):HTable={

    table.getOrElse(tableName,{

      println("----new connection ----")

      val tbl = new HTable(conf, tableName)

      table(tableName)= tbl

      tbl

    })

  }

  def getValue(tableName:String,rowKey:String,family:String,qualifiers:Array[String]):Array[(String,String)]={

    var result:AnyRef = null

    val table_t =getTable(tableName)

    val row1 =  new Get(Bytes.toBytes(rowKey))

    val HBaseRow = table_t.get(row1)

    if(HBaseRow != null && !HBaseRow.isEmpty){

      result = qualifiers.map(c=>{

        (tableName+"."+c, Bytes.toString(HBaseRow.getValue(Bytes.toBytes(family), Bytes.toBytes(c))))

      })

    }

    else{

      result=qualifiers.map(c=>{

        (tableName+"."+c,"null")  })

    }

    result.asInstanceOf[Array[(String,String)]]

  }

  def putValue(tableName:String,rowKey:String, family:String,qualifierValue:Array[(String,String)]) {

    val table =getTable(tableName)

    val new_row  = new Put(Bytes.toBytes(rowKey))

    qualifierValue.map(x=>{

      var column = x._1

      val value = x._2

      val tt = column.split("\\.")

      if (tt.length == 2) column=tt(1)

      if(!(value.isEmpty))

        new_row.add(Bytes.toBytes(family), Bytes.toBytes(column), Bytes.toBytes(value))

    })

    table.put(new_row)

  }

  val family = "F"

}

scala操作hbase案例的更多相关文章

Scala操作Hbase空指针异常java.lang.NullPointerException处理
Hbase版本:Hortonworks Hbase 1.1.2 问题描述:使用Scala操作Hbase时,发生空指针异常(java.lang.RuntimeException: java.lang.N ...
PySpark操作HBase时设置scan参数
在用PySpark操作HBase时默认是scan操作,通常情况下我们希望加上rowkey指定范围,即只获取一部分数据参加运算.翻遍了spark的python相关文档,搜遍了google和stackov ...
（升级版）Spark从入门到精通（Scala编程、案例实战、高级特性、Spark内核源码剖析、Hadoop高端）
本课程主要讲解目前大数据领域最热门.最火爆.最有前景的技术——Spark.在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战.课 ...
Spark操作hbase
于Spark它是一个计算框架,于Spark环境,不仅支持单个文件操作,HDFS档,同时也可以使用Spark对Hbase操作. 从企业的数据源HBase取出.这涉及阅读hbase数据,在本文中尽快为了尽 ...
scala使用hbase新api
import org.apache.hadoop.hbase.{HTableDescriptor,HColumnDescriptor,HBaseConfiguration,TableName} imp ...
HBase（六）HBase整合Hive，数据的备份与MR操作HBase
一.数据的备份与恢复 1. 备份停止 HBase 服务后,使用 distcp 命令运行 MapReduce 任务进行备份,将数据备份到另一个地方,可以是同一个集群,也可以是专用的备份集群. 即,把数 ...
大数据技术之_11_HBase学习_02_HBase API 操作 + HBase 与 Hive 集成 + HBase 优化
第6章 HBase API 操作6.1 环境准备6.2 HBase API6.2.1 判断表是否存在6.2.2 抽取获取 Configuration.Connection.Admin 对象的方法以及关 ...
HBase 相关API操练(三)：MapReduce操作HBase
MapReduce 操作 HBase 在 HBase 系统上运行批处理运算,最方便和实用的模型依然是 MapReduce,如下图所示. HBase Table 和 Region 的关系类似 HDFS ...
Phoenix简介概述，Phoenix的Java API 相关操作优秀案例
Phoenix简介概述,Phoenix的Java API 相关操作优秀案例一.Phoenix概述简介二.Phoenix实例一:Java API操作 2.1 phoenix.properties 2 ...

随机推荐

JS禁止用F5键
//禁止用F5键 function document.onkeydown() { if ( event.keyCode==116) { event.keyCode = 0; event.cancelB ...
ubuntu下设置电脑为WiFi热点
这是个问题自从Windows奔溃以来! 扔掉360:Linux下无线网卡作WiFi路由器
20155310 2016-2017-2 《Java程序设计》第八周学习总结
20155310 2016-2017-2 <Java程序设计>第八周学习总结教材学习内容总结第十五章通用API 通用API •日志:日志对信息安全意义重大,审计.取证.入侵检验等都会 ...
如何在Struts2的拦截器中调用Spring容器
第一种: 通常用ApplicationContext来调用Spring配置文件中的一些Bean,所以首先创建Spring上下文容器. ApplicationContext ac = (Applicat ...
前端css规范
文章整理了Web前端开发中的各种CSS规范,包括文件规范.注释规范.命名规范.书写规范.测试规范等. 一.文件规范 1.文件均归档至约定的目录中(具体要求以豆瓣的CSS规范为例进行讲解): 所有的CS ...
个人博客：有态度的HBase/Spark/BigData
个人博客:有态度的HBase/Spark/BigData 关于我本人范欣欣,男,就职于网易杭州研究院后台技术中心数据库技术组,专注于HBase的开发运维,热衷于MySQL等相关数据库技术.联系方式: ...
leetcode:Count and Say【Python版】
一次AC 字符串就是:count+char class Solution: # @return a string def countAndSay(self, n): str = " for ...
Linux性能测试工具安装全集
stress 下载地址:http://people.seas.harvard.edu/~apw/stress/ 一.stress工具安装:1.获取stress源码安装包(stress-1.0.4.ta ...
HBase常用指令
disable 'smsFlow'drop 'smsFlow'create 'smsFlow','info','partition'count 'smsFlow'scan 'smsFlow' trun ...
设置zedgraph鼠标拖拽和局部放大属性(转帖)
说一下几个属性的意义和具体应用: (1)鼠标拖拽显示区域 PanModifierKeys ->> Gets or sets a value that determines which mo ...

scala操作hbase案例

scala操作hbase案例的更多相关文章

随机推荐

热门专题