IDEA中Spark读Hbase中的数据

import org.apache.hadoop.hbase.HBaseConfiguration

import org.apache.hadoop.hbase.io.ImmutableBytesWritable

import org.apache.hadoop.hbase.mapreduce.TableInputFormat

import org.apache.spark.{SparkConf, SparkContext}

import org.apache.hadoop.hbase.client._

import org.apache.hadoop.hbase.util.Bytes

object 读Hbase数据 {

  def main(args: Array[String]): Unit = {

    val conf=HBaseConfiguration.create()

    val sc_conf=new SparkConf().setMaster("local[2]").setAppName("读取Hbase中的数据")

    val sc=new SparkContext(sc_conf)

    //设置查询的表名

    conf.set(TableInputFormat.INPUT_TABLE,"student")

    val RDD=sc.newAPIHadoopRDD(conf,classOf[TableInputFormat],classOf[ImmutableBytesWritable],classOf[Result])

    val count=RDD.count()

    println("Students RDD Count:"+count)

    RDD.cache()

    //遍历输出

    RDD.foreach({case (_,result)=>

        val key=Bytes.toString(result.getRow)

        val name=Bytes.toString(result.getValue("info".getBytes,"name".getBytes))

        val gender=Bytes.toString(result.getValue("info".getBytes,"gender".getBytes))

        val age=Bytes.toString(result.getValue("info".getBytes,"age".getBytes))

        println("ROW:"+key+" name: "+name+" Gender: "+gender+" Age: "+age)

    })

  }

}

/* Hbase ‘student'表里的数据

hbase(main):002:0> scan 'student'

ROW                   COLUMN+CELL

 1                    column=info:age, timestamp=1511069825331, value=23

 1                    column=info:gender, timestamp=1511069793625, value=B

 1                    column=info:name, timestamp=1511069769388, value=soyo

 2                    column=info:age, timestamp=1511069981392, value=24

 2                    column=info:gender, timestamp=1511069942570, value=G

 2                    column=info:name, timestamp=1511069903103, value=soyo2

2 row(s) in 0.2910 seconds

*/

结果：

Students RDD Count:

ROW: name: soyo Gender: B Age:

ROW: name: soyo2 Gender: G Age:

IDEA中Spark读Hbase中的数据的更多相关文章

IDEA中 Spark 读Hbase 报错处理：
SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory] // :: ERROR RecoverableZooKeepe ...
IDEA中Spark往Hbase中写数据
import org.apache.hadoop.hbase.HBaseConfiguration import org.apache.hadoop.hbase.io.ImmutableBytesWr ...
Spark读HBase写MySQL
1 Spark读HBase Spark读HBase黑名单数据,过滤出当日新增userid,并与mysql黑名单表内userid去重后,写入mysql. def main(args: Array[Str ...
Spark读取Hbase中的数据
大家可能都知道很熟悉Spark的两种常见的数据读取方式(存放到RDD中):(1).调用parallelize函数直接从集合中获取数据,并存入RDD中:Java版本如下: JavaRDD<Inte ...
Spark读Hbase优化 --手动划分region提高并行数
一. Hbase的region 我们先简单介绍下Hbase的架构和Hbase的region: 从物理集群的角度看,Hbase集群中,由一个Hmaster管理多个HRegionServer,其中每个HR ...
Spark读写Hbase中的数据
def main(args: Array[String]) { val sparkConf = new SparkConf().setMaster("local").setAppN ...
用Spark查询HBase中的表数据
java代码如下: package db.query; import org.apache.commons.logging.Log; import org.apache.commons.logging ...
用Spark向HBase中插入数据
java代码如下: package db.insert; import java.util.Iterator; import java.util.StringTokenizer; import org ...
Spark 读取HBase和SolrCloud数据
Spark1.6.2读取SolrCloud 5.5.1 //httpmime-4.4.1.jar // solr-solrj-5.5.1.jar //spark-solr-2.2.2-20161007 ...

随机推荐

【BZOJ 1202】 [HNOI2005]狡猾的商人(枚举区间也可行)
题链:http://www.lydsy.com/JudgeOnline/problem.php?id=1202 其实也可以不使用加权并查集,通过画图可以发现,一个长区间和其包含的区间能够算出一个新区间 ...
分数拆分（刘汝佳紫书P183）
枚举,由已知条件推得y大于k,小于等于2K AC代码: #include"iostream"#include"cstring"using namespace s ...
【01】《响应式Web设计：HTML5和CSS3实战》
[01] (魔芋:已看完.) [01]<响应式Web设计:HTML5和CSS3实战>(全).pdf 共246页. 2013年1月出版. 读后感:适合入门的书籍,对于响应式布局, ...
jQuery_DOM学习之------clone()
jQuery_DOM学习之------clone() clone()---节点克隆: 方法: 1.clone()只克隆结构,事件将被丢弃 2.clone(true)结构和事件都将被克隆例子: < ...
NYOJ-770仿射密码，乘数密码与移位密码的结合；
仿射密码时间限制:1000 ms | 内存限制:65535 KB 难度:1 -> Link <- 和乘数密码差不多: 加密算法:Ek(m)=(k1*m+k2)%q;gcd(k ...
[luoguP1578] 奶牛浴场（DP）
传送门 O(s2)算法详见论文王知昆--浅谈用极大化思想解决最大子矩形问题我就复制你能把我怎么样QAQ #include <cstdio> #include <iostream ...
SpringBoot Data JPA 关联表查询的方法
SpringBoot Data JPA实现一对多.多对一关联表查询开发环境 IDEA 2017.1 Java1.8 SpringBoot 2.0 MySQL 5.X 功能需求通过关联关系查询商店 ...
洛谷P1710地铁涨价
题目背景本题开O2优化,请注意常数题目描述博艾市除了有海底高铁连接中国大陆.台湾与日本,市区里也有很成熟的轨道交通系统.我们可以认为博艾地铁系统是一个无向连通图.博艾有N个地铁站,同时有M小段地 ...
[NOIP2005] 提高组洛谷P1054 等价表达式
题目描述明明进了中学之后,学到了代数表达式.有一天,他碰到一个很麻烦的选择题.这个题目的题干中首先给出了一个代数表达式,然后列出了若干选项,每个选项也是一个代数表达式,题目的要求是判断选项中哪些代数 ...
【HDOJ6146】Pokémon GO（DP，计数）
题意:一个2*n的矩阵,从任意一格出发,不重复且不遗漏地走遍所有格子,问方案数 mo 10^9+7 n<=10000 思路:因为OEIS搜出来的两个数列都是错误的,所以考虑DP 设B[i]为2* ...

IDEA中Spark读Hbase中的数据

IDEA中Spark读Hbase中的数据的更多相关文章

随机推荐

热门专题