spark读取hbase数据

def main(args: Array[String]): Unit = {

      val hConf = HBaseConfiguration.create();

      hConf.set("hbase.zookeeper.quorum","m6,m7,m8")

      val tableName = "t_person"

      hConf.set(TableInputFormat.INPUT_TABLE, tableName)

      val hAdmin = new HBaseAdmin(hConf)

      val conf = new SparkConf()

      conf.set("spark.master", "local")

      conf.set("spark.app.name", "spark demo")

      val sc = new SparkContext(conf);

      val rs = sc.newAPIHadoopRDD(hConf, classOf[TableInputFormat], classOf[ImmutableBytesWritable], classOf[Result])

      rs.foreach(x => {

        println(Bytes.toString(x._2.getRow))

        // 通过列族和列名获取列

        println(Bytes.toInt(x._2.getValue("base_info".getBytes, "age".getBytes)))

      })

  }

　保存数据到hbase数据库中

def main(args: Array[String]): Unit = {

    val conf = new SparkConf()

    conf.set("spark.master", "local")

    conf.set("spark.app.name", "spark demo")

    // 创建SparkSession对象

    val spark = SparkSession.builder().appName("spark sql").config(conf).getOrCreate();

    // 创建sparkContext对象

    val sc = spark.sparkContext

    val hbaseConf = HBaseConfiguration.create()

    val tableName = "t_person"

    hbaseConf.set("hbase.zookeeper.quorum","m6,m7,m8")

    hbaseConf.set(TableInputFormat.INPUT_TABLE, tableName)

    // val hbaseAdmin = new HBaseAdmin(hbaseConf)

    val jobConf = new JobConf(hbaseConf, this.getClass)

    jobConf.setOutputFormat(classOf[TableOutputFormat])

    jobConf.set(TableOutputFormat.OUTPUT_TABLE, tableName)

    val pairs = sc.parallelize(List(("p_0000010", "12")))

    def convert(data : (String, String)) = {

      val p = new Put(Bytes.toBytes(data._1))

      p.add(Bytes.toBytes("base_info"), Bytes.toBytes("age"), Bytes.toBytes(data._2))

      (new ImmutableBytesWritable , p)

    }

    // 保存数据到hbase数据库中

    new PairRDDFunctions(pairs.map(convert)).saveAsHadoopDataset(jobConf)

  }

spark读取hbase数据的更多相关文章

Spark 读取HBase数据
Spark1.6.2 读取 HBase 1.2.3 //hbase-common-1.2.3.jar //hbase-protocol-1.2.3.jar //hbase-server-1.2.3.j ...
SparkSQL读取HBase数据
这里的SparkSQL是指整合了Hive的spark-sql cli(关于SparkSQL和Hive的整合,见文章后面的参考阅读). 本质上就是通过Hive访问HBase表,具体就是通过hive-hb ...
关于mapreducer 读取hbase数据存入mysql的实现过程
mapreducer编程模型是一种八股文的代码逻辑,就以用户行为分析求流存率的作为例子 1.map端来说:必须继承hadoop规定好的mapper类:在读取hbase数据时,已经有现成的接口 Tabl ...
使用MapReduce读取HBase数据存储到MySQL
Mapper读取HBase数据 package MapReduce; import org.apache.hadoop.hbase.Cell; import org.apache.hadoop.hba ...
Spark 读取HBase和SolrCloud数据
Spark1.6.2读取SolrCloud 5.5.1 //httpmime-4.4.1.jar // solr-solrj-5.5.1.jar //spark-solr-2.2.2-20161007 ...
Spark读取Hbase中的数据
大家可能都知道很熟悉Spark的两种常见的数据读取方式(存放到RDD中):(1).调用parallelize函数直接从集合中获取数据,并存入RDD中:Java版本如下: JavaRDD<Inte ...
spark读取hbase形成RDD，存入hive或者spark_sql分析
object SaprkReadHbase { var total:Int = 0 def main(args: Array[String]) { val spark = SparkSession . ...
spark读取hbase(NewHadoopAPI 例子)
package cn.piesat.controller import java.text.{DecimalFormat, SimpleDateFormat}import java.utilimpor ...
spark读取kafka数据 createStream和createDirectStream的区别
1.KafkaUtils.createDstream 构造函数为KafkaUtils.createDstream(ssc, [zk], [consumer group id], [per-topic, ...

随机推荐

在WebApi中集成 Swagger
1. Swagger(俗称:丝袜哥)是什么东西? Swagger 是一个规范和完整的框架,用于生成.描述.调用和可视化 RESTful 风格的 Web 服务.总体目标是使客户端和文件系统作为服务器以同 ...
第二十六篇：两个SOUI新控件 ---- SListView和SComboView（借用Andorid的设计）
SOUI原来实现的SListBoxEx的效率一直是我对SOUI不太满意的地方.包括后来网友实现的SListCtrlEx. 这类控件为每一个列表项创建一个SWindow来容纳数据,当数据量比较大(100 ...
[生活日记]参与unity非游戏行业开发者大会小结
今天下午花了半天时间公司全体都去人民广场参与了一个unity非游戏行业开发者大会,主要了解到unity这款全球顶尖之一的游戏引擎的一个发展史,从05年三个美国人技术研发开始,一直到12年开始引进中国, ...
关于mat2gray
最小的是0,最大的是1,那么介于中间的那些值我们怎么处理? 那么事实上我们试了很多样例之后.. 我猜他是..每个步长step_length=1/(max-min+1) 然后每个值就会变成(val-1) ...
BZOJ 3105 [CQOI2013]新Nim游戏 ——线性基
[题目分析] 神奇的题目,两人都可以第一次取走足够多堆的石子. nim游戏的规则是,如果异或和为0,那么就先手必输,否则先手有必胜策略. 所以只需要剩下一群异或和为0就可以了. 先排序,线性基扫一遍即 ...
BlockingQueue深入分析（转）
1.BlockingQueue定义的常用方法如下抛出异常特殊值阻塞超时插入 add(e) offer(e) put(e) offer(e,time,unit) 移除 remove() p ...
android 多媒体数据库详解（转）
转自:http://www.2cto.com/kf/201309/242876.html 主要分为几节: 1. Android的媒体文件内部是如何存储的? 2. Andoid的媒体文件如何获取? 3. ...
php 正则常用基础
正则表达式用来描述一串字符串的字符串定界符除了字母数字反斜线之外的所有字符都可以 / / (强制使用) | | !! 原子在自然界中的最小单位叫做原子正则中的原子:可以打印的字母,数字,符 ...
提高C#代码质量-规范
[规范习惯]命名规范1-命名空间使用<Company>.<Component>2-程序集不必与命名空间同名3-命名空间使用附复数4-避免与FCL的类型重名5-类型名称用名词6 ...
STM32之GPIO操作
啊哈.没办法.外国人的芯片就喜欢用英文来命名,所以中文的:通用输入/输出就用GPIO来代替..谁叫哥们都不是外国人呢.好啦.胡扯了一下,借用唐伯虎点秋香的话:小小书童,可笑可笑... 知道了GPI ...

spark读取hbase数据

保存数据到hbase数据库中

spark读取hbase数据的更多相关文章

随机推荐

热门专题

　保存数据到hbase数据库中