IDEA中Spark往Hbase中写数据

import org.apache.hadoop.hbase.HBaseConfiguration

import org.apache.hadoop.hbase.io.ImmutableBytesWritable

import org.apache.hadoop.hbase.mapred.TableOutputFormat

import org.apache.spark.{SparkConf, SparkContext}

import org.apache.hadoop.hbase.client.{Put, Result}

import org.apache.hadoop.hbase.util.Bytes

import org.apache.hadoop.mapred.JobConf

object 写Hbase数据 {

  def main(args: Array[String]): Unit = {

    val sparkConf=new SparkConf().setAppName("往Hbase中写数据").setMaster("local[2]")

    val sc=new SparkContext(sparkConf)

    val tableName="student"

   // sc.hadoopConfiguration.set(TableOutputFormat.OUTPUT_TABLE,tableName)

    val conf=HBaseConfiguration.create()

    val jobConf=new JobConf(conf)

     jobConf.setOutputFormat(classOf[TableOutputFormat])

    jobConf.set(TableOutputFormat.OUTPUT_TABLE,tableName)

    //构建新纪录

    val dataRDD=sc.makeRDD(Array("5,hadoop,B,29","6,spark,G,56"))

   val rdd=dataRDD.map(_.split(",")).map{x=>{

     val put=new Put(Bytes.toBytes(x())) //行健的值   Put.add方法接收三个参数：列族,列名,数据

     put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("name"), Bytes.toBytes(x())) //info:name列的值

     put.addColumn(Bytes.toBytes("info"),Bytes.toBytes("gender"),Bytes.toBytes(x())) //info:gender列的值

     put.addColumn(Bytes.toBytes("info"),Bytes.toBytes("age"),Bytes.toBytes(x()))//info:age列的值

     (new ImmutableBytesWritable,put)  ////转化成RDD[(ImmutableBytesWritable,Put)]类型才能调用saveAsHadoopDataset

   }}

    rdd.saveAsHadoopDataset(jobConf)

  }

}

结果：

hbase(main)::> scan 'student'

ROW                                    COLUMN+CELL

                                      column=info:age, timestamp=, value=

                                      column=info:gender, timestamp=, value=B

                                      column=info:name, timestamp=, value=hadoop

                                      column=info:age, timestamp=, value=

                                      column=info:gender, timestamp=, value=G

                                      column=info:name, timestamp=, value=spark

                                      column=info:age, timestamp=, value=

                                      column=info:gender, timestamp=, value=B

                                      column=info:name, timestamp=, value=hadoop

                                      column=info:age, timestamp=, value=

                                      column=info:gender, timestamp=, value=G

                                      column=info:name, timestamp=, value=spark

IDEA中Spark往Hbase中写数据的更多相关文章

IDEA中Spark读Hbase中的数据
import org.apache.hadoop.hbase.HBaseConfiguration import org.apache.hadoop.hbase.io.ImmutableBytesWr ...
用Spark查询HBase中的表数据
java代码如下: package db.query; import org.apache.commons.logging.Log; import org.apache.commons.logging ...
Spark读取Hbase中的数据
大家可能都知道很熟悉Spark的两种常见的数据读取方式(存放到RDD中):(1).调用parallelize函数直接从集合中获取数据,并存入RDD中:Java版本如下: JavaRDD<Inte ...
IDEA中 Spark 读Hbase 报错处理：
SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory] // :: ERROR RecoverableZooKeepe ...
Spark读写Hbase中的数据
def main(args: Array[String]) { val sparkConf = new SparkConf().setMaster("local").setAppN ...
用Spark向HBase中插入数据
java代码如下: package db.insert; import java.util.Iterator; import java.util.StringTokenizer; import org ...
Spark 读取HBase和SolrCloud数据
Spark1.6.2读取SolrCloud 5.5.1 //httpmime-4.4.1.jar // solr-solrj-5.5.1.jar //spark-solr-2.2.2-20161007 ...
mapreduce 只使用Mapper往多个hbase表中写数据
只使用Mapper不使用reduce会大大减少mapreduce程序的运行时间. 有时候程序会往多张hbase表写数据. 所以有如题的需求. 下面给出的代码,不是可以运行的代码,只是展示driver中 ...
使用Hive或Impala执行SQL语句，对存储在HBase中的数据操作
CSSDesk body { background-color: #2574b0; } /*! zybuluo */ article,aside,details,figcaption,figure,f ...

随机推荐

【C++】使用find函数快速定位元素
当有了STL,你还在用遍历的土方法定位元素吗? 今天就来介绍一下,如何使用algorithm库里的find函数快速定位数组或向量中的元素. 首先当然要包含头文件: #include <algor ...
3D标签云
一.圆的坐标表达式 for(var i = 0;i < len;i++){ degree = (2*(k+1)-1)/len - 1;a = Math.acos(degree);//这样取得弧度 ...
hihoCoder#1051 补提交卡
原题地址简单贪心首先,补提交卡应该连续使用,其次,补提交卡应该全部用掉(如果补提交卡多于未提交天数则额外处理) 所以,依次遍历未提交日期,计算:从当前位置开始,用M张补提交卡覆盖后面连续M个数字, ...
【HDOJ6148】Valley Numer（数位DP）
题意: 1≤T≤200 ● 1≤length(N)≤100 思路: 设f[i,j,k,l]为第i位为j,前i位是否贴上限(0/1),递减或递增(0/1)方案数 g[i,j,k]为不到n位,第i位为j, ...
POJ2586 Y2K Accounting Bug 解题报告
Description Accounting for Computer Machinists (ACM) has sufferred from the Y2K bug and lost some vi ...
spring boot项目自定义数据源，mybatisplus分页、逻辑删除无效解决方法
Spring Boot项目中数据源的配置可以通过两种方式实现: 1.application.yml或者application.properties配置 2.注入DataSource及SqlSessio ...
JSP中HTTP状态码
以下内容引用自http://wiki.jikexueyuan.com/project/jsp/http-status-codes.html: HTTP请求格式和HTTP响应消息的格式一样,都有以下结构 ...
Check ini style config tool
INI style config is like below [section] # comment key = value Sometimes we want to check the config ...
二 hbase
Hbase 本文介绍Hbase.但本文的前提是假设你已经读过Google的BigTable论文. Introduction Hbase 是基于Google Big Table用java实现的分布式,列 ...
How to enable Google Play App Signing
how to enable google play app signing ------------------------------------------------------------- ...

IDEA中Spark往Hbase中写数据

IDEA中Spark往Hbase中写数据的更多相关文章

随机推荐

热门专题