Hbase数据导入导出

平时用于从生产环境hbase到导出数据到测试环境。

导入数据：

import java.io.BufferedReader;

import java.io.File;

import java.io.FileReader;

import java.io.IOException;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import java.util.Set;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.HConnection;

import org.apache.hadoop.hbase.client.HConnectionManager;

import org.apache.hadoop.hbase.client.HTableInterface;

import org.apache.hadoop.hbase.client.Put;

import org.apache.hadoop.hbase.util.Bytes;

@SuppressWarnings("deprecation")

public class HbaseImport {

    public static void main(String args[]) throws Exception{

        Configuration conf = HBaseConfiguration.create();

        HConnection connection = HConnectionManager.createConnection(conf);

        List<Map<String,String>> datas = getDatas("d:\\hbaseData\\datas.txt",connection);

        wirteHbase(connection,"EVENT_LOG_LBS",datas);

    }

    public static List<Map<String,String>> getDatas(String filePath,HConnection connection) throws IOException{

        List<Map<String,String>> datas = new ArrayList<Map<String,String>>();

        File file = new File(filePath);

        BufferedReader br = new BufferedReader(new FileReader(file));

        String tr = null;

        while(((tr = br.readLine()) != null)){

            String subData = tr.substring(1);

            Map<String,String> data = new HashMap<String,String>();

            String[] ss = subData.split("\\|");

            for(String s : ss){

                String[] tds = s.split("=");

                String v = "";

                if(tds.length == 2){

                    v = tds[1];

                }

                data.put(tds[0], v);

            }

            datas.add(data);

        }

        br.close();

        return datas;

    }

    public static void wirteHbase(HConnection connection,String tableName,List<Map<String,String>>datas) throws IOException{

        HTableInterface t = connection.getTable(tableName);

        for(Map<String,String> map : datas){

            Set<String> ks = map.keySet();

            Put put = new Put(Bytes.toBytes(map.get("rowkey")));

            for(String key : ks){

                put.add(Bytes.toBytes("f1"),Bytes.toBytes(key),Bytes.toBytes(map.get(key)));

            }

            t.put(put);

        }

    }

}

导出数据：

package hbase;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.PrintWriter;

import java.util.ArrayList;

import java.util.Calendar;

import java.util.Date;

import java.util.List;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.Cell;

import org.apache.hadoop.hbase.CellUtil;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.HConnection;

import org.apache.hadoop.hbase.client.HConnectionManager;

import org.apache.hadoop.hbase.client.HTableInterface;

import org.apache.hadoop.hbase.client.Result;

import org.apache.hadoop.hbase.client.ResultScanner;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.util.Bytes;

@SuppressWarnings("deprecation")

public class HbaseExport {

	public static Date getPassSevenDays(int day){

		Calendar calendar = Calendar.getInstance();

		int year = calendar.get(Calendar.YEAR);

		int dayOfYear = calendar.get(Calendar.DAY_OF_YEAR);

		int j = 0;

		for(int i = 0;i < day; i++){

			calendar.set(Calendar.DAY_OF_YEAR, dayOfYear - j);

			if(calendar.get(Calendar.YEAR) < year){

				//跨年了

				j = 1;

				//更新 标记年

				year = year + 1;

				//重置日历

				calendar.set(year, Calendar.DECEMBER,31);

				//重新获取dayOfYear

				dayOfYear = calendar.get(Calendar.DAY_OF_YEAR);

			}else{

				j = j + 1;

			}

		}

		return calendar.getTime();

	}

	public static Scan setScanCondition(Scan scan) throws IOException{

		Date newDay = new Date();

		Date otherDays = getPassSevenDays(7);

		scan.setTimeRange(otherDays.getTime(),newDay.getTime());

		scan.addColumn("f1".getBytes(), "LS_certifier_no".getBytes());

		scan.addColumn("f1".getBytes(), "LS_location".getBytes());

		scan.addColumn("f1".getBytes(), "LS_phone_no".getBytes());

		scan.addColumn("f1".getBytes(), "LS_longitude".getBytes());

		scan.addColumn("f1".getBytes(), "LS_latitude".getBytes());

		scan.addColumn("f1".getBytes(), "date".getBytes());

		scan.addColumn("f1".getBytes(), "time".getBytes());

		scan.addColumn("f1".getBytes(), "hourOfDay".getBytes());

		return scan;

	}

	public static void main(String args[]) throws IOException{

		Configuration conf = HBaseConfiguration.create();

		HConnection connection = HConnectionManager.createConnection(conf);

		String tableName = "EVENT_LOG_LBS_HIS";

		HTableInterface table = connection.getTable(tableName);

		Scan scan = new Scan();

		setScanCondition(scan);

		ResultScanner rs = table.getScanner(scan);

		for(Result r : rs){

			List<String> lines = new ArrayList<String>();

			StringBuilder sb = new StringBuilder();

			sb.append(" rowkey=" + Bytes.toString(r.getRow()));

			for(Cell cell : r.rawCells()){

				String name = Bytes.toString(CellUtil.cloneQualifier(cell));

				String value = Bytes.toString(CellUtil.cloneValue(cell));

				System.out.println(name + "=" + value);

				sb.append("|" + name + "=" + value);

			}

			lines.add(sb.toString());

			System.out.println("--------------------------");

			writeFile(lines,"/home/hdfs/datas");

		}

	}

	public static void writeFile(List<String> lines,String filePath) throws FileNotFoundException{

		File file = new File(filePath);

		PrintWriter pw = new PrintWriter(new FileOutputStream(file,true));

		for(String line : lines){

			pw.append(line);

			pw.append("\n");

		}

		pw.flush();

		pw.close();

	}

}

Hbase数据导入导出的更多相关文章

HBase数据导入导出工具
hbase中自带一些数据导入.导出工具 1. ImportTsv直接导入 1.1 hbase中建表 create 'testtable4','cf1','cf2' 1.2 准备数据文件data.txt ...
Sqoop -- 用于Hadoop与关系数据库间数据导入导出工作的工具
Sqoop是一款开源的工具,主要用于在Hadoop相关存储(HDFS.Hive.HBase)与传统关系数据库(MySql.Oracle等)间进行数据传递工作.Sqoop最早是作为Hadoop的一个第三 ...
通过 Sqoop1.4.7 将 Mysql5.7、Hive2.3.4、Hbase1.4.9 之间的数据导入导出
目录目录 1.什么是 Sqoop? 2.下载应用程序及配置环境变量 2.1.下载 Sqoop 1.4.7 2.2.设置环境变量 2.3.设置安装所需环境 3.安装 Sqoop 1.4.7 3.1.修 ...
HData——ETL 数据导入/导出工具
HData是一个异构的ETL数据导入/导出工具,致力于使用一个工具解决不同数据源(JDBC.Hive.HDFS.HBase.MongoDB.FTP.Http.CSV.Excel.Kafka等)之间数据 ...
ITTC数据挖掘平台介绍（五）数据导入导出向导和报告生成
一. 前言经过了一个多月的努力,软件系统又添加了不少新功能.这些功能包括非常实用的数据导入导出,对触摸进行优化的画布和画笔工具,以及对一些智能分析的报告生成模块等.进一步加强了平台系统级的功能. 马 ...
从零自学Hadoop(16)：Hive数据导入导出，集群数据迁移上
阅读目录序导入文件到Hive 将其他表的查询结果导入表动态分区插入将SQL语句的值插入到表中模拟数据文件下载系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并 ...
oracle数据导入/导出
Oracle数据导入导出imp/exp 功能:Oracle数据导入导出imp/exp就相当与oracle数据还原与备份. 大多情况都可以用Oracle数据导入导出完成数据的备份和还原(不会造成数据 ...
Oracle数据导入导出
Oracle数据导入导出imp/exp 在oracle安装目录下有EXP.EXE与IMP.EXE这2个文件,他们分别被用来执行数据库的导入导出.所以Oracle数据导入导出imp/exp就相当与ora ...
SQL SERVER 和ACCESS的数据导入导出
//批量导入Access string filepath = Server.MapPath("student.mdb"); stri ...

随机推荐

MySQL数据库在linux的安装，编程与操作
一.安装 ubuntu上安装MySQL非常简单只需要几条命令就可以完成. 1. sudo apt-get install mysql-server 2. apt-get isntall mysql ...
centos安装与卸载postgresql
1.卸载旧版本postgresql $ yum remove postgresql* 2.更新yum $ yum update 3.下载pgdg-centos92-9.2-6.noarch.rpm,或 ...
如何清除SQL Server Management Studio的最近服务器列表
SQL Server Management Studio (SSMS) 的"连接到服务器"对话框会记录用户所有访问过的服务器名称,这个功能对于经常连接多个数据库的人来说确实挺方便的 ...
overflow:hidden清楚浮动的影响
在网页布局中有时会遇到这种情况: 如果左边用<dt>,右边用<dd>,放在一行显示,<dt>要设置float:left,这个应该都知道,问题是,第一行这样做没有问题 ...
SSL/TLS协议运行机制
转载自http://www.ruanyifeng.com/blog/2014/02/ssl_tls.html 互联网的通信安全,建立在SSL/TLS协议之上. 本文简要介绍SSL/TLS协议的运行 ...
android studio fetching android sdk component information
解决办法: 1.找到Android Studio安装目录下的idea.properties文件 2.增加disable.android.first.run=true
windows下使用Git命令汇总
这里只是简单汇总下Git主要命令,方便记忆:汇总的不好,请各位包容,谢谢!想看详细讲解,推荐廖雪峰大神的教程,地址如下:http://www.liaoxuefeng.com/wiki/00137395 ...
浅谈五大Python Web框架
转载:http://feilong.me/2011/01/talk-about-Python-web-framework 说到Web Framework,Ruby的世界Rails一统江湖,而Pytho ...
[Note] Build your SDL2 Environment in Visual Studio 2013 配置你的SDL2运行环境
Right key your project in "solution manager(解决方案资源管理器)", choose the "Property(属性)&quo ...
vs安装失败,发生严重错误,错误号:Error 0x80070643
发生这个的原因很大的可能是vs安装的目录不是系统默认目录,改一下就好了. C:\Program File(x86) 不要看网上那些没有的,都TM骗人的. 不要问我是怎么知道的,你只要知道我的电脑让我重 ...

Hbase数据导入导出

Hbase数据导入导出的更多相关文章

随机推荐

热门专题