Week09_day05(Java API操作Hbase)
package com.wyh.HbaseAPI; import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.After;
import org.junit.Before;
import org.junit.Test; import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List; public class Demo1Junit { //定义成员变量,保证每个test都可以访问到
private Configuration conf;
private HConnection conn;
private HBaseAdmin hAdmin; /**
*
* 建立与Hbase的连接,设置成before,使下面的Test执行之前都先执行这个
*/
@Before
public void connect(){
try {
//获取Configuration,读取Hadoop的配置文件
conf = new Configuration(); //获取zookeeper的配置
conf.set("hbase.zookeeper.quorum","master:2181,node1:2181,node2:2181");
//获取连接,可以通过这个连接获取到表
conn = HConnectionManager.createConnection(conf); //获取到HMaster,因为HMaster是对表进行DDL操作的
hAdmin = new HBaseAdmin(conf); System.out.println("建立连接成功。。。"+conn);
} catch (IOException e) {
e.printStackTrace();
}
} /**
*
* 在Hbase中创建表
*/
@Test
public void createTable(){
try {
//使用HTableDescriptor对象创建一个表对象
HTableDescriptor students = new HTableDescriptor("students"); //使用HColumnDescriptor对象创建一个列簇
HColumnDescriptor info = new HColumnDescriptor("info");
String name = Bytes.toString(students.getName()); //将列簇加入到表中
students.addFamily(info);
System.out.println(name+"表 创建成功。。"); //使用HMaster对象来创建该表
hAdmin.createTable(students);
} catch (IOException e) {
e.printStackTrace();
}
} /**
* 删除Hbase中的表,在Hbase中并没有真正将表进行删除,内部是将其打上一个标记,上查询不到,HMaster定时清理过期文件
*/
@Test
public void deleteTable(){
try {
//使用HMaster对象来读表进行操作 //判断是否有该表存在
if(hAdmin.tableExists("student")){ //在删除表之前,必须将其表设置成不可用,否则报错
hAdmin.disableTable("student"); //调用delete方法删除表
hAdmin.deleteTable("student"); //友情提示
System.out.println(conn.getTable("student").getName()+"表 成功被删除。。"); } } catch (IOException e) {
e.printStackTrace();
}
} /**
* 往创建的表中插入一条数据
*/
@Test
public void putData(){
try {
//获取到表的实例
HTableInterface student = conn.getTable("student"); //创建Put实例,给一个行键
Put put = new Put("001".getBytes()); //将这个行键的值,添加列簇,列名,具体的值
put.add("info".getBytes(),"name".getBytes(),"zhangsan".getBytes()); //调用put方法添加一行数据
student.put(put); System.out.println(student.getName()+"表 成功插入数据。。"); } catch (IOException e) {
e.printStackTrace();
}
} /**
* get方法获取到表的数据
*/
@Test
public void getData(){
try {
//获取到表的实例
HTableInterface student = conn.getTable("student"); //获取get实例 添加指定的rowkey
Get get = new Get("001".getBytes()); //获取到行键信息
String rowkey = Bytes.toString(get.getRow()); //调用get方法,返回一个结果集
Result result = student.get(get);
//调用getValue()方法获取到一个字节数组的一个结果集,再利用Bytes工具类的toString()方法去将其转换成字符串
String s = Bytes.toString(result.getValue("info".getBytes(), "name".getBytes())); //输出
System.out.println(rowkey+"\t"+s);
System.out.println("查询结束。。。"); } catch (IOException e) {
e.printStackTrace();
} } /**
* 一次性插入多条数据
*/
@Test
public void putAll(){
//创建一个ArrayList存Put
ArrayList<Put> puts = new ArrayList<Put>(); try {
//获取表实例
HTableInterface students = conn.getTable("students"); //读取数据
BufferedReader br = new BufferedReader(new FileReader("D:\\shujia\\shujia006\\hadoop\\src\\data\\students.txt"));
String line;
while ((line = br.readLine())!=null){
String[] split = line.split(",");
String id = split[0];
String name = split[1];
String age = split[2];
String gender = split[3];
String clazz = split[4]; //为每一行数据根据行键创建一个新的Put
Put put = new Put(id.getBytes()); //插入每一列
put.add("info".getBytes(),"name".getBytes(),name.getBytes());
put.add("info".getBytes(),"age".getBytes(),age.getBytes());
put.add("info".getBytes(),"gender".getBytes(),gender.getBytes());
put.add("info".getBytes(),"clazz".getBytes(),clazz.getBytes()); //将这个put对象加入到集合中去
puts.add(put);
} //使用put(List<Put> list)方法添加数据
students.put(puts); System.out.println("students.txt 数据插入完毕。。。");
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
} /**
* 查询结果,两种方法进行查询
*/
@Test
public void getdata(){
try {
//获取到表的实例
HTableInterface students = conn.getTable("students"); //创建一个Get实例 穿一个行键
Get get = new Get("1500100014".getBytes());
String id = Bytes.toString(get.getRow()); //获取结果集
Result result = students.get(get); /**
* 查询方法一:已经知道列的数量和列名
*/
String name = Bytes.toString(result.getValue("info".getBytes(), "name".getBytes()));
String age = Bytes.toString(result.getValue("info".getBytes(), "age".getBytes()));
String gender = Bytes.toString(result.getValue("info".getBytes(), "gender".getBytes()));
String clazz = Bytes.toString(result.getValue("info".getBytes(), "clazz".getBytes())); System.out.println(id+"\t"+name+"\t"+age+"\t"+gender+"\t"+clazz); /**
* 查询方法二:不知道列的数量和列名
* @deprecated as of 0.96, use {@link CellUtil#cloneValue(Cell)}
*/ List<Cell> cells = result.listCells();
for (Cell cell : cells) {
String s = Bytes.toString(CellUtil.cloneValue(cell));
System.out.print(s);
System.out.print("\t");
} } catch (IOException e) {
e.printStackTrace();
}
} /**
* scan 查询多条数据
*
*/
@Test
public void scanAll(){
try {
//获取表的实例
HTableInterface students = conn.getTable("students"); //创建scan实例
Scan scan = new Scan(); //定义查询的范围 含头不含尾
scan.setStartRow("1500100014".getBytes());
scan.setStopRow("1500100085".getBytes()); //将设置好的scan加入进去,返回一个结果的迭代器
ResultScanner scanner = students.getScanner(scan); //因为next()指向的是下一个索引,所以我们类似读取数据的做法去遍历取值
Result result;
while ((result=scanner.next())!=null){ //调用之前写好的方法
print(result);
}
} catch (IOException e) {
e.printStackTrace();
}
} /**
*
*
* scan扫描查询有需求的数据,比较器和过滤器
*
* 通过运用4种比较器,过滤出姓于,年纪大于23岁,性别为女,且是理科的学生。
*
* 正则比较器 RegexStringComparator
* 包含比较器 SubstringComparator
* 二进制前缀比较器 BinaryPrefixComparator
* 二进制比较器 BinaryComparator
*
*/
@Test
public void FilterData(){
try {
//获取表的实例
HTableInterface students = conn.getTable("students"); /**
* 第一个过滤器,过滤出班级是理科开头的
*/
//创建比较器 正则比较器 RegexStringComparator
RegexStringComparator regexStringComparator = new RegexStringComparator("理科."); //创建过滤器 列过滤器 SingleColumnValueFilter
SingleColumnValueFilter singleColumnValueFilter = new SingleColumnValueFilter("info".getBytes(),"clazz".getBytes(),
CompareFilter.CompareOp.EQUAL,regexStringComparator); /**
* 第二个过滤器,过滤出性别是女生的
*/
//创建比较器 包含比较器 SubStringComparator
SubstringComparator gender = new SubstringComparator("女"); //创建过滤器 列过滤器 SingleColumnValueFilter
SingleColumnValueFilter singleColumnValueFilter1 = new SingleColumnValueFilter("info".getBytes(), "gender".getBytes(),
CompareFilter.CompareOp.EQUAL, gender); /**
* 第三个过滤器,过滤出年纪大于23岁的
*/
//创建比较器 二进制比较器 BinaryComparator
BinaryComparator binaryComparator = new BinaryComparator("23".getBytes()); //创建过滤器 列过滤器 SingleColumnValueFilter
SingleColumnValueFilter singleColumnValueFilter2 = new SingleColumnValueFilter("info".getBytes(), "age".getBytes(),
CompareFilter.CompareOp.GREATER_OR_EQUAL, binaryComparator); /**
* 第四个过滤器,过滤出姓于的
*/
//创建比较器 二进制前缀比较器 BinaryPrefixComparator
BinaryPrefixComparator binaryPrefixComparator = new BinaryPrefixComparator("于".getBytes()); //创建过滤器 列过滤器 SingleColumnValueFilter
SingleColumnValueFilter singleColumnValueFilter3 = new SingleColumnValueFilter("info".getBytes(), "name".getBytes(),
CompareFilter.CompareOp.EQUAL, binaryPrefixComparator); //要想实现多个需求,就添加多个过滤条件
//创建一个过滤器列表,可以添加多个过滤器
FilterList filterList = new FilterList();
filterList.addFilter(singleColumnValueFilter);
filterList.addFilter(singleColumnValueFilter1);
filterList.addFilter(singleColumnValueFilter2);
filterList.addFilter(singleColumnValueFilter3); //创建scan实例
Scan scan = new Scan(); //将过滤器添加进去
scan.setFilter(filterList); //通过表的实例获取结果迭代器
ResultScanner scanner = students.getScanner(scan); Result result = null;
while ((result = scanner.next())!=null){
print(result);
}
} catch (IOException e) {
e.printStackTrace();
} } /**
* 行键过滤器 RowFilter 使用 startRow/stopRow 方式比较好
*
*/
@Test
public void rowFilter(){
try {
//获取表的实例
HTableInterface students = conn.getTable("students"); /**
* 使用行键比较器,过滤出学号是以15001001开头的学生 过滤的对象是rowkey
*/
//创建filter实例
//创建比较器 使用二进制前缀比较器 BinaryPrefixComparator
BinaryPrefixComparator binaryPrefixComparator = new BinaryPrefixComparator("15001001".getBytes()); //创建过滤器 行键比较器 RowFilter()
RowFilter rowFilter = new RowFilter(CompareFilter.CompareOp.EQUAL, binaryPrefixComparator); /**
* 使用二进制前缀比较器过滤出文科的
*/
//创建比较器 二进制前缀比较器
BinaryPrefixComparator binaryPrefixComparator1 = new BinaryPrefixComparator("文科".getBytes()); //创建过滤器
SingleColumnValueFilter singleColumnValueFilter = new SingleColumnValueFilter("info".getBytes(), "clazz".getBytes(),
CompareFilter.CompareOp.EQUAL, binaryPrefixComparator1); //创建一个过滤器集合
FilterList filterList = new FilterList();
filterList.addFilter(rowFilter);
filterList.addFilter(singleColumnValueFilter); //创建scan实例
Scan scan = new Scan();
scan.setFilter(filterList); ResultScanner scanner = students.getScanner(scan);
Result result = null;
while ((result=scanner.next())!=null){
print(result);
} } catch (IOException e) {
e.printStackTrace();
} } /**
* 关闭连接
*/
@After
public void close(){
if(conn!=null){
try {
conn.close();
} catch (IOException e) {
e.printStackTrace();
} System.out.println("conn连接已经关闭。。");
} if(hAdmin!=null){
try {
hAdmin.close();
} catch (IOException e) {
e.printStackTrace();
}
System.out.println("hAdmin已经关闭。。"); }
} /**
* 编写一个方法,实现调用实现显示查询结果
*/
public static void print(Result result){
String id = Bytes.toString(result.getRow());
String name = Bytes.toString(result.getValue("info".getBytes(), "name".getBytes()));
String age = Bytes.toString(result.getValue("info".getBytes(), "age".getBytes()));
String gender = Bytes.toString(result.getValue("info".getBytes(), "gender".getBytes()));
String clazz = Bytes.toString(result.getValue("info".getBytes(), "clazz".getBytes()));
System.out.println(id+"\t"+name+"\t"+age+"\t"+gender+"\t"+clazz);
} }
Week09_day05(Java API操作Hbase)的更多相关文章
- HBase 6、用Phoenix Java api操作HBase
开发环境准备:eclipse3.5.jdk1.7.window8.hadoop2.2.0.hbase0.98.0.2.phoenix4.3.0 1.从集群拷贝以下文件:core-site.xml.hb ...
- linux 下通过过 hbase 的Java api 操作hbase
hbase版本:0.98.5 hadoop版本:1.2.1 使用自带的zk 本文的内容是在集群中创建java项目调用api来操作hbase,主要涉及对hbase的创建表格,删除表格,插入数据,删除数据 ...
- Java API 操作HBase Shell
HBase Shell API 操作 创建工程 本实验的环境实在ubuntu18.04下完成,首先在改虚拟机中安装开发工具eclipse. 然后创建Java项目名字叫hbase-test 配置运行环境 ...
- hadoop2-HBase的Java API操作
Hbase提供了丰富的Java API,以及线程池操作,下面我用线程池来展示一下使用Java API操作Hbase. 项目结构如下: 我使用的Hbase的版本是 hbase-0.98.9-hadoop ...
- 【Hbase三】Java,python操作Hbase
Java,python操作Hbase 操作Hbase python操作Hbase 安装Thrift之前所需准备 安装Thrift 产生针对Python的Hbase的API 启动Thrift服务 执行p ...
- java api操作
java api操作 导入开发包 将hbase安装包中lib下包导入java项目 创建表 Configuration conf = HBaseConfiguration.create(); c ...
- hive-通过Java API操作
通过Java API操作hive,算是测试hive第三种对外接口 测试hive 服务启动 package org.admln.hive; import java.sql.SQLException; i ...
- 使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
- Kafka系列三 java API操作
使用java API操作kafka 1.pom.xml <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xs ...
- Hadoop之HDFS(三)HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
随机推荐
- Qt+OPC开发笔记(一):OPCUA介绍、open62541介绍、编译与基础环境Demo
前言 本篇介绍OPC协议,相关开源库.编译并搭建Qt开发OPC的基础环境. Demo OPC OPC(OLE for Process Control)是一个工业标准,用于实现工业 ...
- Linux 网络设置及管理
Linux 网络管理 网络管理 1.使用NetworkManager管理网络 NetworkManager(网络管理器)是一个动态网络的控制器与配置系统,它用于当网络设备可用时保持设备连接和开启并激活 ...
- 【SpringMVC】获取请求参数的方式
SpringMVC获取请求参数的方式 目录 SpringMVC获取请求参数的方式 方式1:ServletAPI 方法2:通过控制器方法的形参获取请求参数 方法3:@RequestParam 方法4:@ ...
- Qt/C++开发经验小技巧281-285
悬停窗体QDockWidget默认在标题栏右键会弹出悬停模块的显示隐藏菜单,如果需要去掉,会发现设置Qt::NoContextMenu或者事件过滤器拦截都是无效的,必须设置 dockWidget-&g ...
- Qt开源作品7-高亮按钮控件
一.前言 这个高亮按钮控件并非本人原创作品,是参考的Qt界的一个大师级人物公孙二狗的作品,各位有兴趣可以去搜索查看,在原作者的代码上,我只是改成了自己的控件的框架结构,然后完善了一些细节,比如增加了各 ...
- Mac_工具使用汇总
Mac安装低版本的Xcode后会出现各种问题,现汇总如下: 1. python3: error: unable to find utility "python3", not a ...
- zsh 切换root用户后,命令执行后要卡顿2s左右
在 oh-my-zsh 进入 包含 git 仓库目录时,会变的比平时慢/卡顿 原因是因为 oh-my-zsh 要**获取 git 更新信息 ** **解决办法: ** 设置 oh-my-zsh 不读取 ...
- UWP Shadow 阴影
参考文字: https://mtaulty.com/2016/08/10/windows-10-uwp-and-composition-light-and-shade/ <Grid Backgr ...
- 2020年最新Redis面试题-copy
什么是Redis Redis(Remote Dictionary Server) 是一个使用 C 语言编写的,开源的(BSD许可)高性能非关系型(NoSQL)的键值对数据库. Redis 可以存储键和 ...
- JavaWeb的一些理解
WEB概述 WEB是什么 WEB,在英语中web即表示网页的意思,它用于表示Internet主机上供外界访问的资源. Internet上的资源分类 Internet上供外界访问的Web资源分为: 静态 ...