NoSQL数据库

  • 关系型数据库:用表格的行-列来保存数据,OLTP,写入多,行式存储
  • 非关系型数据库:只用来存储数据,业务逻辑由应用程序处理,OLAP,查询多,列式存储
  • 常见NoSQL数据库
    • Redis:基于内存的NoSQL数据库
    • MongoDB:基于文档型(BSON)的NoSQl数据库
  • 设计一个数据库保存电影信息
    • Oracle:至少三张表,每张1000行,笛卡尔积1000*1000*1000,性能低
    • MongoDB:只有1000条记录,查询快(MongoDB 4.0 开始支持事务,支持分布式存储和MapReduce)

HBase

  • Hadoop Database
  • 以HDFS作为最基本的存储单元(表、列族-->目录,数据-->文件)
  • 可快速随机访问海量结构化数据
  • 支持数据随机查找,增量数据处理,数据更新
  • 适用于大量数据存储,大量数据高并发操作,需要对数据进行随机读写的简单操作
  • 内部使用哈希表,通过索引对HDFS文件中的数据进行快速查找(HDFS只能顺序访问)
  • Zookeeper实现HA

安装

  • 本地:单机,不需要HDFS,数据直接保存在操作系统,只启动HMaster

    • 解压->设置环境变量->改配置文件(hbase-env.sh,hbase-site.xml)
  • 伪分布:单机模拟分布式,ZK+HMaster+RegionServer
    • 改配置文件(hbase-env.sh,hbase-site.xml)
    • 依赖HDFS和ZK,必须先启动
  • 全分布
  • HA

过程

  • 在HBase中创建表,参数--表名、列族
  • 增加列,参数--列名
  • 插入数据,参数--表名,行名,列名,值

命令

  • 启动:start-hbase.sh
  • 命令行工具:hbase shell
  • 查看所有表:list
  • 创建表:create 'student','info','grade'
  • 插入数据:put 'student','stu001','info:name','Tom'
  • 查看表:scan 'student'
  • 停用表:disable 'student'
  • 删除表:drop 'student'
  • 删除命名空间:drop_namespace 'school'

Java API

  • 启动hdfs
  • 运行Java API
  • 在hbase shell中查看

 1 package Demo.base;
2
3 import org.apache.hadoop.conf.Configuration;
4 import org.apache.hadoop.hbase.HColumnDescriptor;
5 import org.apache.hadoop.hbase.HTableDescriptor;
6 import org.apache.hadoop.hbase.TableName;
7 import org.apache.hadoop.hbase.client.Get;
8 import org.apache.hadoop.hbase.client.HBaseAdmin;
9 import org.apache.hadoop.hbase.client.HTable;
10 import org.apache.hadoop.hbase.client.Put;
11 import org.apache.hadoop.hbase.client.Result;
12 import org.apache.hadoop.hbase.client.ResultScanner;
13 import org.apache.hadoop.hbase.client.Scan;
14 import org.apache.hadoop.hbase.util.Bytes;
15 import org.junit.Test;
16
17 /*
18 * 注意:需要:hamcrest-core-1.3.jar包
19 */
20 public class TestHbase {
21
22 @Test
23 public void testCreateTable() throws Exception{
24 //创建表
25 //配置ZooKeeper地址
26 Configuration conf = new Configuration();
27 conf.set("hbase.zookeeper.quorum", "192.168.174.111");
28
29 //得到一个HBase的客户端
30 HBaseAdmin client = new HBaseAdmin(conf);
31
32 //采用:面向对象的思想来建表
33 //1、指定表的描述符
34 HTableDescriptor htd = new HTableDescriptor(TableName.valueOf("mytable"));
35
36 //2、指定列族
37 htd.addFamily(new HColumnDescriptor("info"));
38 htd.addFamily(new HColumnDescriptor("grade"));
39
40 //创建表
41 client.createTable(htd);
42
43 //关闭客户端
44 client.close();
45 }
46 @Test
47 public void testPutData() throws Exception{
48 //插入数据
49 //配置ZooKeeper地址
50 Configuration conf = new Configuration();
51 conf.set("hbase.zookeeper.quorum", "192.168.174.111");
52
53 //得到一个客户端
54 HTable client = new HTable(conf, "mytable1");
55
56 //构造一个Put对象:一条数据
57 Put put = new Put(Bytes.toBytes("id001"));
58
59 //指定列的值
60 /*
61 put.addColumn(family, 列族的名字
62 qualifier, 列的名字
63 value) 值
64 */
65 put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("name"), Bytes.toBytes("Tom"));
66
67 // 一次插入多条记录client.put(List);
68
69 client.put(put);
70
71 client.close();
72 }
73 }

参考

/etc/profile 和 ~/.bash_profile 的区别

http://blog.chinaunix.net/uid-14735472-id-3190130.html

hbase shell 中退格无法使用的解决方法

https://blog.csdn.net/zhangchen124/article/details/92801219

hbase shell 常用命令

https://blog.csdn.net/vbirdbest/article/details/88236575

put流程

https://blog.csdn.net/yangzishiw/article/details/53910775

region机制

https://blog.csdn.net/DianaCody/article/details/39530165

深入理解hbase

https://segmentfault.com/a/1190000019959411

HBase创建命名空间的API操作,抛异常的坑

https://blog.csdn.net/wx1528159409/article/details/85266856

HDFS数据写入HBase

https://blog.csdn.net/lianghecai52171314/article/details/104801847/

列式存储

https://blog.csdn.net/zl1zl2zl3/article/details/86632044

https://blog.csdn.net/dc_726/article/details/41143175

https://zhuanlan.zhihu.com/p/129342230

[BD] HBase的更多相关文章

  1. 读取hive文件并将数据导入hbase

    package cn.tansun.bd.hbase; import java.io.IOException; import java.net.URI; import java.util.List; ...

  2. client 如何找到正确的RegionServer(HBase -ROOT-和.META.表)

    在HBase中,大部分的操作都是在RegionServer完成的,Client端想要插入,删除,查询数据都需要先找到相应的RegionServer.什么叫相应的RegionServer?就是管理你要操 ...

  3. Hbase案例分析(一)

    Hbase应用场景: 1 随机读或者写 2 大数据上的高并发操作,比如每秒对PB级数据进行上千次操作.(查询,删除等操作) 3 读写均是非常简单的操作,比如没有join操作 Hbase Schema设 ...

  4. hbase 性能优化 (转载)

    一.服务端调优 1.参数配置 1).hbase.regionserver.handler.count:该设置决定了处理RPC的线程数量,默认值是10,通常可以调大,比如:150,当请求内容很大(上MB ...

  5. 【转载】Hadoop 2.7.3 和Hbase 1.2.4安装教程

    转载地址:http://blog.csdn.net/napoay/article/details/54136398 目录(?)[+]   一.机器环境 系统:MAC OS Hadoop:2.7.3 H ...

  6. Ubuntu16.04下HBase的安装与配置

    一.环境 os : Ubuntu 16.04 LTS 64bit jdk : 1.8.0_161 hadoop : mysql : hive : hbase: -hadoop2 安装HBase前,系统 ...

  7. Lily hbase indexer搭建配置概要文档

    1.solrcloud搭建好2.hbase-solr-indexer服务开启3.确定hbase中的对应的表开启replication功能 create '} // 1表示开启replication 已 ...

  8. HBase 协处理器统计行数

    环境:cdh5.1.0 启用协处理器方法1. 启用协处理器 Aggregation(Enable Coprocessor Aggregation) 我们有两个方法:1.启动全局aggregation, ...

  9. hive与hbase数据类型对应关系

    hive与hbase数据类型对应关系 当hbase中double,int 类型以byte方式存储时,用字符串取出来必然是乱码. 在hivd与hbase整合时也遇到这个问题:做法是:#b 1.加#b C ...

随机推荐

  1. 每天自学两小时Python,整理了最详细的学习路线和规

    上次这篇文章每天自学两小时Python,三个月学通月入20K主要是给大家整理了学习资料视频和PDF书籍,很多需要的都关注私信领取了. 很多朋友领取之后都问我教程有了那么应该从哪去开始学习呢,私信太多我 ...

  2. Elasticsearch扩展X-pack实施流程-实施

    Elasticsearch扩展X-PACK实施流程 elasticsearch5.2.1安装X-PACK,对ES集群进行监控,报警,安全验证,报告,图形化操作 注意 版本号需要固定,小版本都不能差,要 ...

  3. JS基础学习第五天

    作用域 作用域简单来说就是一个变量的作用范围.在JS中作用域分成两种: 1.全局作用域 直接在script标签中编写的代码都运行在全局作用域中全局作用域在打开页面时创建,在页面关闭时销毁.全局作用域中 ...

  4. 一文搞定zuul使用

    前言 在深入探讨Spring Cloud Gateway的细节之前,让我们了解有关反向代理和api网关模式的一些基础知识. 什么是反向代理? 反向代理是代表其他事物进行请求的事物.它的行为更像是简单的 ...

  5. Apache Hudi 0.8.0版本重磅发布

    1. 重点特性 1.1 Flink集成 自从Hudi 0.7.0版本支持Flink写入后,Hudi社区又进一步完善了Flink和Hudi的集成.包括重新设计性能更好.扩展性更好.基于Flink状态索引 ...

  6. 201871030106-陈鑫莲 实验二 个人项目-《D{0-1} KP 问题》项目报告

    项目 内容 课程班级博客链接 班级博客 这个作业要求链接 作业要求 我的课程学习目标 1.掌握软件项目个人开发流程2.掌握Github发布软件项目的操作方法 这个作业在哪些方面帮助我实现学习目标 1. ...

  7. OO_Unit 3 JML规格化设计总结

    OO_Unit 3 JML规格化设计总结 JML语言概述(Level 0) 概念定义   JML(Java Modeling Language)是用于对Java程序进行规格化设计的一种表示语言.JML ...

  8. Spring Boot 2.3.0 新特性Redis 拓扑动态感应

    本文为原创文章.欢迎任何形式的转载,但请务必注明出处 冷冷https://lltx.github.io. Spring Boot 2.3 新特性优雅停机详解 Spring Boot 2.3 新特性分层 ...

  9. 【笔记】《Redis设计与实现》chapter10 RDB持久化

    chapter10 RDB持久化 10.1 RDB文件的创建和载入 有两个Redis命令可以用于生成RDB文件,SAVE和BGSAVE SAVE阻塞服务器进程进行RDB文件的创建,BGSAVE则创建服 ...

  10. @Transactional+@Autowired出现的lateinit property xx has not been initialized错误

    1 问题描述 用Kotlin编写Spring Boot,在业务层中使用@Transactional+@Autowired时出现如下错误: lateinit property dao has not b ...