Hbase知识点总结:  
hbase表中为什么列族的数量不能太多?

因为当一个列族数据溢写的时候,其他列族也会发生数据溢写,但是其他列族中数据的数量还没有达到溢写的阈值,就会导致产生的小文件数量增多.而hbase有小文件合并操作,小文件数量增多就会导致合并次数增多,从而使io资源消耗量增多。

hbase表结构的创建:通过增加表的数量,实现对表中字段复杂关系的解耦

google protocol buffer:是google公司内部的混合语言数据标准,用于rpc系统和持续数据存储系统。
protocol buffers:是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,或者说序列化,很适合做数据存储或者RPC数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。

安装protocol :  对于安装的节点没有具体环境要求
1、解压安装  tar -zxvf protocol-2.5.0.tar.gz
2、编译安装: 安装之前需要先安装环境  yum grouplist   (grouplist安装一个软件组)
3、yum groupinfo “development tools”(中间有空格加双引号)
4、yum groupinstall "development tools"
5、安装configure文件  ./configure  (生成makefile文件)
6、make && make install (生成可执行文件)
7、指定规则文件 以.proto结尾的文件  
定义proto规则文件的要求:
package lm;   (包名称)
message helloword (class类名称)
{
   required int32   id = 1; (必须的属性)
   required string str =2;
   optional  int32   opt = 3 ;(可选的属性)
}

package com.wcg.hbase (包名--与项目中的包名保持一致)
message PhoneDetail (class文件的名称)
{
  required string dnum = 1;
  required string type = 2;
  required string length = 3;  
  required string date = 4;  //后面的这个值是一个序列号,无所谓大小,前提是不能重复
}
8、在根目录中新建一个文件 phone.proto
9、编译 proto文件  
10、查找生成的可执行文件  whereis protoc  
11、查看protoc文件如何使用
./protoc --help  
12、/usr/local/bin/protoc phone.proto --java_out=/root/  (/root/ --proto文件执行后生成java文件的路径)
13、在java中插入数据的时候可以直接调用生成的该java文件的方法 (里面的接口都是google封装好的)
--实现将100条数据放置到一个rowkey中  
package com.wcg.hbase (包名--与项目中的包名保持一致)
message PhoneDetail (class文件的名称)
{
  required string dnum = 1;
  required string type = 2;
  required string length = 3;  
  required string date = 4;  //后面的这个值是一个序列号,无所谓大小,前提是不能重复
}
message dayPhoneDetail
{
  repeated PhoneDetail dayofPhone = 1;
}

--HBASE和mr的整合以及用本地环境模拟mr yarn进行数据计算
1、将hadoop的安装包的本地路径配置到windows/hadoop Map/Reduce 中
2、在windows环境变量中配置hadoop的相关路径 ,在path路径中配置hadoop_home/bin和hadoop_home/sbin
3、将eclipse中自带的jdk换成安装的jdk
4、将hadoop源码导入项目中
5、导入hadoop jar包

hbase的优化:

Hbase--知识点总结3的更多相关文章

  1. hbase 知识点

    hbase 教程:http://www.yiibai.com/hbase/ mac下hbase安装:https://www.jianshu.com/p/510e1d599123 HBase是建立在Ha ...

  2. 大白话详解大数据HBase核心知识点,老刘真的很用心(2)

    前言:老刘目前为明年校招而努力,写文章主要是想用大白话把自己复习的大数据知识点详细解释出来,拒绝资料上的生搬硬套,做到有自己的理解! 01 HBase知识点 第6点:HRegionServer架构 为 ...

  3. 大白话详解大数据HBase核心知识点,老刘真的很用心(3)

    老刘目前为明年校招而努力,写文章主要是想用大白话把自己复习的大数据知识点详细解释出来,拒绝资料上的生搬硬套,做到有自己的理解! 01 HBase知识点(3) 第13点:HBase表的热点问题 什么是热 ...

  4. 用大白话讲大数据HBase,老刘真的很用心(1)

    老刘今天复习HBase知识发现很多资料都没有把概念说清楚,有很多专业名词一笔带过没有解释.比如这个框架高性能.高可用,那什么是高性能高可用?怎么实现的高性能高可用?没说! 如果面试官听了你说的,会有什 ...

  5. 大数据核心知识点:Hbase、Spark、Hive、MapReduce概念理解,特点及机制

    今天,上海尚学堂大数据培训班毕业的一位学生去参加易普软件公司面试,应聘的职位是大数据开发.面试官问了他10个问题,主要集中在Hbase.Spark.Hive和MapReduce上,基础概念.特点.应用 ...

  6. HBase核心知识点总结

    一.HBase介绍 1.基本概念 HBase是一种Hadoop数据库,经常被描述为一种稀疏的,分布式的,持久化的,多维有序映射,它基于行键.列键和时间戳建立索引,是一个可以随机访问的存储和检索数据的平 ...

  7. 一文让您全面了解清楚HBase数据库的所有知识点,值得收藏!

    一.HBase基本概念:列式数据库 在Hadoop生态体系结构中,HBase位于HDFS(Hadoop分布式文件系统)的上一层,不依赖于MapReduce,那么如果没有HBase这种Nosql数据库会 ...

  8. Hbase框架原理及相关的知识点理解、Hbase访问MapReduce、Hbase访问Java API、Hbase shell及Hbase性能优化总结

    转自:http://blog.csdn.net/zhongwen7710/article/details/39577431 本blog的内容包含: 第一部分:Hbase框架原理理解 第二部分:Hbas ...

  9. 【甘道夫】HBase基本数据操作的详细说明【完整版,精绝】

    介绍 之前具体写了一篇HBase过滤器的文章.今天把基础的表和数据相关操作补上. 本文档參考最新(截止2014年7月16日)的官方Ref Guide.Developer API编写. 全部代码均基于& ...

随机推荐

  1. QT中资源文件的使用

    1.在工程中点右键,选添加文件: 在下一页中输入一个资源文件名,如uires,这样工程树下就会出现资源文件夹. 2.右键,选择“Open in Editor”打开它 3.添加或修改前缀名,前缀的作用类 ...

  2. IDEA下调试和运行Hadoop程序例子

    准备 配置好JDK和Hadoop环境, 在IDEA中建立maven项目,建立后的目录结构为: 修改pom..xml引入相关支持: <?xml version="1.0" en ...

  3. vmware 中配置centos 7 静态IP

    虚拟机配置成静态IP可以保证每次宿主机器重启后,虚拟机的IP保持不变,这对于学习集群环境下的软件(如hadoop集群,mysql等数据库集群)很有用. vmware workstation 中装好li ...

  4. ../../在url中的表现

    可能会被忽略的url跳转方式,后端验证时需要考虑这种情况: https://zhidao.baidu.com/question/566551732268407284.html/../../?entry ...

  5. mac下 chmod 不了文件,可以右键查看文件简介处修改权限

  6. 关于OllyDbg的一些设置

    以下是以OD x86 v2.01的设置方法, 其他版本可能略有区别 一 设置字体与颜色 0 OD的字体与颜色的设置机制是这样的, OD给你预设了几组颜色,字体项, 你如果觉得预设的不满意, 可以修改这 ...

  7. Best Practices and Recommendations for RAC databases with SGA size over 100GB (文档 ID 1619155.1)

    Best Practices and Recommendations for RAC databases with SGA size over 100GB (文档 ID 1619155.1) APPL ...

  8. 记录Redis使用中遇到的两个问题(原子性及数据完整性)

    1.使用Redis作为分布式锁的原子性问题 原方案: ① SETNX $LOCK_BUSI_KEY $REQ_ID ② EXPIRE $LOCK_BUSI_KEY $LOCK_TIME 问题: 使用S ...

  9. MIUI6系统详细卡刷开发版获得root权限的经验

    小米的手机不同手机型号通常情况miui论坛都提供两个不同的版本,分别为稳定版和开发版,稳定版没有提供ROOT权限管理,开发版中就开启了ROOT权限,很多情况下我们需要使用的一些功能强大的App,都需要 ...

  10. mysql数据库的理解

    1.索引结构原理: 普通的Btree(binary search tree)就是二叉树,如下图 B+ Tree索引类型则是二叉树的升级版,每个节点存的是 <num ,最后存排序的ROWID Ha ...