HBase 1.1.2 优化插入 Region预分配

预分Region 与 不预分Region 的测试：

1 不预分Region：

      23~29秒插入100W数据   并且蛋疼的是每次都写入一个 RegionServer 且  只在一个 Region 相当于人为制造的网络风暴。

2  预分Region（3节点分了3个Region）
      写入 18~19秒 100W 数据。  55555 每秒。（本机网络请求已满。否则应该线性增长）

下面是代码；

（注释部分为不分 Region 的情况）

package com.rocky.util;

import com.rocky.dao.HBaseFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import java.util.UUID;

/**
 * Created by rocky_24 on 2016/2/25.
 */
public class putData {



    public static void main(String[] args) throws IOException {

//        /**
//         * 分16
//         */
//        byte[][] preforkRegions = new byte[10+6][];
//        int k=0;
//        System.out.println(preforkRegions.length);
//        for(char i='0';i<='9';i++){
//            preforkRegions[k++]=(""+i).getBytes();
//        }
//        for(char i='a';i<='f';i++){
//            preforkRegions[k++]=(""+i).getBytes();
//        }

        byte[][] preforkRegions = new byte[3][];
        preforkRegions [0] = ("5").getBytes();
        preforkRegions [1] = ("10").getBytes();
        preforkRegions [2] = ("z").getBytes();

        createTable("access_logs","f",preforkRegions);

        System.out.println(TimeUtils.getIntradayDateAndTime());

        String [] pages = {"/","/a.html","/b.html","/c.html"};
        Configuration con = HBaseFactory.getConf();
        HTable table = new HTable(con,"access_logs");
//        Table table  = HBaseFactory.getHBaseConnection().getTable(TableName.valueOf("access_logs"));
        table.setWriteBufferSize(1024 * 1024 * 6);
        table.setAutoFlushTo(false);

        int totalRecords = 10000;
        Random rand = new Random();
        System.out.println("importing " + totalRecords + " records ....");

        List<Put> list = new ArrayList<Put>();

        for (int i=0; i < totalRecords * 100; i++) {
            String rowkey = UUID.randomUUID().toString();
            String randomPage = pages[rand.nextInt(pages.length)];
            Put put = new Put(rowkey.getBytes());
            put.addColumn(Bytes.toBytes("f"), null, Bytes.toBytes(randomPage));
            list.add(put);
        }
        System.out.println("put数据装载完毕："+list.size());
        System.out.println(TimeUtils.getIntradayDateAndTime());
        table.put(list);
        table.flushCommits();
        table.close();
        System.out.println("done");
        System.out.println(TimeUtils.getIntradayDateAndTime());
    }


    /**
     *  创建表
     * @param tableName
     * @param columnFamily
     * @param spilts
     * @throws IOException
     */
    public static void createTable(String tableName, String columnFamily, byte[][] spilts) throws IOException {

        Connection connection = HBaseFactory.getHBaseConnection();
        Admin admin = connection.getAdmin();
        if (admin.tableExists(TableName.valueOf(tableName))) {
            admin.disableTable(TableName.valueOf(tableName));
            admin.deleteTable(TableName.valueOf(tableName));

        }
        HTableDescriptor tableDesc = new HTableDescriptor(TableName.valueOf(tableName));

        tableDesc.addFamily(new HColumnDescriptor(columnFamily));
        if (spilts == null) {
            admin.createTable(tableDesc);
        } else {
            admin.createTable(tableDesc, spilts);
        }
        admin.close();
    }

}

观察 16010端口查看 Region 分裂情况如下：

= =！多分了一个 Region 因为HBase 在分裂创建时候是拿到

asscii 码的 0 到数字[10]

来自为知笔记(Wiz)

HBase 1.1.2 优化插入 Region预分配的更多相关文章

【转载】HBase 数据库检索性能优化策略
转自:http://www.ibm.com/developerworks/cn/java/j-lo-HBase/index.html 高性能 HBase 数据库本文首先介绍了 HBase 数据库基本 ...
HBase 数据库检索性能优化策略--转
https://www.ibm.com/developerworks/cn/java/j-lo-HBase/index.html HBase 数据表介绍 HBase 数据库是一个基于分布式的.面向列的 ...
HBase 数据库检索性能优化策略
HBase 数据表介绍 HBase 数据库是一个基于分布式的.面向列的.主要用于非结构化数据存储用途的开源数据库.其设计思路来源于 Google 的非开源数据库"BigTable" ...
hbase读的性能优化
任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题.HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少.总结 ...
mysql如何优化插入记录速度
插入记录时,影响插入速度的主要是索引.唯一性校验.一次插入记录条数等.根据这些情况,可以分别进行优化,本节将介绍优化插入记录速度的几种方法. 一.对于MyISAM引擎表常见的优化方法如下: 1 ...
hbase优化之region合并和压缩
HBASE操作:(一般先合并region然后再压缩) 一 .Region合并: merge_region 'regionname1','regionname2' ,'true' --true代表 ...
HBase(八): 表结构设计优化
在 HBase(六): HBase体系结构剖析(上) 介绍过,Hbase创建表时,只需指定表名和至少一个列族,基于HBase表结构的设计优化主要是基于列族级别的属性配置,如下图: 目录: BLOOMF ...
HBase 架构与工作原理5 - Region 的部分特性
本文系转载,如有侵权,请联系我:likui0913@gmail.com Region Region 是表格可用性和分布的基本元素,由列族(Column Family)构成的 Store 组成.对象的层 ...
Java客户端访问HBase集群解决方案(优化)
测试环境:Idea+Windows10 准备工作: <1>.打开本地 C:\Windows\System32\drivers\etc(系统默认)下名为hosts的系统文件,如果提示当前用户 ...

随机推荐

swift语言点评十九-类型转化与检查
1.oc比较: -(BOOL) isKindOfClass: classObj判断是否是这个类或者这个类的子类的实例 -(BOOL) isMemberOfClass: classObj 判断是否是这个 ...
wordpress 后台登录增加访问效验
目前已知的增加 wordpress 后台登录安全的方案有三种: 安全插件:如Limit Login Attempts Reloaded.WPS Hide Login 等等: 登录 URL 增加自定义k ...
DataTable相关操作，筛选，取前N条数据，去重复行，获取指定列数据
#region DataTable筛选,排序返回符合条件行组成的新DataTable或直接用DefaultView按条件返回 /// <summary> /// Dat ...
red hat linux之Samba、DHCP、DNS、FTP、Web的安装与配置
本教程是在red hat linux 6.0环境下简单测试!教程没有图片演示,需要具有一定Linux基础知识,很多地方的配置需要根据自己的情况修改,照打不一定可以配置成功.(其他不足后续修改添加) y ...
Linux学习总结（14）——Linux权限控制
linux中,权限的学习是必不可少的,不论是作为一名运维工程师或者是单一的管理者,学习好linux中的权限控制,你就可以保护好自己的隐私同时规划好你所管理的一切. 权限的学习是很多的,不要认为自己已经 ...
零基础学python-6.2 共享引用
这一章节说说共享引用我们先举一个样例 a=1 b=a 上面的样例就是共享引用,这里我们说说整个过程: 1.创建一个对象1 2.创建一个变量a 3.把a和1所在的内存空间连接起来.就是a引用1 4.a ...
xml布局内容总结（四）--Android
(1)对于xml编写界面较复杂的情况下,使用include会使得编写和查看更清楚 <LinearLayout android:layout_width="mat ...
Linux/UNIX线程(1)
线程(1) 本文将介绍怎样使用多个控制线程在单个进程环境中运行多个任务. 一个进程中的全部线程都能够訪问该进程的组成部件(如文件描写叙述符和内存). 线程包含了表示进程内运行环境必须的信息,当中包含进 ...
Android Camera+SurfaceView实现自己定义拍照
对Activity强制横屏,保证预览方向正确. 使用OrientationEventListener监听设备方向.推断竖拍时,旋转照片后再保存.保证竖拍时预览图片和保存后的图片方向一致. 执行效果: ...
从设计稿到demo
前言先省略产品设计师的wireframe和mockup,为什么线框图和视觉设计稿不在叙述范围内,由于这里要做的是网页重构,从接收设计师的PSD那一刻開始: 一.接到设计稿 1.接收到PSD后.不要着 ...

HBase 1.1.2 优化插入 Region预分配

HBase 1.1.2 优化插入 Region预分配的更多相关文章

随机推荐

热门专题