HBase & thrift & C++编程
目录
1. 前言
本文目的是介绍使用C++如何操作HBase。从HBase 0.94开始,HBase新增thrift2,本文只介绍和讨论thrift2相关的。hbase-1.1.2使用的thrift估计是thrift-0.9.0版本。
2. 启动和停止thrift2
2.1. 启动thrift2
登录HBase master机器,执行以下命令启动thrift2:hbase-daemon.sh start thrift2。
thrift默认的监听端口是9090,可以通过参数“-p”指定其它端口。默认使用的Server是TThreadPoolServer。默认使用的Protocol是TBinaryProtocol。
注意客户端使用的Protocol和Transport和服务端的要保持一致,否则客户端在调用时,可能遇到“EAGAIN (timed out)”等错误。
2.2. 停止thrift2
hbase-daemon.sh stop thrift2
2.3. 启动参数
使用“hbase-daemon.sh start thrift2”时,还可以带以下参数:
|
参数名 |
是否默认 |
参数说明 |
|
-h, --help |
显示帮助信息 |
|
|
-b, --bind |
绑定指定地址,但不支持TNonblockingServer和THsHaServer,两者总是使用“0.0.0.0” |
|
|
-p, --port |
9090 |
绑室指定端口,默认为9090 |
|
-f, --framed |
使用TFramedTransport |
|
|
-c, --compact |
使用TCompactProtocol,默认是TBinaryProtocol |
|
|
-threadpool |
是 |
使用TThreadPoolServer,为默认Server |
|
-nonblocking |
使用实现了FramedTransport的TNonblockingServer |
|
|
-hsha |
使用实现了FramedTransport的THsHaServer |
客户端和hbase thrift2的Transport和Protocol需保持一致,比如客户端为FramedTransport,则也需以“-f”启动hbase thrift2。
否则客户端在调用时,可能会遇到“EAGAIN (timed out)”等错误。
启动参数信息来源于官网的页面:
https://hbase.apache.org/devapidocs/org/apache/hadoop/hbase/thrift2/package-summary.html。
以上参数不是给hbase-daemon.sh使用,而是被hbase thrift2使用,可以浏览相关源代码了解细节:
hbase-thrift\src\main\java\org\apache\hadoop\hbase\thrift2\ThriftServer.java
hbase-thrift\src\main\java\org\apache\hadoop\hbase\thrift2\ThriftHBaseServiceHandler.java
Ø 启动示例:
hbase-daemon.sh start thrift2 --framed -nonblocking
3. hbase.thrift
hbaser.thrift文件在hbase源代码包(以hbase-1.1.2为例)中的位置:
hbase-thrift\src\main\resources\org\apache\hadoop\hbase\thrift2\hbase.thrift
3.1. 编译hbase.thrift
保持机器上已安装好thrift(经测试hbase-1.1.2和thrift-0.9.0兼容),然后使用下列命令编译:thrift --gen cpp -out . hbase.thrift,编译成功后,会在“-out”指定的目录下生成以下五个文件:
THBaseService.h
THBaseService.cpp
hbase_types.h
hbase_types.cpp
hbase_constants.h
hbase_constants.cpp
其中供客户端使用的是位于文件THBaseService.h中的类THBaseServiceClient。
4. thrift_helper.h
为了简化C++客户端的编程,可以使用thrift_helper.h:
https://github.com/eyjian/mooon/blob/master/common_library/include/mooon/net/thrift_helper.h,它可以帮助简化对HBase thrift2的调用:
|
// thrift客户端辅助类 // // 使用示例: // mooon::net::CThriftClientHelper<ExampleServiceClient> client(rpc_server_ip, rpc_server_port); // try // { // client.connect(); // client->foo(); // } // catch (apache::thrift::transport::TTransportException& ex) // { // MYLOG_ERROR("thrift exception: (%d)%s\n", ex.getType(), ex.what()); // } // catch (apache::thrift::transport::TApplicationException& ex) // { // MYLOG_ERROR("thrift exception: %s\n", ex.what()); // } // catch (apache::thrift::TException& ex) // { // MYLOG_ERROR("thrift exception: %s\n", ex.what()); // } // Transport除默认的TFramedTransport (TBufferTransports.h),还可选择: // TBufferedTransport (TBufferTransports.h) // THttpTransport // TZlibTransport // TFDTransport (TSimpleFileTransport) // // Protocol除默认的apache::thrift::protocol::TBinaryProtocol,还可选择: // TCompactProtocol // TJSONProtocol // TDebugProtocol template <class ThriftClient, class Protocol=apache::thrift::protocol::TBinaryProtocol, class Transport=apache::thrift::transport::TFramedTransport> class CThriftClientHelper |
5. 示例代码
|
// HBase thrift2 C++编程示例 #include "THBaseService.h" #include <inttypes.h> // PRIu64 #include <mooon/net/thrift_helper.h> #include <mooon/utils/args_parser.h> #include <vector> // 请注意客户端使用的thrift的Transport和Protocol要和hbase thrift2服务端保持一致, // 否则调用时,可能总是报超时,或其它错误!!! // // 运行之前,请通过HBase shell创建好表:create 'test','cf1','cf2' // 或指定版本数:create 'test',{NAME=>'cf1',VERSIONS=>2},{NAME=>'cf2',VERSIONS=>3} // 删除表,按顺序执行以下两条HBase shell命令: // disable 'test' // drop 'test' STRING_ARG_DEFINE(hbase_ip, "192.168.0.1", "hbase thrift ip"); INTEGER_ARG_DEFINE(uint16_t, hbase_port, 9090, 1000, 50000, "hbase thrift port"); int main(int argc, char* argv[]) { std::string errmsg; if (!mooon::utils::parse_arguments(argc, argv, &errmsg)) { fprintf(stderr, "parameter error: %s\n", errmsg.c_str()); exit(1); } using namespace apache; using namespace apache::hadoop; std::string hbase_ip = mooon::argument::hbase_ip->value(); uint16_t hbase_port = mooon::argument::hbase_port->value(); mooon::net::CThriftClientHelper<hbase::thrift2::THBaseServiceClient> hbase_client(hbase_ip, hbase_port); try { hbase_client.connect(); // 连接hbase thrift2 server fprintf(stdout, "connect %s:%d ok\n", hbase_ip.c_str(), hbase_port); std::string tablename = "test"; // 表名,确保运行之前已创建好 std::string rowkey = "row1"; // 行Key std::string family = "cf1"; // 例族名 std::string columnname = "f1"; // 例名 std::string columnvalue = "value1"; // 例值 // 插入参数设置 std::vector<hbase::thrift2::TColumnValue> columns_value(1); columns_value[0].__set_family(family); columns_value[0].__set_qualifier(columnname); columns_value[0].__set_value(columnvalue); hbase::thrift2::TPut put; put.__set_row(rowkey); put.__set_columnValues(columns_value); hbase_client->put(tablename, put); // 插入,出错抛异常hbase::thrift2::TIOError // 查询参数设置 hbase::thrift2::TGet input; input.__set_row(rowkey); hbase::thrift2::TResult result; // 查询结果存放在这里 hbase_client->get(result, tablename, input); // 查询,出错抛异常hbase::thrift2::TIOError // 显示查询结果 for (int i=0; i<static_cast<int>(result.columnValues.size()); ++i) { const hbase::thrift2::TColumnValue& column_value_ref = result.columnValues[i]; fprintf(stdout, "family[%s]/qualifier[%s]/timestamp[%"PRIu64"]: %s\n", column_value_ref.family.c_str(), column_value_ref.qualifier.c_str(), column_value_ref.timestamp, column_value_ref.value.c_str()); } } catch (hbase::thrift2::TIOError& ex) { fprintf(stderr, "IOError: %s\n", ex.what()); } catch (apache::thrift::transport::TTransportException& ex) { // 如果和服务端的Transport和Protocol不同,这里的错误是“EAGAIN (timed out)” fprintf(stderr, "(%d)%s\n", ex.getType(), ex.what()); } catch (apache::thrift::TApplicationException& ex) { fprintf(stderr, "%s\n", ex.what()); } catch (thrift::TException& ex) { fprintf(stderr, "%s\n", ex.what()); } return 0; } |
如果thrift客户端报如下错误,有可能是因为一次写入的数据太多,导致包过大:
Thrift: Fri Apr 22 17:30:41 2016 TSocket::write_partial() send() <Host: 10.143.136.208 Port: 9090>Connection reset by peer
Thrift: Fri Apr 22 17:30:41 2016 TSocket::write_partial() send() <Host: 10.143.136.208 Port: 9090>Connection reset by peer
HBase & thrift & C++编程的更多相关文章
- python Hbase Thrift pycharm 及引入包
cp -r hbase/ /usr/lib/python2.7/site-packages/ 官方示例子http://code.google.com/p/hbase-thrift/source/bro ...
- hbase thrift 定义
/* * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agre ...
- HBase Thrift过滤语法
摘抄自hbase ref guide 0.94: 在写本文的时候,hbase ref guide已经更新到1.2及2.0了,但是个人感觉Thrift过滤语法部分写得都没有0.94的好,省掉了examp ...
- Hbase使用MapReduce编程导出数据到HDFS
废话少说,直接上代码! package cn.com.oozie.demo; import java.io.IOException; import org.apache.hadoop.conf.C ...
- hbase thrift 访问队列
public class CallQueue implements BlockingQueue<Runnable> { private static Log LOG = LogFact ...
- 搭建HBase+thrift+php环境
http://www.beauty-soft.net/blog/ceiba/hadoop/2013-05-19/644.html http://www.360doc.com/content/11/07 ...
- 北风风hadoop课程体系
课程一.基于Linux操作系统平台下的Java语言开发(20课时)课程简介本套课程主要介绍了Linux系统下的Java环境搭建及最基础的Java语法知识.学习Linux操作系统下Java语言开发的好处 ...
- 使用C#通过Thrift访问HBase
前言 因为项目需要要为客户程序提供C#.Net的HBase访问接口,而HBase并没有提供原生的.Net客户端接口,可以通过启动HBase的Thrift服务来提供多语言支持. Thrift介绍 环境 ...
- 在Azure HDInsight HBase集群中使用Thrift接口
Sun wei Wed, Feb 25 2015 2:17 AM Apache Thrift 是一种可扩展的跨语言服务接口,可以通过内置的代码生成引擎帮助创建跨语言服务类库,Apache HBase ...
随机推荐
- 给Linux内核增加一个系统调用的方法(转)
作者:chenjieb520 给Linux内核增加一个系统调用的方法 为了更加好地调试linux内核,笔者的实验均在mini6410的arm板上运行的.这样做的原因,第一是因为本人是学嵌入式的, ...
- web常用测试点记录
输入框 1.字符型输入框: 单行文本输入框:英文全角.英文半角.数字.空或者空格.特殊字符“~!@#¥%……&*?[]{}”,特别要注意单引号和&符号.如果禁止直接输入特殊字符时,使用 ...
- Azkaban 使用问题及解决
什么是Azkaban Azkaban是一款基于Java编写的任务调度系统 任务调度:有四个任务脚A.B.C.D,其中任务A与任务B可以并行运行,然后任务C依赖任务A和任务B的运行结果,任务D依赖任务C ...
- python + docker, 实现天气数据 从FTP获取以及持久化(四)-- 数据准备
前情提要 在之前的文章里,我们已经掌握从FTP上面下载天气数据然后插入到数据库中. 但是如何将我们已有的数据放到生产环境中呢? 思考 首先,我们先简单的理一理现在的情况. 目前: FTP上面已有半个月 ...
- 2018 Multi-University Training Contest 6-oval-and-rectangle(hdu 6362)-题解
一.题意 求椭圆内接矩形周长的期望. 二.推导过程 已知$c$,容易得出矩形弦长$d=4a\sqrt{1-\frac{c^2}{b^2}}$ 接下来,矩形周长$p=4c+d=4c+4a\sqrt{1- ...
- HDU-3944 DP?(组合数求模)
一.题目链接 http://acm.hdu.edu.cn/showproblem.php?pid=3944 二.题意 给一个巨大的杨辉三角,采用类似DP入门题“数字三角形”的方式求从顶点$(0, 0) ...
- SCN与数据恢复的关系
Oracle内部主要存在以下四种SCN 1.系统检查点(system checkpoint)SCN 每当一个检查点完成时,Oracle就把该检查点对应的SCN记录到控制文件中,可以用以下语句查看当前数 ...
- uwsgi的python2+3多版本共存实操使用virtualenv
1首先,机器需要有python2和python3的可执行环境.确保pip和pip3命令可用.原理就是在哪个环境下安装uwsgi.uwsgi启动的时候,就用的哪个python版本 2安装virtuale ...
- servlet笔记1
Myeclipse关于Servlet项目文件的组织方面,如下: WEB-INF:这个目录名称和位置是固定的,放置在该目录下的文件或目录,对外界来说的封闭的,也就是客户端无法用http的任何方式访问到其 ...
- 设置GO环境变量
linux的设置方法:有4个环境变量需要设置:GOROOT.GOPATH.GOBIN以及PATH.需要设置到某一个profile文件中(~/.bash_profile(单一用户)或/etc/profi ...