Trafodion: Transactional SQL on HBase

HBase上实时分布式事务处理

介绍

HBase的SQL能力一直不足。Phoenix缺乏Join能力,eBay提出的kylin还不够简洁,facebook Presto的HBase连接器还没公开。

那么,Trafodion来了。它在HBase上提供了标准SQL功能,并支持事务OLTP。Trafodion是HP的开源举措。培养在惠普实验室和HP-IT开发一个企业级的SQL上的HBase解决方式。惠普拥有超过20年的积累,针对大数据的事务或业务工作负载,已经开发事务的SQL技术进入数据库technologyand解决方式。
Trafodion给Hadoop的生态系统带来了这一核心技术。要了解很多其它关于起源和项目的名称,请訪问:

www.hp.com/go/trafodion

目标工作负载

 

        Hadoop的工作负载,从长期执行的批处理模式。到跨越例如以下图所看到的的以低延时工作负载。

在右側被视为很适合的Hadoop的三类分析工作,因此也获取了最多的关注。与此相反,定义为“运营”最左边的工作是一类新工作负载。它包含OLTP工作负载,以及交易

这包含使用社交和移动数据的交互和意见结构化和半结构化数据的混合物。

        传统上。这些工作负载已经通过关系处理数据库。可是。关系数据库具有可扩展性的问题。不提供在某些情况下须要的架构灵活性。Hadoop的定位突破了


这些限制。市场有越来越多的兴趣和压力结合Hadoop的优点以显著减少成本,以拥抱这些工作负载在Hadoop的生态系统。

随着业务的工作负载代表的业务需求,它们通常由交易的不断流动,须要低延迟响应时间对于读/写訪问。此外,这些工作负载的特点是:

 

•与ACID兼容保护数据的完整性

•高可用性,并发性和可扩展性

•多结构化数据

•高速变化的数据需求

 

特性

        眼下,还没有现成的开源SQL的上HBase的解决方式能够充分地满足这些要求。

Trafodion提供下面功能以支持Hadoop的事务性工作:

•在多个SQL语句,表和行上ACID兼容的分布式事务保护

•丰富的。全功能的ANSI
SQL语言支持使用ODBC/
JDBC连接接口

•通过利用编译时和执行时优化以提高性能

•Trafodion打算使用并行感知的大型数据集查询优化器以提供Hadoop的的所有功能生态系统:

•通过HBase的列家族提供的架构灵活性结构

•在Hadoop的版本号支持快照功能

•高可用性和灾难恢复支持,复制和快照功能

 

长处

 

        Trafodion提供了一个全功能的HBase解决方式。优化全事务的SQL上的数据库管理系统的事务性的数据保护。

这些功能有助于克服了Hadoop在支持方面事务性工作的弱点。

 

 

使用Trafodion, 客户能获得例如以下优点:

•可以利用SQL专长 &复杂的MapReduce编程现有的事务性应用程序

•无缝支持已经存在的应用程序

•能够开发下一代高可扩展性,实时性事务处理应用

•降低数据延迟降低分析工作负载

也能获得Hadoop生态系统内在的下面优点:

•减少基础设施成本

•大规模的可扩展性和弹性颗粒

•提高数据可用性和灾难恢复保护

架构

Trafodion软件架构由三个不同的层次:client层,SQL数据库服务层,而且所述存储引擎层,例如以下图所看到的。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hpbmFfd29ybGQ=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="" height="236" width="563">

第一层是客户服务。应用程序通过标准的ODBC/JDBC訪问Trafodion数据库。

第二层是Trafodion提供一个关于HBase的顶部模式关系SQL抽象,封装了全部须要管理Trafodion数据库对象服务。这些服务包含连接管理,事务管理,优化计划生成和运行。Trafodion产生并联一个成熟的查询优化器查询计划,而无需复杂的MapReduce编程。

第三层是存储引擎由标准的hadoop服务,包含HBase的,HDFS和动物园管理员。Trafodion数据库对象存储在本地的Hadoop(HBase的/HDFS)数据库构。
Trafodion处理SQL语句的请求映射到本地HBase的透明代表应用程序的调用。

创新的关键

Trafodion的分布式事务管理(DTM)的组成部分提供了从事务的多个SQL语句。多个表或多个行的单一表的多重保护。此外,TrafodionDTM通过多个HBase区域配置利用传统的两阶段提交协议。
对横跨集群的分布式集群提供了保护。DTM提供了支持隐式(自己主动提交)。并明白(BEGIN,COMMIT,ROLLBACK
WORK)事务控制。

Trafodion对不同的事务性工作供了很多编译时和执行时的优化,从对于OLTP类交易的单个訪问到运营报告高度复杂SQL语句。

演示样例用例:OpenCart应用

OpenCartwhich是一个免费的开源电子商务平台,已被改动为运行Trafodion的SQL语句,而不是默认的数据库(MySQL的)的接口。

这是一个非常好的程序,以典型的OLTP工作负载特性。

前两张图显示的是惠普的购物车OpenCart的变化。最后两个图说明了工作量和查询
- 等级分析使用Trafodion查询工作台。

产品说明

惠普已经作为一个开源项目推出了Trafodion。并公布在Apache许可证2.0版下。Trafodion如今能够帮助您评估Trafodion的能力。并開始证明

概念和原型效果。

Trafodion文件和下载包中包括了安装程序和可运行代码,可在www.trafodion.org

Trafodion:Transactional SQL on HBase的更多相关文章

  1. Phoenix(SQL On HBase)安装和使用报告

    一.为什么使用Phoenix二.安装Phoenix2.1 兼容问题?2.2 编译CDH版本的Phoenix2.3 安装Phoenix到CDH环境中三.Phoenix的使用3.1 phoenix的4种调 ...

  2. Phoenix(sql on hbase)简单介绍

    Phoenix(sql on hbase)简单介绍 介绍: Phoenix is a SQL skin over HBase delivered as a client-embedded JDBC d ...

  3. spark sql读hbase

    项目背景 spark sql读hbase据说官网如今在写,但还没稳定,所以我基于hbase-rdd这个项目进行了一个封装,当中会区分是否为2进制,假设是就在配置文件里指定为#b,如long#b,还实用 ...

  4. Phoenix实现用SQL查询HBase

    博客已转移,请借一步说话,http://www.weixuehao.com/archives/111 HBase,一个NoSQL数据库,可存储大量非关系型数据. HBase,可以用HBase shel ...

  5. Phoenix(SQL On HBase)

    1.简介 Phoenix是一个HBase框架,可以通过SQL的方式来操作HBase. Phoenix是构建在HBase上的一个SQL层,是内嵌在HBase中的JDBC驱动,能够让用户使用标准的JDBC ...

  6. Phoenix的安装使用与SQL查询HBase

    一. Phoenix的简介 1. 什么是phoenix 现有hbase的查询工具有很多如:Hive,Tez,Impala,Shark/Spark,Phoenix等.今天主要说Phoenix.phoen ...

  7. 快速理解 Phoenix : SQL on HBASE

    转自:http://blog.csdn.net/colorant/article/details/8645081 ==是什么 == 目标Scope EasyStandard SQL access on ...

  8. hbase单机版安装+phoneix SQL on hbase 单节点安装

    hbase 单机安装部署及phoneix 单机安装 Hbase 下载 (需先配置jdk) https://www.apache.org/dyn/closer.lua/hbase/2.0.1/hbase ...

  9. hive Hbase sql

    Hive和HBase的区别 ​ hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样.在这种情况下,就需要h ...

随机推荐

  1. python3 geohash 导入错误及解决

    方法一: pip3 install  python-geohash 方法二: 1.保证 pip3 install geohash 包 2. 进入包的下载目录 /usr/local/lib/python ...

  2. 20180929 北京大学 人工智能实践:Tensorflow笔记08

    https://www.bilibili.com/video/av22530538/?p=28 ———————————————————————————————————————————————————— ...

  3. caioj 1084 动态规划入门(非常规DP8:任务安排)(取消后效性)

    这道题的难点在于,前面分组的时间会影响到后面的结果 也就是有后效性,这样是不能用dp的 所以我们要想办法取消后效性 那么,我们就可以把影响加上去,也就是当前这一组加上了s 那么就把s对后面的影响全部加 ...

  4. Unity 如何将apk放到Android系统的system里

    有时我们需要用unity开发一款Android的系统软件,很坑,步骤如下: 1.用unity打包出来,签名. 2.用解压工具打开签过名的apk. 3.将lib里面的.so文件复制出来. 4.adb r ...

  5. hdu(1069)——Monkey and Banana(LIS变形)

    题意: 如今给你n个石块,然后它由坐标来表示(x,y,z).可是它能够有不同的方法,也就是说它的三个坐标能够轮换着来的. 石块的数量不限,可是每次都必须保持上底面的长和宽严格递减,然后问你用这些石块所 ...

  6. linux(debian/ubuntu)下连接安卓手机--小米4为例

    更改:如今小米连接Ubuntu等Linux系统,直接改动手机上的连接方式就可以. --------------------------------------------- 因为安卓手机底层就是lin ...

  7. 记一次httpclient Connection reset问题定位

    问题:某业务系统在运行一段时间后,某个API一定概率偶现Connection reset现象. 问题定位: 首先想到的是要本地复现出这个问题,但一直复现不出来. 1.根据线上问题相关日志判断应该是有部 ...

  8. nginx 11个过程

    nginx在处理每一个用户请求时,都是按照若干个不同的阶段依次处理的,与配置文件上的顺序没有关系,详细内容可以阅读<深入理解nginx:模块开发与架构解析>这本书,这里只做简单介绍: 1. ...

  9. js插件---IUpload文件上传插件(包括图片)

    js插件---IUpload文件上传插件(包括图片) 一.总结 一句话总结:上传插件找到真正上传位置的代码,这样就可以知道整个上传插件的逻辑了, 找资料还是github+官方 1.如何在js中找到真正 ...

  10. 如何判断自己IP是内网IP还是外网IP

    tcp/ip协议中,专门保留了三个IP地址区域作为私有地址,其地址范围如下: 10.0.0.0/8:10.0.0.0-10.255.255.255  172.16.0.0/12:172.16.0.0- ...