摘要: HetuEngine作为MRS服务中交互式分析&多源统一SQL引擎,亲自全程体验其如何实现多数据源的跨源跨域分析能力。

本文分享自华为云社区《MRS HetuEngine体验跨源跨域分析【玩转华为云】》,作者:龙哥手记。

HetuEngine作为MRS服务中交互式分析&多源统一SQL引擎,亲自全程体验其如何实现多数据源的跨源跨域分析能力。

一场景完整描述

1.1 首先说明下

1)用户通过登录Windows跳板机,使用SQL开发工具DBeaver连接MRS集群A的HetuEngine进行分析体验
2)跨源分析体验,通过HetuEngine0连接集群内部数据源hive
3)跨源分析体验,通过HetuEngine0连接集群内部数据源hbase
4)跨仓分析体验,通过HetuEngine0连接关系型数据库DWS
5)跨湖分析体验,通过HetuEngine0连接到MRS集群B的HetuEngine1再连接到集群B的数据源hive

二 登录环境并完成准备工作

2.1. 登录跳板机

登录:http://121.13.226.78:18080/ssh/#/

① 用户名:hdc01,
② 密码:请联系现场引导员获取

2.2 登录认证软件MIT Kerberos进行认证

点击右下角的MIT Kerberos,选择Get Tickets输入用户名密码获取Kerberos认证票据

① Principal:admintest@HADOOP.COM,
② Password: Admin12!

2.3 打开SQL编辑器软件DBeaver

2.4 查看已配置好的MRS集群A的HetuEngine连接

点击三角符号打开已配置好的HetuEngine连接

说明:

① dws: 外部dws数据库
② hbase: MRS集群A中的hbase数据源
③ hetu1: 远端MRS集群B的HetuEngine
④ hive: MRS集群A中的hive数据源

三 体验HetuEngine hive查询性能提升

3.1 通过普通JDBC查询MRS集群A中的hive表

选择配置好的hive数据源92-hive - New Connection,右键选择SQL Editor

输入以下SQL语句并查看结果与时间

SELECT * FROM sales h1 WHERE h1.price >30;

3.2. 通过HetuEngine查询MRS集群A中的hive表

选择配置好的hive数据源92-HetuEngine - New Connection,右键选择SQL Editor

输入以下的SQL语句并查看结果和时间

SELECT * FROM hive.default.sales h1 WHERE h1.price >30;

3.3. 结论

通过比较两次查询时间,可以看到HetuEngine会加速查询性能,比普通的hive查询更加快速;

四 体验HetuEngine跨源、跨仓分析能力

4.1 通过HetuEngine对MRS集群A中的HBase进行跨源数据查询

在打开的SQL Editor中输入如下SQL语句查询MRS集群A的HBase数据

SELECT * FROM hbase.default.sales;

4.2 通过HetuEngine对DWS集群C进行跨仓数据查询

在打开的SQL Editor中输入如下SQL语句查询DWS集群C中的维表数据

SELECT * FROM dws.public.person;

4.3. 体验MRS集群A的hive同DWS集群C跨仓分析查询

在打开的SQL Editor中输入如下SQL语句可做MRS集群A的hive与DWS集群C的跨仓数据分析

SELECT h1.id,h1.price, h1.ops_region,h1.ops_user_id,d1.sex,d1.age  FROM hive.default.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id WHERE h1.price >30;

4.4 体验MRS集群A的hbase同DWS集群C跨仓分析查询

在打开的SQL Editor中输入如下SQL语句可做MRS集群A的hbase与DWS集群C的跨仓数据分析

SELECT  h1.id,h1.price, h1.ops_region,h1.ops_user_id,d1.sex,d1.age FROM hbase.default.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id WHERE h1.price >50;

4.5 下结论

出于管理和信息收集的需要,企业内部会存储海量数据,包括数目众多的各种数据库、数据仓库等,此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境,导致跨源查询开发成本高,跨源复杂查询耗时长。HetuEngine提供了统一标准SQL实现跨源协同分析,简化跨源分析操作;

五 体验HetuEngine跨湖分析能力

5.1 将MRS集群A的HetuEngine连接到MRS集群B的HetuEngine进行跨湖查询

在打开的SQL Editor中输入如下SQL语句可做MRS集群B中HetuEngine的hive跨湖查询

SELECT * FROM  hetu1.hetu1_hive.sales;

5.2 体验MRS集群B的HetuEngine同DWS集群C跨湖分析查询

打开SQL Editor输入如下SQL语句可做MRS集群B中HetuEngine的hive同DWS集群C的跨湖查询

SELECT  h1.id,h1.price, h1.ops_region,h1.ops_user_id,d1.sex,d1.age   FROM  hetu1.hetu1_hive.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id;

5.3 结论

HetuEngine提供统一标准SQL对分布于多个地域(或数据中心)的多种数据源实现高效访问,屏蔽数据在结构、存储及地域上的差异,实现数据与应用的解耦。

点击关注,第一时间了解华为云新鲜技术~

一文带你体验MRS HetuEngine如何实现跨源跨域分析的更多相关文章

  1. 没用过消息队列?一文带你体验RabbitMQ收发消息

    人生终将是场单人旅途,孤独之前是迷茫,孤独过后是成长. 楔子 先给大家说声抱歉,最近一周都没有发文,有一些比较要紧重要的事需要处理. 今天正好得空,本来说准备写SpringIOC相关的东西,但是发现想 ...

  2. Istio是啥?一文带你彻底了解!

    原标题:Istio是啥?一文带你彻底了解! " 如果你比较关注新兴技术的话,那么很可能在不同的地方听说过 Istio,并且知道它和 Service Mesh 有着牵扯. 这篇文章可以作为了解 ...

  3. 一文带您了解5G的价值与应用

    一文带您了解5G的价值与应用 5G最有趣的一点是:大多数产品都是先有明确应用场景而后千呼万唤始出来.而5G则不同,即将到来的5G不仅再一次印证了科学技术是第一生产力还给不少用户带来了迷茫——我们为什么 ...

  4. 【转帖】Istio是啥?一文带你彻底了解!

    Istio是啥?一文带你彻底了解! http://www.sohu.com/a/270131876_463994 原始位置来源: https://cizixs.com 如果你比较关注新兴技术的话,那么 ...

  5. 手把手带你体验鸿蒙 harmonyOS

    wNlRGd.png 前言 本文已经收录到我的 Github 个人博客,欢迎大佬们光临寒舍: 我的 GIthub 博客 学习导图 image.png 一.为什么要尝鲜 harmonyos? wNlfx ...

  6. 一文带你看遍 JDK9~14 的重要新特性!

    Java9 发布于 2017 年 9 月 21 日 .作为 Java8 之后 3 年半才发布的新版本,Java 9 带 来了很多重大的变化其中最重要的改动是 Java 平台模块系统的引入,其他还有诸如 ...

  7. 一文带你了解elasticsearch

    一文带你了解elasticsearch cxf2102100人评论160人阅读2019-07-02 21:31:36   elasticsearch es基本概念 es术语介绍 文档Document ...

  8. 带你体验Android自定义圆形刻度罗盘 仪表盘 实现指针动态改变

    带你体验Android自定义圆形刻度罗盘 仪表盘 实现指针动态改变 转 https://blog.csdn.net/qq_30993595/article/details/78915115   近期有 ...

  9. 不需内测账号,带你体验微信小程序完整开发过程

    不需内测账号,带你体验微信小程序完整开发过程 2016年09月24日 - 作者: SwiftCafe 微信小程序还没正式发布就已经迅速成为大家讨论的焦点,那么大家可能觉得只有收到内测邀请才能体验小程序 ...

随机推荐

  1. 手写一个虚拟DOM库,彻底让你理解diff算法

    所谓虚拟DOM就是用js对象来描述真实DOM,它相对于原生DOM更加轻量,因为真正的DOM对象附带有非常多的属性,另外配合虚拟DOM的diff算法,能以最少的操作来更新DOM,除此之外,也能让Vue和 ...

  2. oracle备份数据库数据及导入数据库

    1.oracle数据库备份和导入 bat 脚本 scott oracle数据库用户名称 123456 数据库scott用户下的密码 192.168.124.8 本电脑IP orcl 为oracle库 ...

  3. go-zero微服务实战系列(八、如何处理每秒上万次的下单请求)

    在前几篇的文章中,我们花了很大的篇幅介绍如何利用缓存优化系统的读性能,究其原因在于我们的产品大多是一个读多写少的场景,尤其是在产品的初期,可能多数的用户只是过来查看商品,真正下单的用户非常少.但随着业 ...

  4. CF487E Tourists 题解

    题目链接 思路分析 看到这道题首先想到的此题的树上版本.(不就是树链剖分的板子题么?) 但是此题是图上的两点间的走法,自然要想到是圆方树. 我们先无脑构建出圆方树. 我们先猜测:设后加入的节点权值为 ...

  5. 攻防世界MISC进阶区---41-45

    41.Get-the-key.txt 得到无类型文件,扔进kali中,strings一下,得到了一堆像flag的内容 扔进010 Editor中,搜索关键字,发现一堆文件,改后缀为zip 打开,直接得 ...

  6. Windows 远程连接后,自动断开,所有程序都自动关闭(待验证,待更新)

    win+r输入regedit打开注册表编辑SecurityLayer,将值改为2 计算机\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Ter ...

  7. 解决linuxdeployqt报错——系统版本过新的问题

    参考文章:https://icode.best/i/45016240865860 目前测试有效 大概你会跳转到这个议题 issues#340 显示这样类似的报错 linuxdeployqt 5 (co ...

  8. freeswitch的话单模块

    概述 最近因为业务需要,在看freeswitch中话单相关的一些模块. 在voip的使用过程中,话单是重要的基础模块,涉及到计费和问题查找. 呼叫话单最重要的一点是稳定,不能有错误或遗漏. 本章对fs ...

  9. Wpf 多指应用开发解析

    1  首先分析多指事件与单指事件,以及执行顺序 2  事件阻断 订阅多指事件后,在TouchDown时 采用e.handle = true,阻断多指事件,或在ManipulationStarting. ...

  10. 音响音箱/恒温壶/电量显示/电子数字时钟等LED数码管显示驱动IC-VK1640B 8段12位/12段8位显示

    市面上最常用的数码管为七段/八段显示,八段数码管比七段数码管多一个发光二极管单元(比七段数码管多一个点),又按能显示多少个"8"可分为1位.2位.4位等等.数码管又分为共阳极驱动/ ...