【企业流行新数仓】Day03:SuperSet图表,Ranger权限、脱敏、行级别过滤,Atlas元数据、查询和查看全表/字段血缘依赖,Zabbix告警
一、SuperSet-图表展示
1、概念
(1)概念
通过dashboard(仪表盘)对图表中的数据进行展示
BI工具:根据配置的要求,进行数据源的配置即可
是准商业级别的BI web应用
(2)原理
通过UI界面,向Flask编写的web应用发送请求----> web应用处理请求,对接数据源摄取数据------->响应数据到浏览器------>NVD3进行可视化
集合NVD3(echarts)实现图标的可视化
(3)应用场景
对接常用的大数据分析工具,如Hive、Kylin、Druid等,且支持自定义仪表盘,故可作为数仓的可视化工具
2、安装
安装miniconda
创建python3.6环境
conda环境中环境中安装superset
3、术语介绍
chart:图表
dashboard:仪表盘(定制图标的样式等待)
4、使用
(1)MySQL
Sources/Databases配置、Table配置
配置仪表盘、创建并配置图表、添加到仪表盘(可以调整仪表盘刷新时间)
(2)各种图表
柱状图、折线图、饼图
透视图、大数、趋势大数
二、Ranger--权限管理
1、概述
在Hadoop平台上进行监控,启用服务,数据安全访问管理的框架
实现多用户环境中的安全管理
核心是web应用程序,也成为RangerAdmin模块
2、安装
创建Ranger存储的数据库、安装RangerAdmin
启动访问并登录web
安装 RangerUsersync(实现Linux系统中用户和组信息同步到数据库),root用户启动服务
安装Ranger Hive-plugin:对使用jdbc方式访问hive的请求进行权限管理,hive-cli并不受限制
配置hive插件
3、使用Ranger对Hive进行权限管理
查看默认的访问策略,admin拥有权限,其他用户不能访问
为用户配置权限Add New Policy
4、脱敏操作--点击Masing标签
限制用户对某一列的访问
5、行级别过滤--选择Row Level Filter标签
只允许查询emp表中job类型为SALESMAN的用户信息
将表中的数据进行条件过滤后再暴露给用户
三、Atlas:元数据管理
1、概述
(1)概念
为组织提供开放式元数据管理和治理功能
对数据资产进行分类和管理,提供围绕这些数据资产的协作功能
(2)功能
如insert overwrite、query等
建立表与表之间的血缘依赖、字段与字段之间的血缘依赖
(3)原理
支持Hive、HBASE、sqoop、storm、kafka提取元数据

2、安装及使用
(1)安装
集成外部的HBase + Solr(部署Solr的Cloud模式,并编写群起脚本)
(2)集成外部框架-修改配置
Atlas集成Hbase
Atlas集成Solr
Atlas集成Kafka
Atlas其他配置
Atlas集成Hive
(3)集群启动
bin/solr start
(4)导入hive元数据
bin/import-hive.sh
3、界面查看
(1)查看基本信息
查询Hive库
查询Hive进程
查询Hive表
查询Hive列
筛选查询条件
查看具有血缘依赖列的数据
(2)查看血缘依赖关系-点击Lineage
第一次查看表血缘依赖
第一次查看字段血缘依赖
启动GMV全流程任务:启动executor服务器和web服务器并上传任务
4、编译源码
四、Zabbix:监控健康性并报警
1、入门
(1)概述
监控网络参数以及服务器健康性和完整性,使用灵活的通知机制
对事件配置邮件告警
(2)基础架构
agent部署在监控目标上
server收集监控数据

2、Server节点安装
(1)集群规划
|
节点 |
服务 |
|
hadoop102 |
zabbix-server、zabbix-agent、MySQL、zabbix-web |
|
hadoop103 |
zabbix-agent |
|
hadoop104 |
zabbix-agent |
(2)准备工作
关闭防火墙iptables
关闭SELinux,重启服务器sudo reboot
(3)zabbix编译及安装
创建zabbix用户和用户组
上传压缩包
创建对应的数据库,导入zabbix提供的SQL脚本
上传并安装编译环境
编译安装sudo make install
修改server/agent配置文件
编写系统服务脚本
(4)部署Zabbix-web
部署httpd
安装php5.6
(5)Zabbix启动
启动Zabbix-Server
启动Zabbix-Agent
启动Zabbix-Web(httpd)
Zabbix登录(配置数据库连接信息)
3、Zabbix安装之agent节点
创建用户
编译环境准备gcc-c++
解压编译并安装make install
修改配置
编辑系统服务脚本
启动Zabbix-Agent
4、使用
(1)术语
Host(主机)、Item(监控项)、Trigger(触发器,一个逻辑表达式)、Action(动作)
(2)实战
创建Host
创建Item(DataNode)
创建Trigger,添加表达式
创建Media type(绑定email)
【企业流行新数仓】Day03:SuperSet图表,Ranger权限、脱敏、行级别过滤,Atlas元数据、查询和查看全表/字段血缘依赖,Zabbix告警的更多相关文章
- 看SparkSql如何支撑企业数仓
企业级数仓架构设计与选型的时候需要从开发的便利性.生态.解耦程度.性能. 安全这几个纬度思考.本文作者:惊帆 来自于数据平台 EMR 团队 前言 Apache Hive 经过多年的发展,目前基本已经成 ...
- 国产开源优秀新一代MPP数据库StarRocks入门之旅-数仓新利器(上)
概述 背景 Apache Doris官方地址 https://doris.apache.org/ Apache Doris GitHub源码地址 https://github.com/apache/i ...
- 【云+社区极客说】新一代大数据技术:构建PB级云端数仓实践
本文来自腾讯云技术沙龙,本次沙龙主题为构建PB级云端数仓实践 在现代社会中,随着4G和光纤网络的普及.智能终端更清晰的摄像头和更灵敏的传感器.物联网设备入网等等而产生的数据,导致了PB级储存的需求加大 ...
- HAWQ取代传统数仓实践(十九)——OLAP
一.OLAP简介 1. 概念 OLAP是英文是On-Line Analytical Processing的缩写,意为联机分析处理.此概念最早由关系数据库之父E.F.Codd于1993年提出.OLAP允 ...
- CarbonData:大数据融合数仓新一代引擎
[摘要] CarbonData将存储和计算逻辑分离,通过索引技术让存储和计算物理上更接近,提升CPU和IO效率,实现超高性能的大数据分析.以CarbonData为融合数仓的大数据解决方案,为金融转型打 ...
- Greenplum数仓监控解决方案(开源版本)
Greenplum监控解决方案 基于Prometheus+Grafana+greenplum_exporter+node_exporter实现 关联图 一.基本概念 1.Prometheus Pr ...
- 数仓建模—OneID
今天是我在上海租房的小区被封的第三天,由于我的大意,没有屯吃的,外卖今天完全点不到了,中午的时候我找到了一包快过期的肉松饼,才补充了1000焦耳的能量.但是中午去做核酸的时候,我感觉走路有点不稳,我看 ...
- 数仓建设 | ODS、DWD、DWM等理论实战(好文收藏)
本文目录: 一.数据流向 二.应用示例 三.何为数仓DW 四.为何要分层 五.数据分层 六.数据集市 七.问题总结 导读 数仓在建设过程中,对数据的组织管理上,不仅要根据业务进行纵向的主题域划分,还需 ...
- 数仓建模—建模工具PdMan(CHINER)介绍
数据仓库系列文章(持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模-宽表的设计 数仓建模-指标体系 数据仓库之拉链表 数仓-数据集成 数仓-数据集市 数仓-商业智能系统 数仓-埋 ...
- 技术专家说 | 如何基于 Spark 和 Z-Order 实现企业级离线数仓降本提效?
[点击了解更多大数据知识] 市场的变幻,政策的完善,技术的革新--种种因素让我们面对太多的挑战,这仍需我们不断探索.克服. 今年,网易数帆将持续推出新栏目「金融专家说」「技术专家说」「产品专家说」等, ...
随机推荐
- Elastic: 创建一个 Elastic 邮件警报 - 7.7 发行版
文章转载自:https://blog.csdn.net/UbuntuTouch/article/details/106185321 总结: 1.elastic 免费版只有发送警报到一个索引或者到Ser ...
- Acwing 正方形数组的数目(dfs去重)
解题代码 #include<iostream> #include<algorithm> #include<cmath> using namespace std; # ...
- while循环控制
基本语法 例(输出五句hello): int i = 1; //循环变量初始化 while(i<=5){ //循环条件 printf("\n hello!"); //循环语句 ...
- 洛谷P1253 [yLOI2018] 扶苏的问题 (线段树)
一道用来练习打标记的好题. 对于区间加和区间赋值两个操作分别用两个标记,分析如何打标记并下传标记(还是比较好分析的). 坑点:查询操作时,我一开始把ans设为-0x3f3f3f3f(调试了好久才发现) ...
- P1896 [SCOI2005] 互不侵犯 方法记录
原题链接 [SCOI2005] 互不侵犯 题目描述 在N×N的棋盘里面放K个国王,使他们互不攻击,共有多少种摆放方案.国王能攻击到它上下左右,以及左上左下右上右下八个方向上附近的各一个格子,共8个格子 ...
- mongodb基础整理篇————副本概念篇[外篇]
前言 副本集整理. 开始逐步把mongodb博客补齐了. 正文 什么是副本集 副本集是一组服务器,其中一个是用于处理写入操作的主节点,还有多个用于保存主节点的数据副本的从节点. 如果主节点崩溃了,则从 ...
- 前端框架Vue------>第二天学习(1)插槽
欢迎加入刚建立的社区:http://t.csdn.cn/Q52km 加入社区的好处: 1.专栏更加明确.便于学习 2.覆盖的知识点更多.便于发散学习 3.大家共同学习进步 3.不定时的发现金红包(不多 ...
- Invalid bound statement (not found): com.zheng.mapper.UserMapper.login
错误的原因:mybatis中dao接口与mapper配置文件在做映射绑定的时候出现问题,简单说,就是接口与xml要么是找不到,要么是找到了却匹配不到. mapper接口开发规范 1.Mapper.xm ...
- oracle expdp/exp ora-600/ora-39014报错处理
在一次数据迁移的时候,expdp导出报错,错误信息如下: 版本号:11.2.0.1 没有打PSU,查看报错的aler部分日志如下: 其中的某一些trc日志文件截图: Trace file d:\ora ...
- 开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录
前言 以前在 github 上自己开源了一些项目.碍于技术与精力,大部分项目都是 java 实现的. 这对于非 java 开发者而言很不友好,对于不会编程的用户更加不友好. 为了让更多的人可以使用到这 ...