1. 概述

  Apache Ranger是大数据领域的一个集中式安全管理框架,目的是通过制定策略(policies)实现对Hadoop组件的集中式安全管理。用户可以通过Ranger实现对集群中数据的安全访问。

2. Ranger内部组件

  Ranger由三个模块组成:Ranger内部组件、依赖组件、扩展性组件。

2.1 内部组件

  包含的内部组件如下:

  • Ranger Admin 用户管理策略,提供WebUI和RestFul接口
  • Ranger UserSync 用于将Unix系统或LDAP用户/组同步到RangerAdmin
  • Ranger TagSync 同步Atlas中的Tag信息,基于标签的权限管理,当一个用户的请求涉及到多个应用系统中的多个资源的权限时,可以通过只配置这些资源的tag方便快速的授权
  • Ranger KMS 对hadoop KMS的策略管理和密钥管理

  注:Apache atlas 是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。  

2.2 依赖组件

  • JDK8 用于运行RangerAdmin、RangerKMS
  • Python2.7 用于Ranger自动化安装
  • Git 用于Ranger编译
  • Maven3.6 用于Ranger编译
  • RDMS 用于存储授权策略,存储Ranger用户/组,存储审核日志
  • Solr(可选) 存储日志
  • Kerberos(可选) 确保所有请求都被认证

2.3 扩展性组件

  HDFSHBASEHIVEYARN、KNOX、STORM、SOLR、KAFKA、NIFI、KYLIN、NIFI-REGISTRY、SQOOP、ATLAS、ELASTICSEARCH、PRESTO、OZONE

2.4 总体架构

3. Ranger编译

  Ranger官网源码包版本是1.2.0,不提供二进制安装包,故需要maven编译。目前测试使用的版本为:

ranger版本 2.0.0
hadoop版本 2.7.3
hbase版本  
hive版本   2.1.0         
postgres版本       11
python版本 2.7

3.1 官网下载源码包

wget http://mirrors.tuna.tsinghua.edu.cn/apache/ranger/1.2.0/apache-ranger-1.2.0.tar.gz

  

3.2 下载maven

  编译安装需要使用到maven,下载如下:

wget http://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/3.6.2/binaries/apache-maven-3.6.2-bin.tar.gz

  解压,并添加环境变量,同时修改maven的Java堆内存最大值,避免编译内存溢出

# tar -zxvf apache-maven-3.6.2-bin.tar.gz

# vim /etc/bashrc
export MAVEN_HOME=/opt/app/apache-maven-3.6.2
export PATH=$PATH:$MAVEN_HOME/bin MAVEN_OPTS=-Xmx2048m
export JAVA_HOME MAVEN_HOME MAVEN_OPTS JAVA_BIN PATH CLASSPATH

修改maven源为阿里源或其他源

# pwd
/opt/app/apache-maven-3.6.2/conf
# vim settings.xml
<mirrors>
<mirror>
<id>nexus-aliyun</id>
<mirrorOf>central</mirrorOf>
<name>Nexus aliyun</name>
<url>http://maven.aliyun.com/nexus/content/groups/public</url>
</mirror> <mirror>
<id>CN</id>
<name>OSChina Central</name>
<url>http://maven.oschina.net/content/groups/public/</url>
<mirrorOf>central</mirrorOf>
</mirror> <mirror>
<id>alimaven</id>
<mirrorOf>central</mirrorOf>
<name>aliyun maven</name>
<url>https://maven.aliyun.com/nexus/content/repositories/central/</url>
</mirror> <mirror>
<id>jboss-public-repository-group</id>
<mirrorOf>central</mirrorOf>
<name>JBoss Public Repository Group</name>
<url>https://repository.jboss.org/nexus/content/groups/public</url>
</mirror>
</mirrors>

3.3 安装git

  编译ranger依赖git,需要安装git

yum -y install git

3.4 安装python2

  编译机器上的python必须为python2,不能是python3,否则编译时会报错

yum -y install python2

3.5 编译Ranger

  首次编译ranger,需要时间比较长,时间主要用于maven下载相应的依赖包,时间快慢取决于机器网络带宽。

# pwd
/opt/app/apache-ranger-1.2.0
# mvn clean compile package assembly:assembly install -DskipTests -Drat.skip=true

编译完成如下:

编译完成后,在当前目录下的target会生成相应的tar包文件,如下:

3.6 编译Ranger遇到的问题

3.6.1 exec failonerror="true" executable="python

  问题描述:

[INFO] ------------------------------------------------------------------------
[ERROR] Failed to execute goal org.apache.maven.plugins:maven-antrun-plugin:1.7:run (generate-version-annotation) on project ranger-util: An Ant BuildException has occured: exec returned: 1
[ERROR] around Ant part ...<exec failonerror="true" executable="python">... @ 4:48 in /data/apache-ranger-1.0.0/ranger-util/target/antrun/build-main.xml
[ERROR] -> [Help 1]
org.apache.maven.lifecycle.LifecycleExecutionException: Failed to execute goal org.apache.maven.plugins:maven-antrun-plugin:1.7:run (generate-version-annotation) on project ranger-util: An Ant BuildException has occured: exec returned: 1
around Ant part ...<exec failonerror="true" executable="python">... @ 4:48 in /data/apache-ranger-1.0.0/ranger-util/target/antrun/build-main.xml

如图:

解决方法:这里需要检查是否编译的机器是否安装了git,安装的是否是python2,不能安装python3。

安装git
$ yum -y install git 在shell界面直接运行python,看是python2或python3。python3则需要卸载
$ yum-y remove python3 没有python2则需要安装
$ yum -y install python2

4. Ranger-admin安装部署

  安装ranger-admin的机器可以不在Hadoop集群内部,可以是随便一台。

4.1 准备

4.1.1 检测是否安装python2

# python
Python 2.7.5 (default, Aug 4 2017, 00:39:18)
[GCC 4.8.5 20150623 (Red Hat 4.8.5-16)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> 如果没有检测到python2,则执行下面的命令
# yum -y install python

4.1.2 rpm安装Mysql 5.7

 具体mysql rpm安装步骤可以百度

4.2 解压ranger-admin软件包

# pwd
/opt/app/apache-ranger-2.0.0/target
# tar -zxvf ranger-2.0.0-admin.tar.gz

4.3 修改install.properties文件

# pwd
/opt/app/apache-ranger-2.0.0/target/ranger-2.0.0-admin
# vim install.properties

修改install.properties文件,这里使用的数据库是postgres,不安装solr服务

1)数据库配置
DB_FLAVOR=MYSQL #指明使用数据库类型
SQL_CONNECTOR_JAR=/opt/software/mysql-connector-java-8.0.22/mysql-connector-java-8.0.22.jar #数据库连接驱动
db_root_user=root #数据库root用户名
db_root_password=123456 #数据库主机
db_host=192.168.56.102:3306 #数据库密码

db_ssl_enabled=false
  db_ssl_required=false
  db_ssl_verifyServerCertificate=false

  db_ssl_auth_type=2-way
  javax_net_ssl_keyStore=
  javax_net_ssl_keyStorePassword=
  javax_net_ssl_trustStore=
  javax_net_ssl_trustStorePassword=

# 以下三个属性是用于设置ranger数据库的
db_name=ranger #数据库名
db_user=root #管理该数据库用户 直接填root账号就行
db_password=123456 #密码 # 不需要保存,为空,否则生成的数据库密码为'_'
cred_keystore_filename= 2) 审计日志, 如果没有安装solr,对应的属性值为空即可
audit_store= audit_solr_urls=
audit_solr_user=
audit_solr_password=
audit_solr_zookeepers= 3)策略管理配置,配置ip和端口,默认即可
policymgr_external_url=http://192.168.56.102:6080 4) 配置hadoop集群的core-site.xml文件,把core-site.xml文件拷贝到该目录
hadoop_conf=/etc/hadoop/conf

5) 配置unix用户,用root就可以了,因为我用默认的ranger用户好像出错了
unix_user=root
unix_solr_pwd=123456
unix_group=root
6) rangerAdmin、rangerTagSync、rangerUsersync、keyadmin密码配置。默认为空,可以不配,对应的内部组件该属性也要为空
rangerAdmin_password=
rangerTagsync_password=
rangerUsersync_password=
keyadmin_password=

4.4 初始化ranger-admin

# pwd
/opt/frame-tools/apache-ranger-2.0.0/target/ranger-2.0.0-admin
# ./setup.sh

初始化结果如下则成功:

接着,运行set_globals.sh

# ./set_globals.sh
usermod: no changes
[2019/11/27 21:54:32]: [I] Soft linking /etc/ranger/admin/conf to ews/webapp/WEB-INF/classes/conf

4.5 启动ranger-admin

# ranger-admin start
或者
# ./ews/ranger-admin-services.sh start

Ranger的默认端口是6080,如图,则表明程序正常启动

查看Ranger Admin Server运行的日志情况,日志路径默认为 ews/log , 软链接到 /var/log/admin ,如下:

Ranger Admin Server的具体配置文件为 ranger-admin-site.xml ,如下:

浏览器连接测试:http://192.168.1.10:6080,登录界面用户名和密码为:admin/admin,登录进去界面如下:

5. Ranger-usersync安装部署

5.1 解压ranger-usersync软件包

# pwd
/opt/frame-tools/apache-ranger-2.0.0/target
# tar -zxvf ranger-2.0.0-usersync.tar.gz

5.2 修改install.property文件

# pwd
/opt/app/apache-ranger-2.0.0/target/ranger-2.0.0-usersync
# vim install.properties 配置ranger admin的地址
POLICY_MGR_URL = http://localhost:6080 同步源系统类型
SYNC_SOURCE = unix 同步间隔时间
SYNC_INTERVAL = 1 usersync程序运行的用户和用户组
unix_user=usersync
unix_group=usersync 修改rangerusersync用户的密码。注意,此密码应与Ranger admin中install.properties的rangerusersync_password相同。此处可以为空,同样Ranger admin的也要为空
rangerUsersync_password= 配置hadoop的core-site.xml路径
hadoop_conf=/etc/hadoop/conf 配置usersync的log路径
logdir=logs

5.3 初始化ranger-usersync

# pwd
/opt/app/apache-ranger-2.0.0/target/ranger-2.0.0-usersync
# ./setup.sh

执行结果:

5.4 启动ranger-usersync

# ranger-usersync start

# pwd
/opt/frame-tools/apache-ranger-2.0.0/target/ranger-2.0.0-usersync
# ./ranger-usersync-services.sh start

验证是否安装成功,如图则成功:

总结

【参考资料】

https://yaooqinn.github.io/spark-authorizer/docs/install_plugin.html

https://github.com/yaooqinn/spark-ranger

https://blog.csdn.net/sudaxhh/article/details/52135184

https://blog.csdn.net/w609392362/article/details/89959445

https://www.cnblogs.com/xiaolang8762400/p/7449489.html

https://help.aliyun.com/document_detail/66411.html

https://www.cnblogs.com/yjt1993/p/11837398.html

https://www.lagou.com/lgeduarticle/7838.html

https://www.jianshu.com/p/d0bf6e77bb8f

https://www.cnblogs.com/taojietaoge/p/10808534.html

https://www.cnblogs.com/jpfss/p/11021948.html Linux下LDAP统一认证解决方案

Apache Ranger 编译安装部署的更多相关文章

  1. RHEL6 最小化系统 编译安装部署zabbix (mysql)

    RHEL6 最小化系统 编译安装部署zabbix (mysql)官方说明详细见:https://www.zabbix.com/documentation/4.0/manual/installation ...

  2. Apache Mesos1.0.1 编译安装部署教程(ubuntu)

    参考资料 官方文档:http://mesos.apache.org/documentation 中文翻译:http://mesos.mydoc.io/ GitHub:https://github.co ...

  3. 大数据安全利器ranger 编译安装

    ranger大数据领域的一个集中式安全管理框架,它可以对诸如hdfs.hive.kafka.storm等组件进行细粒度的权限控制.本文将介绍部署过程 1.  部署准备 ranger:    进入apa ...

  4. Apache的编译安装error: APR not found. Please read the documentation

    提示configure: error: APR not found. Please read the documentation. 经网上查阅资料才知道这是Apache的关联软件 在apr.apach ...

  5. Centos7.4上Apache(http)编译安装

    前提:1.这个centos操作系统能上网 2.yum 安装apr,apr-util,zlib-devel,groupinstall  Development  Tools,gcc 1.在apache的 ...

  6. Apache 的编译安装

    直接看步骤: 1.安装必备环境:gcc.pcre .................................. 2.安装apr.apr-util 3.解压编译安装Apache: ./confi ...

  7. Centos7:yum安装apache,编译安装php5.6,不解析php的解决方法

    首先,说一下问题发生的场景: 因为懒,所以用 yum 安装 apache ,因为 centos 的源自带 php 5.4 不能符合环境要求,而不想用其他源,所以选择源码编译安装 php 5.6 安装完 ...

  8. 【Swoole应用教程】一、Swoole扩展的编译安装部署

    介绍swoole扩展,从源码的下载,环境依赖,编译参数配置,常见编译问题,安装,配置等内容.期间还会介绍: Linux发行版本的选择 不同版本内核的差异 gcc/g++/clang 3种编译器介绍 a ...

  9. Windows下swoole扩展的编译安装部署

    1. 到cygwin官网下载cygwin. 官网地址:https://www.cygwin.com/ 2. 打开下载好的cygwin安装包,开始安装cygwin. 选择cygwin的安装目录(这个同时 ...

随机推荐

  1. 多线程概述(好处和弊端)(jvm多线程解析、主线程运行示例)

    1 package multithread; 2 3 /* 4 * 进程:正在进行中的程序(直译). 5 * 6 * 线程:就是进程中一个负责程序执行的控制单元(执行路径). 7 * 一个进程中可以多 ...

  2. 磁盘sda,hda,sda1,并行,串行

    1.sd,hd表示硬盘, a表示第一块盘, 1表示硬盘上的第一个分区 2.sd是Serial ATA Disk ,表示硬盘是scsi,SATA串行接口 hd是 hard disk,表示硬盘是IDE(也 ...

  3. IDEA出现Cannot resolve symbol “xxx“(无法解析符号)的解决办法

    1,File->Invalidate Caches/Restart 清除缓存并重启 idea 2,检查pom文件中的依赖关系是否正确 3,maven -> Reimport 4,打开pro ...

  4. Protobuf 动态加载 .pb 文件并操作 Message

    之前写了<Protobuf 动态加载 .proto 文件并操作 Message>.除了直接读取 .proto 文件之外,还有一种类似的方法.先把 .proto 文件编译成 .pb 文件,再 ...

  5. django之“static”全局设置

    1. 首先要配置静态文件路径(这些文件不输入任何app):. # 设置静态文件读取路径(这些静态文件不属于任何app) STATICFILES_DIRS = [ os.path.join(BASE_D ...

  6. 「NOI十联测」深邃

    「NOI十联测」深邃 要使得最大的连通块最小,显然先二分答案. 先固定1结点为根. 对于一个果实,显然是先处理子树中未分配的点,再向外延伸. 每个结点记录一个\(si[]\),表示子树中未分配的点数, ...

  7. 「NOI十联测」黑暗

    「NOI十联测」黑暗 \(n\) 个点的无向图,每条边都可能存在,一个图的权值是连通块个数的 \(m\) 次方,求所有可能的图的权值和.(n≤30000,m≤15) 令\(ans[n][m]\)为n个 ...

  8. 后缀自动机 (SAM)

    后缀自动机 定义 定义 SAM 为一个有限状态自动机,接受且仅接受 \(S\) 的一个后缀. 同时,SAM 是这样的自动机中最小的那个,其中状态数至多为 \(2n - 1\),转移数至多为 \(3n ...

  9. BOM与DOM之DOM操作

    目录 一:DOM操作 1.DOM介绍 2.DOM标准规定HTML文档中的每个成分都是一个节点(node): 3.DOM操作需要用关键字 二:查找标签 1.id查找 类查找 标签查找(直接查找) 2.i ...

  10. onerror事件捕获网页中的错误

    转载请注明来源:https://www.cnblogs.com/hookjc/ <html><head><script type="text/javascrip ...