2-10 就业课(2.0)-oozie:12、cm环境搭建的基础环境准备
8、clouderaManager5.14.0环境安装搭建
Cloudera Manager是cloudera公司提供的一种大数据的解决方案,可以通过ClouderaManager管理界面来对我们的集群进行安装和操作,提供了良好的UI界面交互,使得我们管理集群不用熟悉任何的linux技术,只需要通过网页浏览器就可以实现我们的集群的操作和管理,让我们使用和管理集群更加的方便。
1、ClouderaManager整体架构

Cloudera Manager的核心是Cloudera Manager Server。Server托管Admin Console Web Server和应用程序逻辑。它负责安装软件、配置、启动和停止服务以及管理运行服务的群集。
解释:
- Agent:安装在每台主机上。它负责启动和停止进程,解压缩配置,触发安装和监控主机
- Management Service:执行各种监控、报警和报告功能的一组角色的服务。
- Database:存储配置和监控信息
- Cloudera Repository:可供Cloudera Manager分配的软件的存储库(repo库)
- Client:用于与服务器进行交互的接口:
- Admin Console:管理员控制台
- API:开发人员使用
API可以创建自定义的Cloudera Manager应用程序
Cloudera Management
Service
Cloudera Management Service 可作为一组角色实施各种管理功能
- Activity Monitor:收集有关服务运行的活动的信息
- Host Monitor:收集有关主机的运行状况和指标信息
- Service Monitor:收集有关服务的运行状况和指标信息
- Event Server:聚合组件的事件并将其用于警报和搜索
- Alert Publisher :为特定类型的事件生成和提供警报
- Reports Manager:生成图表报告,它提供用户、用户组的目录的磁盘使用率、磁盘、io等历史视图
信号检测
默认情况下,Agent 每隔 15 秒向 Cloudera Manager Server
发送一次检测信号。但是,为了减少用户延迟,在状态变化时会提高频率。
状态管理
- 模型状态捕获什么进程应在何处运行以及具有什么配置
- 运行时状态是哪些进程正在何处运行以及正在执行哪些命令(例如,重新平衡
HDFS 或执行备份/灾难恢复计划或滚动升级或停止) - 当您更新配置(例如Hue Server Web 端口)时,您即更新了模型状态。但是,如果 Hue 在更新时正在运行,则它仍将使用旧端口。当出现这种不匹配情况时,角色会标记为具有”过时的配置”。要重新同步,您需重启角色(这会触发重新生成配置和重启进程)
- 特殊情况如果要加入一些clouder manager控制台没有的属性时候都在高级里面嵌入
服务器和客户端配置
- 如使用HDFS,文件
/etc/hadoop/conf/hdfs-site.xml 仅包含与 HDFS 客户端相关的配置 - 而 HDFS 角色实例(例如,NameNode 和 DataNode)会从/var/run/cloudera-scm-agent/process/unique-process-name下的每个进程专用目录获取它们的配置
进程管理
- 在 Cloudera Manager 管理的群集中,只能通过 Cloudera Manager 启动或停止服务。ClouderaManager 使用一种名为
supervisord的开源进程管理工具,它会重定向日志文件,通知进程失败,为合适用户设置调用进程的有效用户 ID 等等 - Cloudera Manager 支持自动重启崩溃进程。如果一个角色实例在启动后反复失败,Cloudera Manager还会用不良状态标记该实例
- 特别需要注意的是,停止 Cloudera Manager 和
Cloudera Manager Agent 不会停止群集;所有正在运行的实例都将保持运行 - Agent 的一项主要职责是启动和停止进程。当 Agent 从检测信号检测到新进程时,Agent 会在/var/run/cloudera-scm-agent
中为它创建一个目录,并解压缩配置 - Agent 受到监控,属于
Cloudera Manager 的主机监控的一部分:如果 Agent 停止检测信号,主机将被标记为运行状况不良
主机管理
- Cloudera Manager 自动将作为群集中的托管主机身份:JDK、Cloudera Manager Agent、CDH、Impala、Solr
等参与所需的所有软件部署到主机 - Cloudera Manager 提供用于管理参与主机生命周期的操作以及添加和删除主机的操作
- Cloudera Management Service
Host Monitor 角色执行运行状况检查并收集主机度量,以使您可以监控主机的运行状况和性能
安全
- 身份验证
- Hadoop中身份验证的目的仅仅是证明用户或服务确实是他或她所声称的用户或服务,通常,企业中的身份验证通过单个分布式系统(例如,轻型目录访问协议 (LDAP) 目录)进行管理。LDAP身份验证包含由各种存储系统提供支持的简单用户名/密码服务
- Hadoop 生态系统的许多组件会汇总到一起来使用 Kerberos 身份验证并提供用于在 LDAP 或
AD 中管理和存储凭据的选项
授权
CDH 当前提供以下形式的访问控制:
- 适用于目录和文件的传统 POSIX 样式的权限
- 适用于 HDFS 的扩展的访问控制列表 (ACL)
- Apache HBase 使用
ACL 来按列、列族和列族限定符授权各种操作 (READ, WRITE, CREATE, ADMIN) - 使用 Apache Sentry 基于角色进行访问控制
加密
- 需要获得企业版的Cloudera(Cloudera
Navigator 许可)
2、clouderaManager环境安装前准备
准备两台虚拟机,其中一台作为我们的主节点,安装我们的ClouderaManager Server与ClouderaManager agent,另外一台作为我们的从节点只安装我们的clouderaManager agent
机器规划如下
|
服务器IP |
192.168.52.100 |
192.168.52.110 |
|
主机名 |
node01.hadoop.com |
node02.hadoop.com |
|
主机名与IP地址映射 |
是 |
是 |
|
防火墙 |
关闭 |
关闭 |
|
selinux |
关闭 |
关闭 |
|
jdk |
安装 |
安装 |
|
ssh免密码登录 |
是 |
是 |
|
mysql数据库 |
否 |
是 |
|
服务器内存 |
16G |
8G |
所有机器统一两个路径
mkdir -p /export/softwares/
mkdir -p /export/servers/
2.1、两台机器更改主机名
第一台机器更改主机名
vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=node01.hadoop.com
第二台机器更改主机名
vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=node02.hadoop.com
2.2、更改主机名与IP地址的映射
两台机器更改hosts文件
vim /etc/hosts
192.168.52.100 node01.hadoop.com
192.168.52.110 node02.hadoop.com
2.3、两台机器关闭防火墙
service iptables stop
chkconfig iptables off
2.4、两台机器关闭selinux
vim /etc/selinux/config
SELINUX=disabled
2.5、两台机器安装jdk
将我们的jdk的压缩包上传到node01.hadoop.com的/export/softwares路径下
cd /export/softwares/
tar -zxvf jdk-8u141-linux-x64.tar.gz -C /export/servers/
配置环境变量
vim /etc/profile
export JAVA_HOME=/export/servers/jdk1.8.0_141
export PATH=:$JAVA_HOME/bin:$PATH
source /etc/profile
第二台机器同样安装jdk即可
2.6、两台机器实现SSH免密码登录
第一步:两台器生成公钥与私钥
两台机器上面执行以下命令,然后按下三个回车键即可生成公钥与私钥
ssh-keygen -t rsa
第二步:两台机器将公钥拷贝到同一个文件当中去
两台机器执行以下命令
ssh-copy-id node01.hadoop.com
第三步:拷贝authorized_keys到其他机器
第一台机器上将authorized_keys拷贝到第二台机器
scp /root/.ssh/authorized_keys node02.hadoop.com:/root/.ssh/
2.7、第二台机器安装mysql数据库
通过yum源,在线安装mysql
yum install mysql mysql-server mysql-devel
/etc/init.d/mysqld start
/usr/bin/mysql_secure_installation
进入mysql客户端执行以下命令
grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option;
flush privileges;
2.8、解除linux系统打开文件最大数量的限制
两台机器都需要执行
vi /etc/security/limits.conf
添加以下内容
* soft noproc 11000
* hard noproc 11000
* soft nofile 65535
* hard nofile 65535
2.9、设置linux交换区内存
两台机器都要执行
执行命令
echo 10 > /proc/sys/vm/swappiness
并编辑文件sysctl.conf:
vim /etc/sysctl.conf
添加或修改
vm.swappiness = 0
两台机器都要执行:
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
并编辑文件rc.local :
vim /etc/rc.local
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
2.10、两台机器时钟同步
两台机器需要进行时钟同步操作,保证两台机器时间相同
crontab –e
*/1 * * * * /usr/sbin/ntpdate ntp4.aliyun.com;
2.11、两台服务器关闭防火墙
service iptables stop
chkconfig iptables off
服务器关机重启
2-10 就业课(2.0)-oozie:12、cm环境搭建的基础环境准备的更多相关文章
- 2-10 就业课(2.0)-oozie:10、伪分布式环境转换为HA集群环境
hadoop 的基础环境增强 HA模式 HA是为了保证我们的业务 系统 7 *24 的连续的高可用提出来的一种解决办法,现在hadoop当中的主节点,namenode以及resourceManager ...
- 2-10 就业课(2.0)-oozie:13、14、clouderaManager的服务搭建
3.clouderaManager安装资源下载 第一步:下载安装资源并上传到服务器 我们这里安装CM5.14.0这个版本,需要下载以下这些资源,一共是四个文件即可 下载cm5的压缩包 下载地址:htt ...
- 2-10 就业课(2.0)-oozie:2、介绍和安装1
oozie的安装及使用 1. oozie的介绍 Oozie是运行在hadoop平台上的一种工作流调度引擎,它可以用来调度与管理hadoop任务,如,MapReduce.Pig等.那么,对于Oozie ...
- 2-10 就业课(2.0)-oozie:9、oozie与hue的整合,以及整合后执行MR任务
5.hue整合oozie 第一步:停止oozie与hue的进程 通过命令停止oozie与hue的进程,准备修改oozie与hue的配置文件 第二步:修改oozie的配置文件(老版本的bug,新版本已经 ...
- 2-10 就业课(2.0)-oozie:8、定时任务的执行
4.5.oozie的任务调度,定时任务执行 在oozie当中,主要是通过Coordinator 来实现任务的定时调度,与我们的workflow类似的,Coordinator 这个模块也是主要通过xml ...
- 2-10 就业课(2.0)-oozie:5、通过oozie执行hive的任务
4.2.使用oozie调度我们的hive 第一步:拷贝hive的案例模板 cd /export/servers/oozie-4.1.0-cdh5.14.0 cp -ra examples/apps/h ...
- 2-10 就业课(2.0)-oozie:7、job任务的串联
4.4.oozie的任务串联 在实际工作当中,肯定会存在多个任务需要执行,并且存在上一个任务的输出结果作为下一个任务的输入数据这样的情况,所以我们需要在workflow.xml配置文件当中配置多个ac ...
- 2-10 就业课(2.0)-oozie:6、通过oozie执行mr任务,以及执行sqoop任务的解决思路
执行sqoop任务的解决思路(目前的问题是sqoop只安装在node03上,而oozie会随机分配一个节点来执行任务): ======================================= ...
- 2-10 就业课(2.0)-oozie:4、通过oozie执行shell脚本
oozie的配置文件job.properties:里面主要定义的是一些key,value对,定义了一些变量,这些变量往workflow.xml里面传递workflow.xml :workflow的配置 ...
随机推荐
- Nginx禁止使用ip访问,只允许使用域名访问
Nginx虚拟主机配置,vhosts下面有很多域名的配置: [root@external-lb01 vhosts]# pwd/data/nginx/conf/vhosts [root@external ...
- CSS Sprite精灵图如何缩放大小
transform:scale( x ): 语法为:transform: scale(x,y). 同时有scaleX, scaleY专门的x, y方向的控制. 例如:transform: scale( ...
- 2.1 MySQL基础使用
本文是课上资料的总结非原创没有转载地址 目录 引言 为什么需要数据库? 数据库和应用程序的关系 MySQL基础使用 一.数据库简介 1.1 简介 1.2 常见数据库管理系统 1.3 MySQL卸载 1 ...
- 【快学springboot】SpringBoot整合Mybatis Plus
原创声明 本文首发于头条号[Happyjava].Happy的掘金地址:https://juejin.im/user/5cc2895df265da03a630ddca,Happy的个人博客:http: ...
- 11 JavaScript Number原始值&对象&科学记数法&范围&进制转换&溢出Infinity&NaN
JavaScript Number对象 是经过封装的能处理数字值的对象 由Number()构造器创建 只有一种数字类型 可以使用也可以不使用小数点书写数字 JavaScript原始值与对象: 在Jav ...
- ubuntu---CUDA 安装注意点总结
安装CUDA前的基础准备: 1.查看内核.gcc版本并记住. 最好 禁止内核更新,以防止以后工作中意外的系统更新使内核自动更新了,与驱动版本不兼容了. 2.禁用 nouveau驱动. 3.多下 ...
- leetcode #980 不同路径||| (java)
在二维网格 grid 上,有 4 种类型的方格: 1 表示起始方格.且只有一个起始方格.2 表示结束方格,且只有一个结束方格.0 表示我们可以走过的空方格.-1 表示我们无法跨越的障碍.返回在四个方向 ...
- CSS概述(最详细!!!)
一.先综述 二.分述: 1.简介: 2.基本用法 3.引入方式: 4.盒模型 5.选择器: 6.常见文本样式及复合样式 7.改变行.块元素的属性: 8.标签显示与隐藏: ...
- EC20的指令
AT+QURCCFG="urcport","usbat" :当设置在主串口时且用主串口进行AT交互时开机会收到一串状态的信息,默认USBAT就不会 AT+IPR ...
- Linux centosVMware运行告警系统、分发系统-expect讲解、自动远程登录后,执行命令并退出、expect脚本传递参数、expect脚本同步文件、指定host和要同步的文件、shell项目-分发系统-构建文件分发系统、分发系统-命令批量执行
一运行告警系统 创建一个任务计划crontab -e 每一分钟都执行一次 调试时把主脚本里边log先注释掉 再次执行 没有发现502文件说明执行成功了,每日有错误,本机IP 负载不高 二.分发系统-e ...