大数据高可用集群环境安装与配置（08）—

1. 安装依赖包和软件

在所有服务器上输入命令进行安装操作

yum install epel-release -y

yum install ganglia-web ganglia-gmetad ganglia-gmond –y

2. 在master服务器上配置监控端

vi /etc/ganglia/gmetad.conf

修改下面内容

data_source "server"  master: master-backup: node1: node2: node3:

case_sensitive_hostnames

vi /etc/ganglia/gmond.conf

修改下面内容

cluster {

  name = "server"

  owner = "unspecified"

  latlong = "unspecified"

  url = "unspecified"

}

udp_send_channel {

  #mcast_join = 239.2.11.71

  host = master

  port =

  ttl =

}

udp_recv_channel {

  #mcast_join = 239.2.11.71

  port =

  #bind = 239.2.11.71

  #retry_bind = true

  # Size of the UDP buffer. If you are handling lots of metrics you really

  # should bump it up to e.g. 10MB or even higher.

  # buffer =

}

修改HTTP访问配置

vi /etc/httpd/conf.d/ganglia.conf

修改下面内容

Alias /ganglia /usr/share/ganglia

<Location /ganglia>

  Order deny,allow

  Allow from all

  #Require local

  # Require ip 10.1.2.3

  # Require host example.org

</Location>

设置ganglia监控程序链接到指定目录

ln -s /usr/share/ganglia/ /var/www/html/ganglia

修改apache配置

vi /etc/httpd/conf/httpd.conf

将Directory里的内容改为

# 修改80端口为10080，防止后面与nginx端口冲突

Listen 

<Directory />

    AllowOverride none

    Order Allow,Deny

    Allow from all

    #Require all denied

</Directory>

3. 启动apache和ganglia，并设置开机启动

systemctl start httpd.service

systemctl start gmetad

systemctl start gmond

systemctl enable httpd.service

systemctl enable gmetad

systemctl enable gmond

启动服务

rrdcached /usr/bin/rrdcached -p /var/run/ganglia/hdp/rrdcached.pid -m  -l unix:/var/run/ganglia/hdp/rrdcached.sock -m  -P FLUSH,STATS,HELP -l unix:/var/run/ganglia/hdp/rrdcached.limited.sock -b /var/lib/ganglia/rrds -B -t  -w  -f  -z  -F

设置开机启动

vi /etc/rc.local

在尾部添加下面配置

/usr/bin/rrdcached -p /var/run/ganglia/hdp/rrdcached.pid -m  -l unix:/var/run/ganglia/hdp/rrdcached.sock -m  -P FLUSH,STATS,HELP -l unix:/var/run/ganglia/hdp/rrdcached.limited.sock -b /var/lib/ganglia/rrds -B -t  -w  -f  -z  -F

4. 配置被监控端

在其他服务器上做下面操作

vi /etc/ganglia/gmond.conf

修改下面内容

cluster {

  name = "server"

  owner = "unspecified"

  latlong = "unspecified"

  url = "unspecified"

}

udp_send_channel {

  #mcast_join = 239.2.11.71

  host = master

  port =

  ttl =

}

udp_recv_channel {

  #mcast_join = 239.2.11.71

  port =

  #bind = 239.2.11.71

  #retry_bind = true

}

5. 配置HDFS、YARN集成Ganglia

vi /usr/local/hadoop/etc/hadoop/hadoop-metrics2.properties

将里面的值全部注释掉，然后替换成下面配置

# for Ganglia 3.1 support

*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31

*.sink.ganglia.period=

# default for supportsparse is false

*.sink.ganglia.supportsparse=true

*.sink.ganglia.slope=jvm.metrics.gcCount=zero,jvm.metrics.memHeapUsedM=both

*.sink.ganglia.dmax=jvm.metrics.threadsBlocked=,jvm.metrics.memHeapUsedM=

namenode.sink.ganglia.servers=master: # host请参考gmond.conf中的定义

datanode.sink.ganglia.servers=master:

resourcemanager.sink.ganglia.servers=master:

nodemanager.sink.ganglia.servers=master:

mrappmaster.sink.ganglia.servers=master:

jobhistoryserver.sink.ganglia.servers=master:

# 注意下面参数，如果修改可能会造成数据量过大，ganglia的磁盘空间迅速占满。

# Switch off container metrics

*.source.filter.class=org.apache.hadoop.metrics2.filter.GlobFilter

nodemanager.*.source.filter.exclude=*ContainerResource*

6. 配置HBase集成Ganglia

vi /usr/local/hbase/conf/hadoop-metrics2-hbase.properties

将里面的值全部注释掉，然后替换成下面配置

*.sink.file*.class=org.apache.hadoop.metrics2.sink.FileSink

# default sampling period

*.period=

*.source.filter.class=org.apache.hadoop.metrics2.filter.GlobFilter

*.record.filter.class=${*.source.filter.class}

*.metric.filter.class=${*.source.filter.class}

hbase.sink.ganglia.record.filter.exclude=*Regions*

hbase.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31

hbase.sink.ganglia.tagsForPrefix.jvm=ProcessName

*.sink.ganglia.period=

hbase.sink.ganglia.servers=master: # host请参考gmond.conf中的定义

7. 设置被监控端自启动

systemctl start gmond

systemctl enable gmond

8. 检查服务是否正常

在master服务器上重启hadoop与hbase服务访问http://192.168.10.90:10080/ganglia/ 查看监控页面

在master服务器输入命令查看监控服务运行状态

gstat –a

systemctl status gmetad –l

当遇到无法查看到监控信息时，可用上面的命令查看运行状态，如果gmetad与gmond服务都正常运行，却在网页端没有图形数据，可以在master服务器输入systemctl restart gmetad重启监控服务，在三个服务器都输入systemctl restart gmond重启监控收集服务。

作者博客：http://www.cnblogs.com/EmptyFS/

大数据高可用集群环境安装与配置（08）——安装Ganglia监控集群的更多相关文章

大数据高可用集群环境安装与配置（09）——安装Spark高可用集群
1. 获取spark下载链接登录官网:http://spark.apache.org/downloads.html 选择要下载的版本 2. 执行命令下载并安装 cd /usr/local/src/ ...
大数据高可用集群环境安装与配置（06）——安装Hadoop高可用集群
下载Hadoop安装包登录 https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 镜像站,找到我们要安装的版本,点击进去复制下载链接 ...
大数据高可用集群环境安装与配置（07）——安装HBase高可用集群
1. 下载安装包登录官网获取HBase安装包下载地址 https://hbase.apache.org/downloads.html 2. 执行命令下载并安装 cd /usr/local/src/ ...
大数据高可用集群环境安装与配置（04）——安装JAVA运行环境
Hadoop运行在java环境,所以在安装Hadoop之前,需要安装好jdk 提前下载好jdk安装包(jdk-8u161-linux-x64.tar.gz),将它上传到指定的安装目录当中,然后运行安装 ...
大数据高可用集群环境安装与配置（03）——设置SSH免密登录
Hadoop的NameNode需要启动集群中所有机器的Hadoop守护进程,这个过程需要通过SSH登录来实现 Hadoop并没有提供SSH输入密码登录的形式,因此,为了能够顺利登录每台机器,需要将所有 ...
大数据高可用集群环境安装与配置（02）——配置ntp服务
NTP服务概述 NTP服务器[Network Time Protocol(NTP)]是用来使计算机时间同步化的一种协议,它可以使计算机对其服务器或时钟源(如石英钟,GPS等等)做同步化,它可以提供高精 ...
大数据高可用集群环境安装与配置（10）——安装Kafka高可用集群
1. 获取安装包下载链接访问https://kafka.apache.org/downloads 找到kafka对应版本需要与服务器安装的scala版本一致(运行spark-shell可以看到当前 ...
大数据高可用集群环境安装与配置（05）——安装zookeeper集群
1. 下载安装包登录官网下载安装包 https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/ 2. 执行命令下载并安装 cd /usr/local ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十）安装hadoop2.9.0搭建HA
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...

随机推荐

mysql#自定义序列
原文 mysql主键不用自增数字的时候,可以参考如下方式,我抄来的. -- 创建公共的序列表 DROP TABLE IF EXISTS t_common_sequence; CREATE TABLE ...
修剪草坪 HYSBZ - 2442
在一年前赢得了小镇的最佳草坪比赛后,FJ变得很懒,再也没有修剪过草坪.现在,新一轮的最佳草坪比赛又开始了,FJ希望能够再次夺冠. 然而,FJ的草坪非常脏乱,因此,FJ只能够让他的奶牛来完成这项工作.F ...
「AT2292」Division into Two
传送门 Luogu 解题思路考虑如何 \(\text{DP}\) 为了方便处理,我们设 \(A > B\) 设 \(dp[i]\) 表示处理完 \(1...i\) ,并且第 \(i\) 个数放 ...
Lesson 2 Spare that spider
How much of each year do spiders killing insects? Why, you may wonder, should spiders be our friends ...
Spring框架中的JDK与CGLib动态代理
JDK和CGLib动态代理区别 JDK动态代理:利用拦截器(拦截器必须实现InvocationHanlder)加上反射机制生成一个实现代理接口的匿名类, 在调用具体方法前调用InvokeHandler ...
SpringBoo-Thymeleaf
SpringBoo-Thymeleaf SpringBoo-Thymeleaf简介 SpringBoot并不推荐使用JSP,它推荐我们使用模板引擎Thymeleaf,它与Velocity.Free ...
Python 实现远程服务器批量执行命令
paramiko 远程控制介绍 Python paramiko是一个相当好用的远程登录模块,采用ssh协议,可以实现linux服务器的ssh远程登录.首先来看一个简单的例子 import parami ...
call 和 apply 用法
ECMAScript规范中,所有函数都包含这两个方法,并且两个方法的使用基本一致,都是用于改变函数的作用域,即改变函数体内 this 指向.不同的是 call 方法的第二个参数可以接收任意个参数,以逗 ...
Largest Beautiful Number CodeForces - 946E （贪心）
题意:给定一个长度为偶数的数,输出小于它的最大的美丽数.如果一个数长度为偶数,且没有前导零,并存在一种排列是回文数的数为美丽数.给定的t个数长度总和不超过200000. 分析: 1.存在一种排列为回文 ...
2-10 就业课(2.0)-oozie：10、伪分布式环境转换为HA集群环境
hadoop 的基础环境增强 HA模式 HA是为了保证我们的业务系统 7 *24 的连续的高可用提出来的一种解决办法,现在hadoop当中的主节点,namenode以及resourceManager ...

大数据高可用集群环境安装与配置（08）——安装Ganglia监控集群

1. 安装依赖包和软件

2. 在master服务器上配置监控端

3. 启动apache和ganglia，并设置开机启动

4. 配置被监控端

5. 配置HDFS、YARN集成Ganglia

6. 配置HBase集成Ganglia

7. 设置被监控端自启动

8. 检查服务是否正常

大数据高可用集群环境安装与配置（08）——安装Ganglia监控集群的更多相关文章

随机推荐

热门专题