Spark Standalone集群是Master-Slaves架构的集群模式,和大部分的Master-Slaves结构集群一样,存在着Master单点故障的问题.如何解决这个单点故障的问题,Spark提供了两种方案: 基于文件系统的单点恢复(Single-Node Recovery with Local File System) 基于zookeeper的Standby Masters(Standby Masters with ZooKeeper) ZooKeeper提供了一个Leader El…
注意:没有使用supervisor进程管理器的,只参考配置,忽略和supervisor相关命令.并且alertmanager的版本不得低于0.15.2,低版本alert不支持集群配置. 一.alertmanager高可用 这里使用的是supervisor配置,也可以把配置集合成命令行方式,在服务器运行配置.记得加&,后台运行. 1.配置alertmanager集群 1.1 修改各节点alertmanager.yml cd /data/yy-monitor-server/etc vim alert…