1 集群配置管理

应用服务器的配置通常会放到properties文件中，格式为：

system1.module2.prop3=value4

然后启动的时候加载，这样带来的问题是启动后无法修改，想修改必须要重启应用服务器；

一个简单的替代方式是存放到数据库中，应用服务器每次从数据库中加载配置，这样带来的问题是由于数据库是一种昂贵的资源从而降低性能；
一个简单的改进方式是存放到数据库中后再存放到缓存中，应用服务器每次从缓存中加载配置，这时要解决的问题是数据库和缓存的数据一致性问题，缓存的可靠性问题，而且会增加相当多的网络IO（缓存读操作）；
一个简单的改进方式是应用服务器在本地也存一份配置，每次从缓存中加载配置或者定时从缓存中加载配置，缓存读超时则使用本地配置；

回过头来看，配置的名字是一个标准的树形结构，可以直接将所有配置以及值放到zookeeper中，

/config/system1/module2/prop3=value4

由于zookeeper将所有的数据存放在内存中，所以读操作非常快，应用服务器启动之后从zookeeper中将所有配置存储到本地一份，另外利用zookeeper的watcher，当配置修改之后所有的应用服务器都可以收到通知，同步修改本地配置即可，这样达到的效果是如果配置没有更新（极大概率事件），则所有的配置读取都是本地操作（没有网络io）；如果配置有更新（极小概率事件），所有的应用服务器都可以及时收到通知并更新本地；

2 服务器分组及动态更新

在大规模集群中通常有很多类型角色的服务器，这时会将服务器按照类型角色进行分组，然后可以动态监控组内服务器的变更，然后做进一步处理；

比如在Dubbo中会将producer服务器分组，当producer服务器有变更时consumer端会及时收到更新方便做balance，这样实现producer服务器动态增减以及自动发现；

比如在Kafka中会将consumer服务器分组，当consumer服务器有变更时也会触发rebalance；

另外还可以用来对组内服务器的存活进行监控报警；

3 Master主备

众多的开源软件中比如Hadoop（HDFS、YARN）、HBase、Spark Standalone、Oozie等，都是通过zookeeper来实现master的HA，实现主从切换；

比如：

/hadoop-ha/$hdfs_name/ActiveStandbyElectorLock

/yarn-leader-election/$yarn_name/ActiveStandbyElectorLock

/hbase/master

4 分布式锁

分布式环境中有时需要在服务器之间进行协调，比如一个任务只允许在集群中的一台服务器运行等，常用的方法是利用数据库锁，这里分为乐观锁和悲观锁两种实现；

比如Quartz的分布式部署，就是利用数据库锁；

使用数据库锁有一些问题，1 数据库资源昂贵，而且有并发数限制，悲观锁会直接占用连接数，乐观锁可能由于数据库连接池满导致锁释放，悲观锁可能由于数据库连接池满导致卡住；2 数据库连接有超时时间限制；

利用zookeeper的Ephemeral Node+Sequence Node+watch可以很方便的实现分布式锁，Sequence Node可以保证只有一个节点能拿到锁，Ephemeral Node+watch可以保证一旦锁的持有者挂掉，其他等待锁的节点可以马上收到通知，同时再利用Sequence Node保证下一个节点能拿到锁；

【原创】大数据基础之Zookeeper（4）应用场景的更多相关文章

【原创】大数据基础之Zookeeper（2）源代码解析
核心枚举 public enum ServerState { LOOKING, FOLLOWING, LEADING, OBSERVING; } zookeeper服务器状态:刚启动LOOKING,f ...
【原创】大数据基础之Zookeeper（1）介绍、安装及使用
zookeeper3.4.11 http://zookeeper.apache.org/ 一简介 ZooKeeper is a centralized service for maintaining ...
【原创】大数据基础之Zookeeper（3）选举算法
提到zookeeper选举算法,就不得不提Paxos算法,因为zookeeper选举算法是Paxos算法的一个变种: Paxos要解决的问题是:在一个分布式网络环境中有众多的参与者,但是每个参与者都不 ...
决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试
决战大数据之三-Apache ZooKeeper Standalone及复制模式安装及测试 [TOC] Apache ZooKeeper 单机模式安装创建hadoop用户&赋予sudo权限, ...
大数据篇：Zookeeper
Zookeeper 1 Zookeeper概念 Zookeeper是什么是一个基于观察者设计模式的分布式服务管理框架,它负责和管理需要关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Z ...
【原创】大数据基础之Impala（1）简介、安装、使用
impala2.12 官方:http://impala.apache.org/ 一简介 Apache Impala is the open source, native analytic datab ...
【原创】大数据基础之词频统计Word Count
对文件进行词频统计,是一个大数据领域的hello word级别的应用,来看下实现有多简单: 1 Linux单机处理 egrep -o "\b[[:alpha:]]+\b" test ...
【原创】大数据基础之Benchmark（2）TPC-DS
tpc 官方:http://www.tpc.org/ 一简介 The TPC is a non-profit corporation founded to define transaction pr ...
大数据平台搭建-zookeeper集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...

随机推荐

Luogu P5280 [ZJOI2019]线段树
送我退役的神题,但不得不说是ZJOIDay1最可做的一题了先说一下考场的ZZ想法以及出来后YY的优化版吧首先发现每次操作其实就是统计出增加的节点个数(原来的不会消失) 所以我们只要统计出线段树上每 ...
获取任意链接文章正文 API 功能简介
此文章对开放数据接口 API 之「获取任意链接文章正文」进行了功能介绍.使用场景介绍以及调用方法的说明,供用户在使用数据接口时参考之用. 1. 产品功能接口开放了根据提供的文章链接 Url 参数,智 ...
工具(3): 转换Excel表格到MarkDown：exceltk
源码和下载: 0.1.3 mac: https://github.com/fanfeilong/exceltk/blob/master/pub/exceltk.0.1.3.pkg windows: h ...
windows 比较文件命令--fc
dos环境下的比较文件命令 win7帮助 D:\test>fc /? 比较两个文件或两个文件集并显示它们之间的不同 FC [/A] [/C] [/L] [/LBn] [/N] [/OFF[LI ...
spring异常Unsatisfied dependency expressed through constructor parameter 0
异常信息: org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with nam ...
JS-JAVASCRIPT的eval()方法
Lodop的传统模版是JS语句,如果储存的这种JS模版,可用javascript的eval()方法获取,该方法属于JS的范畴,并不是lodop语句,由于这个方法很多程序员可能不常用,对于这个JS方法不 ...
[UOJ422][集训队作业2018]小Z的礼物——轮廓线DP+min-max容斥
题目链接: [集训队作业2018]小Z的礼物题目要求的就是最后一个喜欢的物品的期望得到时间. 根据$min-max$容斥可以知道$E(max(S))=\sum\limits_{T\subseteq ...
第六十五天 js操作
1.闭包 // 函数的嵌套定义,定义在内部的函数都称之为闭包 // 1.一个函数要使用另一个函数的局部变量 // 2.闭包会持久化包裹自身的函数的局部变量 // 3.解决循环绑定 function ...
https://oi-wiki.org/
OI网站 https://oi-wiki.org/
bzoj 4260: Codechef REBXOR (01 Trie）
链接: https://www.lydsy.com/JudgeOnline/problem.php?id=4260 题面: 4260: Codechef REBXOR Time Limit: 10 S ...