3.9-3.10 分布式协作服务框架Zookeeper
一、zookeeper概述
- 一个开源的分布式的,为分布式应用提供协调服务的Apache项目。
 - 提供一个简单的原语集合,以便于分布式应用可以在它之上构建更高层次的同步服务。
 - 设计非常易于编程,它使用的是类似于文件系统那样的树形数据结构。
 - 目的就是将分布式服务不再需要由于协作冲突而另外实现协作服务。
 
Zk集群中最好配成奇数个节点,只要集群中有半数以上的节点存活,集群就能提供服务;
1、zookeeper集群的角色:
| 角色 | 描述 | |
| 领导者(Leader) | 领导者负责进行投票的发起和决议,更新系统状态; | |
| 
 学习者  | 
 跟随者  | 
 Follower用于接收客户请求并向客户端返回结果, 在选主过程中参与投票;  | 
| 
 学习者  | 
 观察者  | 
 ObServer 可以接收客户端连接,将写请求转发给 leader节点。 但observer不参加投票过程,只同步leader的状态。 observer的目的是为了扩展系统,提高读取速度;  | 
| 客户端(Client) | 请求发起方 | 
2、ZooKeeper典型应用场景
a、
Zookeeper从设计模式角度来看,是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据, 然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应, 从而实现集群中类似Master/Slave 管理模式。
b、
>统一命名服务(Name Service)
>配置管理(Configuration Management)
>集群管理(Group Membership)
>共享锁(Locks)/同步锁
二、Zookeeper 单机模式安装
1、安装
1、安装JDK、配置环境变量、验证java-version(已安装) 2、先停止服务hdfs、yarn
[root@master hadoop-2.5.0]# sbin/stop-dfs.sh
[root@master hadoop-2.5.0]# sbin/stop-yarn.sh
[root@slave1 hadoop-2.5.0]# sbin/yarn-daemon.sh stop resourcemanager #slave1 2、下载、赋执行权限、解压
>下载地址:https://zookeeper.apache.org/
>权限:chmod u+x zookeeper-3.4.5.tar.gz
>解压:tar zxf zookeeper-3.4.5.tar.gz -C /opt/modules/ 3、配置
rename配置文件:mv conf/zoo_sample.cfg conf/zoo.cfg 配置数据存储目录:
[root@master zookeeper-3.4.5]# pwd
/opt/modules/zookeeper-3.4.5 [root@master zookeeper-3.4.5]# mkdir -p ./data/zkData #创建数据目录 dataDir=/opt/modules/zookeeper-3.4.5/data/zkData #写入配置文件 4、启动
>启动:bin/zkServer.sh start [root@master zookeeper-3.4.5]# jps
9597 QuorumPeerMain
9655 Jps 5、检测
>查看状态:bin/zkServer.sh status > bin/zkCli.sh #进入客户端模式,类似于文件系统的操作
2、Zookeeper 配置参数详解
tickTime:这个时间是作为Zookeeper服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个tickTime时间就会发送一个心跳。 dataDir:顾名思义就是Zookeeper保存数据的目录,默认情况下,Zookeeper将写数据的日志文件也保存在这个目录里。 clientPort:这个端口就是客户端连接Zookeeper服务器的端口,Zookeeper会监听这个端口,接受客户端的访问请求。 Zookeeper Client命令讲解:
>命令:bin/zkCli.sh -server localhost:2181
>详解:ls、get、create、delete、set
停止zookeeper:
[root@master zookeeper-3.4.5]# bin/zkServer.sh stop
三、Zookeeper 分布式安装
1、master
#
[root@master softwares]# tar zxf zookeeper-3.4.5.tar.gz -C /opt/app/ #
[root@master zookeeper-3.4.5]# pwd
/opt/app/zookeeper-3.4.5 mv conf/zoo_sample.cfg conf/zoo.cfg [root@master zookeeper-3.4.5]# mkdir -p data/zkData #
zoo.cfg
dataDir=/opt/app/zookeeper-3.4.5/data/zkData #修改此行 #添加下面三行
server.1=master:2888:3888 server.2=slave1:2888:3888 server.3=slave2:2888:3888 #
[root@master zkData]# pwd
/opt/app/zookeeper-3.4.5/data/zkData [root@master zkData]# touch myid
[root@master zkData]# vim myid #写入1,1代表server的编号
1
2、同步目录到slave1 slave2
#master
[root@master app]# pwd
/opt/app [root@master app]# scp -r zookeeper-3.4.5 root@slave1:/opt/app/
[root@master app]# scp -r zookeeper-3.4.5 root@slave2:/opt/app/ #slave1
[root@slave1 hadoop-2.5.0]# cd /opt/app/zookeeper-3.4.5/data/zkData/
[root@slave1 zkData]# vim myid
2 #slave2
[root@slave2 hadoop-2.5.0]# cd /opt/app/zookeeper-3.4.5/data/zkData/
[root@slave2 zkData]# vim myid
3
3、启动
#master
[root@master zookeeper-3.4.5]# bin/zkServer.sh start #slave1
[root@slave1 zookeeper-3.4.5]# bin/zkServer.sh start #slave2
[root@slave2 zookeeper-3.4.5]# bin/zkServer.sh start
4、查看状态
#master
[root@master zookeeper-3.4.5]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/app/zookeeper-3.4.5/bin/../conf/zoo.cfg
Mode: follower #slave1
[root@slave1 zookeeper-3.4.5]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/app/zookeeper-3.4.5/bin/../conf/zoo.cfg
Mode: leader #slave2
[root@slave2 zookeeper-3.4.5]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/app/zookeeper-3.4.5/bin/../conf/zoo.cfg
Mode: follower
5、Zookeeper 配置参数详解续
initLimit:
这个配置项是用来配置Zookeeper接受客户端(这里所说的客户端不是用户连接Zookeeper服务器的客户端,
而是Zookeeper服务器集群中连接到Leader的Follower服务器)初始化连接时最长能忍受多少个心跳时间间隔数。
当已经超过10个心跳的时间(也就是tickTime)长度后Zookeeper服务器还没有收到客户端的返回信息,
那么表明这个客户端连接失败。总的时间长度就是5*2000=10秒。 syncLimit:
这个配置项标识Leader与Follower之间发送消息,请求和应答时间长度,
最长不能超过多少个tickTime的时间长度,总的时间长度就是2*2000=4秒。 server.A=B:C:D:
其中A是一个数字,表示这个是第几号服务器;B是这个服务器的ip地址;
C表示的是这个服务器与集群中的Leader服务器交换信息的端口;
D表示的是万一集群中的Leader服务器挂了,需要一个端口来重新进行选举,选出一个新的Leader,
而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于B都是一样,
所以不同的Zookeeper实例通信端口号不能一样,所以要给它们分配不同的端口号。 myid
集群模式下配置一个文件myid,这个文件在dataDir目录下,这个文件里面就有一个数据就是A的值,
Zookeeper启动时读取此文件,拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是那个server。
3.9-3.10 分布式协作服务框架Zookeeper的更多相关文章
- 基于netty轻量的高性能分布式RPC服务框架forest<下篇>
		
基于netty轻量的高性能分布式RPC服务框架forest<上篇> 文章已经简单介绍了forest的快速入门,本文旨在介绍forest用户指南. 基本介绍 Forest是一套基于java开 ...
 - 基于netty轻量的高性能分布式RPC服务框架forest<上篇>
		
工作几年,用过不不少RPC框架,也算是读过一些RPC源码.之前也撸过几次RPC框架,但是不断的被自己否定,最近终于又撸了一个,希望能够不断迭代出自己喜欢的样子. 顺便也记录一下撸RPC的过程,一来作为 ...
 - 分布式服务框架Zookeeper
		
协议介绍 zookeeper协议分为两种模式 崩溃恢复模式和消息广播模式 崩溃恢复协议是在集群中所选举的leader 宕机或者关闭 等现象出现 follower重新进行选举出新的leader 同时集群 ...
 - 分布式服务框架 Zookeeper -- 管理分布式环境中的数据
		
转自:http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/index.html Zookeeper 分布式服务框架是 Apa ...
 - 分布式服务框架 Zookeeper(转)
		
分布式服务框架 Zookeeper -- 管理分布式环境中的数据 Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题 ...
 - 分布式服务框架 Zookeeper -- 管理分布式环境中的数据(转载)
		
本文转载自:http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ Zookeeper 分布式服务框架是 Apache Had ...
 - 分布式服务框架 Zookeeper -- 管理分布式环境中的数据--转载
		
原文:http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ Zookeeper 分布式服务框架是 Apache Hadoop ...
 - RSF 分布式 RPC 服务框架的分层设计
		
RSF 是个什么东西? 一个高可用.高性能.轻量级的分布式服务框架.支持容灾.负载均衡.集群.一个典型的应用场景是,将同一个服务部署在多个Server上提供 request.response 消息通知 ...
 - 分布式服务框架 Zookeeper — 管理分布式环境中的数据
		
本节本来是要介绍ZooKeeper的实现原理,但是ZooKeeper的原理比较复杂,它涉及到了paxos算法.Zab协议.通信协议等相关知识,理解起来比较抽象所以还需要借助一些应用场景,来帮我们理解. ...
 
随机推荐
- Go  -- NSQ topic和channel的区别
			
topic:一个可供订阅的话题.channel:属于topic的下一级,一个topic可以有多个channel. 举个例子:topic:比做一个广播,如交通广播.打开收音机,你可以换很多频率,如果换到 ...
 - 一种排序(nyoj8)(简单排序)
			
一种排序 时间限制:3000 ms | 内存限制:65535 KB 难度:3 描写叙述 如今有非常多长方形.每个长方形都有一个编号,这个编号能够反复.还知道这个长方形的宽和长,编号.长.宽都是整数 ...
 - 课程的正确步调——Leo鉴书74
			
<Leo鉴书(第1辑)>已登陆百度阅读.今后还将不断更新,免费下载地址:http://t.cn/RvawZEx 本人第一次站上讲台是1999年,那会儿从中关村回到天津,在一个给成人做计算机 ...
 - eclipse Kepler tomcat内存溢出解决方式
			
使用eclipse开发ssh项目,本机8G内存,可是在打开一个表格后再打开一个页面.立即就内存溢出,网上搜到下面解决方式,未解决: 1.改动eclipse.ini參数 -vmargs -Xms1024 ...
 - MongoDB与MySQL的插入性能测试【转】
			
1.1 MongoDB的简单介绍 在当今的数据库市场上,MySQL无疑是占有一席之地的.作为一个开源的关系型数据库,MySQL被大量应用在各大网站后台中,承担着信息存储的重要作用.2009年,甲骨文 ...
 - 【转载】TCP粘包问题分析和解决(全)
			
TCP通信粘包问题分析和解决(全) 在socket网络程序中,TCP和UDP分别是面向连接和非面向连接的.因此TCP的socket编程,收发两端(客户端和服务器端)都要有成对的socket,因此,发送 ...
 - vs2010配置VL_FEAT库
			
VL_FEAT库是计算机视觉中的一个开源库,支持C/C++,Matlab,可以在http://www.vlfeat.org/下载. 本文主要讲一下VS2010中如何配置vl_feat库(算是对原文的一 ...
 - POJ 2378 Tree Cutting 子树统计
			
题目大意:给出一棵树.将树中的一个节点去掉之后,这棵树会分裂成一些联通块.求去掉哪些点之后.全部联通块的大小不超过全部节点的一半.并按顺序输出. 思路:基础的子树统计问题,仅仅要深搜一遍就能够出解.这 ...
 - mysql的binlog详解
			
什么是binlogbinlog日志用于记录所有更新了数据或者已经潜在更新了数据(例如,没有匹配任何行的一个DELETE)的所有语句.语句以“事件”的形式保存,它描述数据更改. binlog作用因为有了 ...
 - 【2】按照Django官网,创建一个web app   创建app/创建相应的数据库表
			
1. Creating app $ python manage.py startapp polls That'll create a directory polls, which is laid ou ...