大数据平台搭建-zookeeper集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容:
- 基础环境安装
- zookeeper集群的搭建
- kafka集群的搭建
- hadoop/hbase集群的搭建
- spark集群的搭建
- flink集群的搭建
- elasticsearch集群的搭建
- alluxio集群的搭建
1.zookeeper简介
Zookeeper是一个分布式的、开源的分布式应用协调服务,它暴露了一组简单的基础原件,分布式应用可以在这些原件之上实现更高级别的服务,主要使用场景和功能如下:
- Naming service
- Configuration management
- Synchronization
- Leader election
- Message Queue
- Notification system
其集群管理和命名服务在kafka、hadoop、spark中均有相关应用。
2.zookeeper安装
- 下载
官网地址:http://zookeeper.apache.org/releases.html,本文选择稳定版3.4.8
- 解压安装
本文环境列表
直接在服务器10.20.112.59上执行解压
cd ~ tar -zxvf zookeeper-3.4.8.tar.gz mv zookeeper-3.4.8 zookeeper
切换到conf目录,进行配置文件的更改
cd ~/zookeeper/conf/ mv zoo_sample.cfg zoo.cfg
修改后的配置文件zoo.cfg如下:
# The number of milliseconds of each tick tickTime=2000 # The number of ticks that the initial # synchronization phase can take initLimit=10 # The number of ticks that can pass between # sending a request and getting an acknowledgement syncLimit=5 # the directory where the snapshot is stored. # do not use /tmp for storage, /tmp here is just # example sakes. dataDir=/wls/oracle/bigdata/zookeeper # the port at which the clients will connect clientPort=2181 # the maximum number of client connections. # increase this if you need to handle more clients #maxClientCnxns=60 server.1=SZB-L0045546:2888:3888 server.2=SZB-L0045551:2888:3888 server.3=SZB-L0045552:2888:3888
dataDir主要是存储zookeeper的日志文件和快照信息
server.x中的x(数字1,2,3)主要是zookeeper的主机标识,所有的zookeeper集群中机器均需要在对应的dataDir目录新建myid文件,其内容为x(数字1,2,3)
- 日志配置更改
默认zookeeper的日志输出信息都打印到了zookeeper.out文件中,这样随着程序的进行,其日志文件会相当大,为便于后续的维护,优化相关配置
(1)日志路径
${ZOOKEEPER_HOME}/bin下更改zkEnv.sh文件,新增ZOO_LOG_DIR配置
vi /wls/oracle/zookeeper/bin/zkEnv.sh ZOO_LOG_DIR=/wls/oracle/bigdata/zookeeper/log
(2)日志方式
编辑配置${ZOOKEEPER_HOME}/conf/log4j.properties
vi /wls/oracle/zookeeper/config/log4j.properties
更改zookeeper.root.logger
同时更改log4j.appender.ROLLINGFILE相关属性
配置更改完成后,将整个zookeeper目录同步到其他服务器
scp -r /wls/oracle/zookeeper oracle@10.20.112.64:/wls/oracle/ scp -r /wls/oracle/zookeeper oracle@10.20.112.65:/wls/oracle/
各个服务器/wls/oracle/bigdata/zookeeper路径下,配置myid文件
- 启动和验证
依次启动集群中的zookeeper节点
/wls/oracle/zookeeper/bin/zkServer.sh start
待节点全部启动完成
/wls/oracle/zookeeper/bin/zkServer.sh status
同时,执行jps命令,会有QuorumPeerMain的进程存在,至此,zookeeper验证完成。
大数据平台搭建-zookeeper集群的搭建的更多相关文章
- 大数据平台搭建-kafka集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
- zookeeper集群的搭建以及hadoop ha的相关配置
1.环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 master作为active主机,data1作为standby备用机,三台机器均作为数据节点,yarn资源 ...
- Solr集群的搭建以及使用(内涵zookeeper集群的搭建指南)
1 什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud.当一个系统的索引数据量少的时候 ...
- 关于Linux系统下zookeeper集群的搭建
1.集群概述 1.1什么是集群 1.1.1集群概念 集群是一种计算机系统, 它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作.在某种意义上,他们可以被看作是一台计算机.集群系 ...
- docker 搭建zookeeper集群和kafka集群
docker 搭建zookeeper集群 安装docker-compose容器编排工具 Compose介绍 Docker Compose 是 Docker 官方编排(Orchestration)项目之 ...
- Linux下搭建ZooKeeper集群
摘要 Zookeeper是针对大型分布式系统的高可靠的协调系统.它基于对Paxos算法的实现,使该框架保证了分布式环境中数据的强一致性,也正是基于这样的特性,使得ZooKeeper解决很多分布式问题. ...
- 如何搭建Zookeeper集群
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件.它是一个为分布式应用提供一致性服务的软件,提供的 ...
- Zookeeper介绍 Zookeeper搭建 Zookeeper集群搭建
关键字:分布式 背景 随着互联网技术的高速发展,企业对计算机系统的技术.存储能力要求越来越高,最简单的证明就是出现了一些诸如:高并发.海量存储这样的词汇.在这样的背景 下,单纯依靠少量 ...
- centos 6.5 搭建zookeeper集群
为什么使用Zookeeper? 大部分分布式应用需要一个主控.协调器或控制器来管理物理分布的子进程(如资源.任务分配等)目前,大部分应用需要开发私有的协调程序,缺乏一个通用的机制协调程序的反复编写浪费 ...
随机推荐
- PHP预定义变量$_SERVER
PHP预定义变量$_SERVER $_SERVER 是一个包含诸如头部(headers).路径(paths)和脚本位置(script locations)的数组.数组的实体由 web 服务器创建,不能 ...
- 使用window.btoa和window.atob来进行Base64编码和解码
方法描述 WindowBase64.atob() 函数用来解码一个已经被base-64编码过的数据. WindowBase64.btoa() 函数 将ascii字符串或二进制数据转换成一个base ...
- 【算法系列学习】Dijkstra算法变形 [kuangbin带你飞]专题四 最短路练习
https://vjudge.net/contest/66569#problem/B 类试题:noip2013 货物运输 POJ 1797 Heavy Transportation 方法一:Dijks ...
- python 基础之pickle 与json 报错问题解决方案
Python 基础之pickle与json 有没有在搞pickle与json在进行数据储存的时候老是报错,这个有些让人烦恼,在之前有一篇介绍过它们的基本用法以及在使用过长中避免一些坑,但是今天在把对象 ...
- [ABP实战开源项目]---ABP实时服务-通知系统.发布模式
简介 在ABP中,提供了通知服务.它是一个基于实时通知的基础设施.分为订阅模式和发布模式. 本次会在项目中使用发布模式来演示一个用户注册后,收到的欢迎信息. 发布模式 首先我们在领域层建立" ...
- Linux 服务器 U盘安装(避免U盘启动)
首先下载两个文件: · rhel-server-6.3-i386-boot.iso 启动镜像 · rhel-server-6.3-i386-dvd.iso ...
- python-day2 字典
===========字典功能=============> dict.clear() -->清空字典 dict.keys() -->获取所有key dict.values() --& ...
- python 用户交互
#coding=utf8 name = input("name:") age = int(input("age:")) job = input("jo ...
- poj1797 Heavy Transportation Dijkstra算法的简单应用
题目链接:http://poj.org/problem?id=1797 题目就是求所有可达路径的其中的最小值边权的最大值 即对于每一条能够到达的路径,其必然有其最小的承载(其实也就是他们自身的最大的承 ...
- Phaser类详解
Phaser允许并发多阶段任务.Phaser类机制是在每一步结束的位置对线程进行同步,当所有的线程都完成了这一步,才允许执行下一步. 一个Phaser对象有两种状态: 活跃态(Active):当存在参 ...