本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容:

  • 基础环境安装
  • zookeeper集群的搭建
  • kafka集群的搭建
  • hadoop/hbase集群的搭建
  • spark集群的搭建
  • flink集群的搭建
  • elasticsearch集群的搭建
  • alluxio集群的搭建

1.zookeeper简介

Zookeeper是一个分布式的、开源的分布式应用协调服务,它暴露了一组简单的基础原件,分布式应用可以在这些原件之上实现更高级别的服务,主要使用场景和功能如下:

  • Naming service
  • Configuration management
  • Synchronization
  • Leader election
  • Message Queue
  • Notification system

其集群管理和命名服务在kafka、hadoop、spark中均有相关应用。

2.zookeeper安装

  • 下载

官网地址:http://zookeeper.apache.org/releases.html,本文选择稳定版3.4.8

  • 解压安装

本文环境列表

直接在服务器10.20.112.59上执行解压

cd ~
tar -zxvf zookeeper-3.4.8.tar.gz
mv zookeeper-3.4.8 zookeeper

切换到conf目录,进行配置文件的更改

cd  ~/zookeeper/conf/
mv zoo_sample.cfg zoo.cfg

修改后的配置文件zoo.cfg如下:

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/wls/oracle/bigdata/zookeeper
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
server.1=SZB-L0045546:2888:3888
server.2=SZB-L0045551:2888:3888
server.3=SZB-L0045552:2888:3888 

dataDir主要是存储zookeeper的日志文件和快照信息

server.x中的x(数字1,2,3)主要是zookeeper的主机标识,所有的zookeeper集群中机器均需要在对应的dataDir目录新建myid文件,其内容为x(数字1,2,3)

  • 日志配置更改

默认zookeeper的日志输出信息都打印到了zookeeper.out文件中,这样随着程序的进行,其日志文件会相当大,为便于后续的维护,优化相关配置

(1)日志路径

${ZOOKEEPER_HOME}/bin下更改zkEnv.sh文件,新增ZOO_LOG_DIR配置

vi /wls/oracle/zookeeper/bin/zkEnv.sh

ZOO_LOG_DIR=/wls/oracle/bigdata/zookeeper/log

(2)日志方式

编辑配置${ZOOKEEPER_HOME}/conf/log4j.properties

vi /wls/oracle/zookeeper/config/log4j.properties

更改zookeeper.root.logger

同时更改log4j.appender.ROLLINGFILE相关属性

配置更改完成后,将整个zookeeper目录同步到其他服务器

scp -r /wls/oracle/zookeeper oracle@10.20.112.64:/wls/oracle/
scp -r /wls/oracle/zookeeper oracle@10.20.112.65:/wls/oracle/

各个服务器/wls/oracle/bigdata/zookeeper路径下,配置myid文件

  • 启动和验证

依次启动集群中的zookeeper节点

/wls/oracle/zookeeper/bin/zkServer.sh start

待节点全部启动完成

/wls/oracle/zookeeper/bin/zkServer.sh status

同时,执行jps命令,会有QuorumPeerMain的进程存在,至此,zookeeper验证完成。

大数据平台搭建-zookeeper集群的搭建的更多相关文章

  1. 大数据平台搭建-kafka集群的搭建

    本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...

  2. zookeeper集群的搭建以及hadoop ha的相关配置

    1.环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 master作为active主机,data1作为standby备用机,三台机器均作为数据节点,yarn资源 ...

  3. Solr集群的搭建以及使用(内涵zookeeper集群的搭建指南)

    1   什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud.当一个系统的索引数据量少的时候 ...

  4. 关于Linux系统下zookeeper集群的搭建

    1.集群概述 1.1什么是集群 1.1.1集群概念 集群是一种计算机系统, 它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作.在某种意义上,他们可以被看作是一台计算机.集群系 ...

  5. docker 搭建zookeeper集群和kafka集群

    docker 搭建zookeeper集群 安装docker-compose容器编排工具 Compose介绍 Docker Compose 是 Docker 官方编排(Orchestration)项目之 ...

  6. Linux下搭建ZooKeeper集群

    摘要 Zookeeper是针对大型分布式系统的高可靠的协调系统.它基于对Paxos算法的实现,使该框架保证了分布式环境中数据的强一致性,也正是基于这样的特性,使得ZooKeeper解决很多分布式问题. ...

  7. 如何搭建Zookeeper集群

     ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件.它是一个为分布式应用提供一致性服务的软件,提供的 ...

  8. Zookeeper介绍 Zookeeper搭建 Zookeeper集群搭建

    关键字:分布式 背景         随着互联网技术的高速发展,企业对计算机系统的技术.存储能力要求越来越高,最简单的证明就是出现了一些诸如:高并发.海量存储这样的词汇.在这样的背景 下,单纯依靠少量 ...

  9. centos 6.5 搭建zookeeper集群

    为什么使用Zookeeper? 大部分分布式应用需要一个主控.协调器或控制器来管理物理分布的子进程(如资源.任务分配等)目前,大部分应用需要开发私有的协调程序,缺乏一个通用的机制协调程序的反复编写浪费 ...

随机推荐

  1. PHP预定义变量$_SERVER

    PHP预定义变量$_SERVER $_SERVER 是一个包含诸如头部(headers).路径(paths)和脚本位置(script locations)的数组.数组的实体由 web 服务器创建,不能 ...

  2. 使用window.btoa和window.atob来进行Base64编码和解码

      方法描述 WindowBase64.atob() 函数用来解码一个已经被base-64编码过的数据. WindowBase64.btoa() 函数 将ascii字符串或二进制数据转换成一个base ...

  3. 【算法系列学习】Dijkstra算法变形 [kuangbin带你飞]专题四 最短路练习

    https://vjudge.net/contest/66569#problem/B 类试题:noip2013 货物运输 POJ 1797 Heavy Transportation 方法一:Dijks ...

  4. python 基础之pickle 与json 报错问题解决方案

    Python 基础之pickle与json 有没有在搞pickle与json在进行数据储存的时候老是报错,这个有些让人烦恼,在之前有一篇介绍过它们的基本用法以及在使用过长中避免一些坑,但是今天在把对象 ...

  5. [ABP实战开源项目]---ABP实时服务-通知系统.发布模式

    简介 在ABP中,提供了通知服务.它是一个基于实时通知的基础设施.分为订阅模式和发布模式. 本次会在项目中使用发布模式来演示一个用户注册后,收到的欢迎信息. 发布模式 首先我们在领域层建立" ...

  6. Linux 服务器 U盘安装(避免U盘启动)

    首先下载两个文件: ·         rhel-server-6.3-i386-boot.iso    启动镜像 ·         rhel-server-6.3-i386-dvd.iso     ...

  7. python-day2 字典

    ===========字典功能=============> dict.clear() -->清空字典 dict.keys() -->获取所有key dict.values() --& ...

  8. python 用户交互

    #coding=utf8 name = input("name:") age = int(input("age:")) job = input("jo ...

  9. poj1797 Heavy Transportation Dijkstra算法的简单应用

    题目链接:http://poj.org/problem?id=1797 题目就是求所有可达路径的其中的最小值边权的最大值 即对于每一条能够到达的路径,其必然有其最小的承载(其实也就是他们自身的最大的承 ...

  10. Phaser类详解

    Phaser允许并发多阶段任务.Phaser类机制是在每一步结束的位置对线程进行同步,当所有的线程都完成了这一步,才允许执行下一步. 一个Phaser对象有两种状态: 活跃态(Active):当存在参 ...