[故障背景] NameNode和DataNode进程正常运行,但是网页找不到DataNode,DataNode为空.各个节点机器之间可以ping同主机名. [日志排查] 众多日志中找到如下关键点错误信息 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool BP-250248683-192.168.243.12-1528721295822 (Datanode Uuid…
本文中的Spark集群包含三个节点,分别是Master,Worker1,Worker2. 1.在Master机器上安装Zookeeper,本文安装在/usr/etc目录下 2.在Master机器配置Zookeeper 2.1.cp /usr/etc/zookeeper-3.4.10/conf/zoo_sample.cfg /usr/etc/zookeeper-3.4.10/conf/zoo.cfg 2.2.在安装目录下创建data,logs目录:mkdir data;mkdir logs; 2.…
[故障背景] 8088网页打不开,因8088是yarn平台的端口,所以我从yarn开始排查,首先到各个机器上使用jps命令查看yarn的各个节点是否启动,发现虽然有nodemanager进程,但是主节点机器上的resourcemanager进程未启动, 使用yarn-daemon.sh start resourcemanager单独启动resourcemanager进程.遇到闪退,一开启进程,不一会就自动关闭 [解决步骤] 1. 根据集群规划,到每个zookeeper所在的机器启动zookeep…
参考链接 Hadoop 完全分布式安装 ZooKeeper 集群的安装部署 0. 说明 在 Hadoop 完全分布式安装 & ZooKeeper 集群的安装部署的基础之上进行 Hadoop 高可用(HA)的自动容灾配置 Hadoop 高可用 High Availablility 相当于再配置一台 NameNode 单节点模式容易产生单点故障 冷备份和热备份的区别 热备份:有两个 NameNode 同时工作,其中一台机器处于 active 状态,另一台机器处于 standby 状态. 两个节点数据…
[高可用HA]Nginx (1) -- Mac下配置Nginx Http负载均衡(Load Balancer)之101实例 nginx版本: nginx-1.9.8 参考来源: nginx.org [高可用HA]Apache (2) -- Mac下安装多个Apache Tomcat实例 Nginx on Mac OS X Snow Leopard in 2 Minutes 51cto:Nginx+Tomcat负载均衡配置 csdn:Nginx+Tomcat负载均衡配置 iteye:图文解说:Ng…
(参考文章:https://www.linuxprobe.com/hadoop-high-available.html) 一.技术背景 影响HDFS集群不可用主要包括以下两种情况:一是NameNode机器宕机,将导致集群不可用,重启NameNode之后才可使用:  二是计划内的NameNode节点软件或硬件升级,导致集群在短时间内不可用. 为了解决上述问题,Hadoop给出了HDFS的高可用HA方案:HDFS通常由两个NameNode组成,一个处于active状态,另一个处于standby状态.…
Hadoop介绍——HA与联邦 0.1682019.06.04 13:30:55字数 820阅读 138 Hadoop 1.0中HDFS和MapReduce在高可用.扩展性等方面存在问题: –HDFS存在的问题 •NameNode单点故障,难以应用于在线场景    HA •NameNode压力过大,且内存受限,影扩展性   F –MapReduce存在的问题响系统 •JobTracker访问压力大,影响系统扩展性 •难以支持除MapReduce之外的计算框架,比如Spark.Storm等.  …
corosync+pacemaker实现高可用(HA)集群(一)     重要概念 在准备部署HA集群前,需要对其涉及的大量的概念有一个初步的了解,这样在实际部署配置时,才不至于不知所云 资源.服务与主机(又称节点)的关系: 资源包括vip,httpd,filesystem等: 可整合多个资源形成一个服务: 服务必运行在某个主机上,主机上也可不运行服务(此为空闲主机): 服务里的所有资源应该同时运行在同一个节点上,实现方式有2种: 资源组: 排列约束 资源类型 primitive(或native…
1.熟悉几个组件 1.1.apache     —— 它是Apache软件基金会的一个开放源代码的跨平台的网页服务器,属于老牌的web服务器了,支持基于Ip或者域名的虚拟主机,支持代理服务器,支持安 全Socket层(SSL)等等,目前互联网主要使用它做静态资源服务器,也可以做代理服务器转发请求(如:图片链等),结合tomcat等 servlet容器处理jsp.1.2.ngnix     —— 俄罗斯人开发的一个高性能的 HTTP和反向代理服务器.由于Nginx 超越 Apache 的高性能和稳…
http://aokunsang.iteye.com/blog/2053719   声明:以下仅为个人的一些总结和随写,如有不对之处,还请看到的网友指出,以免误导. (详细的配置方案请google,这里只说解决方案.) 1.熟悉几个组件 1.1.apache     —— 它是Apache软件基金会的一个开放源代码的跨平台的网页服务器,属于老牌的web服务器了,支持基于Ip或者域名的虚拟主机,支持代理服务器,支持安全Socket层(SSL)等等,目前互联网主要使用它做静态资源服务器,也可以做代理…
看看别人的文章: 1.熟悉几个组件 1.1.apache     —— 它是Apache软件基金会的一个开放源代码的跨平台的网页服务器,属于老牌的web服务器了,支持基于Ip或者域名的虚拟主机,支持代理服务器,支持安全Socket层(SSL)等等,目前互联网主要使用它做静态资源服务器,也可以做代理服务器转发请求(如:图片链等),结合tomcat等servlet容器处理jsp.1.2.ngnix     —— 俄罗斯人开发的一个高性能的 HTTP和反向代理服务器.由于Nginx 超越 Apache…
申明: centos7的pacemaker与6使用的方法不一致,即使用centos6.x的方法在centos7.x上面配置pacemaker不能成功. 因此openstack 上面的centos7.1如果使用官方文档直接配置高可用HA也是无法成功的.(吐槽:openstack的liberty出的HA方案官方文档不适用于centos7.x) 关于openstack liberty版本的高可用HA方案请参考下述实验!!! PS:与pacemaker高可用方案相对应的keepalived原理(主从配置…
kubeadm部署k8s 使用kubeadm进行k8s的部署主要分为以下几个步骤: 环境预装: 主要安装docker.kubeadm等相关工具. 集群部署: 集群部署分为single master(单master,只有一个master节点)和高可用HA集群部署两种模式.主要部署k8s的相关组件.本文将分别做介绍. 网络部署: 部署网络环境.本文以flannel为例进行部署. 环境预装 在所有节点上都先要做好环境的准备,这里以debian为例,整理了安装docker和kubeadm的相关命令.这个…
Rancher版本:Rancher v1.0.1 基本配置需求 多节点的HA配置请参照单节点需求 节点需要开放的端口 全局访问:TCP 端口22,80,443,18080(可选:用于在集群启动前 查看并管理栈 ) 节点间连接: UDP 端口:500,4500 TCP 端口:2181,2376,2888,3888,6379 MySQL数据库 至少 1GB 内存 每 Rancher 服务器节点 50 个连接(如:3 节点的高可用部署至少需要支持 150 个连接) 外部负载均衡器 建议配置 每个 Ra…
大纲一.前言二.环境准备三.Corosync 安装与配置四.Pacemaker 安装与配置五.DRBD 安装与配置六.MySQL 安装与配置七.crmsh 资源管理 推荐阅读: Linux 高可用(HA)集群基本概念详解 http://www.linuxidc.com/Linux/2013-08/88522.htm Linux 高可用(HA)集群之Heartbeat详解 http://www.linuxidc.com/Linux/2013-08/88521.htm 一.前言      前几篇博文…
最近项目上线部署,要求redis作高可用,由于redis cluster还不是特别成熟,就选择了redis sentinel做高可用.redis本身有replication,实现主从备份.结合sentinel可以做主.从自动切换. 生产环境中,一般要求有3个redis节点.但本文为了试验方便,只用了两个节点,一主一从. 部署规划172.16.203.10 主节点 172.16.203.4 从节点 redis版本为3.0.1 主节点redis采用源码编译的方式安装,非常简单,解压出来,进入解压目录…
#openstack高可用haproxy配置openstack pike 部署 目录汇总 http://www.cnblogs.com/elvi/p/7613861.html #openstack高可用haproxy配置 ###########全局配置######### global log 127.0.0.1 local0 log 127.0.0.1 local1 notice daemon #nbproc #进程数量 maxconn #最大连接数 user haproxy #运行用户 gro…
tomact配置域名和端口直接访问网站,就是使用域名解析到主机,通过端口执行网站地址,实现访问,在上一章节中发布了两个web项目,但是都是执行同一个根文件夹,通过 http://localhost:8080/项目名称   以这样的地址进行访问的. 下面通过配置Tomcat安装地址下的conf文件夹下的server.xml文件,实现绑定域名和指定端口到指向目录实现 域名加端口访问 网站 1.先配置两个虚拟域名.打开以下目录:C:\Windows\System32\drivers\etc 选中hos…
Linux 下指定端口开放访问权限 作者:Grey 原文地址: 博客园:Linux 下指定端口开放访问权限 CSDN:Linux 下指定端口开放访问权限 环境 CentOS 系和 Debian 系的防火墙开放的命令有一些差异,关于Linux 的安装可以参考:Linux 安装,快照,克隆 CentOS 开放指定端口 例如要开放 8808 端口,执行 firewall-cmd --zone=public --add-port=8888/tcp --permanent 其中 --zone 表示作用域;…
一.HA概述 1.引言 正式引入HA机制是从hadoop2.0开始,之前的版本中没有HA机制 2.运行机制 实现高可用最关键的是消除单点故障 hadoop-ha严格来说应该分成各个组件的HA机制——HDFS的HA.YARN的HA 详解: 通过双namenode消除单点故障 双namenode协调工作的要点: A.元数据管理方式需要改变: 内存中各自保存一份元数据 Edits日志只能有一份,只有Active状态的namenode节点可以做写操作 两个namenode都可以读取edits 共享的ed…
第1章 HA高可用 1.1 HA概述 1)所谓HA(high available),即高可用(7*24小时不中断服务). 2)实现高可用最关键的策略是消除单点故障(single point of failure,SPOF).单点故障是一个组件发生故障,就会导致整个系统无法运行.HA严格来说应该分成各个组件的HA机制:HDFS的HA和YARN的HA. 3)Hadoop2.0之前,在HDFS集群中NameNode存在单点故障. 4)NameNode主要在以下两个方面影响HDFS集群 NameNode…
一.HA部署架构 如上图所示,我们可以将其分为三个部分: 1.NN和DN组成Hadoop业务组件.浅绿色部分. 2.中间深蓝色部分,为Journal Node,其为一个集群,用于提供高可用的共享文件存储(元数据存储). 3.蓝色部分为Zookeeper,提供自动NN切换. 在 hadoop全分布式安装 中,我们已经部署了一套全分布式的Hadoop集群,包含1个NN和3个DN. 我们在全分布式的基础上将其中一个DN(安装SNN的节点)变为SBNN(备用NN). 在全分布式中,存在一个SNN(sec…
本文源码:GitHub·点这里 || GitEE·点这里 一.HDFS高可用 1.基础描述 在单点或者少数节点故障的情况下,集群还可以正常的提供服务,HDFS高可用机制可以通过配置Active/Standby两个NameNodes节点实现在集群中对NameNode的热备来消除单节点故障问题,如果单个节点出现故障,可通过该方式将NameNode快速切换到另外一个节点上. 2.机制详解 基于两个NameNode做高可用,依赖共享Edits文件和Zookeeper集群: 每个NameNode节点配置一…
一.写在前面 HA即(high available)高可用,又被叫做双机热备,用于关键性业务.简单理解就是,有2台机器 A 和 B,正常是 A 提供服务,B 待命闲置,当 A 宕机或服务宕掉,会切换至B机器继续提供服务.常见的实现高可用的开源软件有 heartbeat 和 keepalived. 这样,一台 web 服务器一天24小时提供web服务,难免会存在 web 服务挂掉或服务器宕机宕机的情况,那么用户就访问不了服务了,这当然不是我们期望的.如果这样,有2台服务器,A对外提供 web 服务…
0. Keepalived介绍   Keepalived是基于VRRP(Virtual Router Redundancy Protocol,虚拟路由器冗余协议)协议的一款高可用软件.Keepailived有一台主服务器(master)和多台备份服务器(backup),在主服务器和备份服务器上面部署相同的服务配置,使用一个虚拟IP地址对外提供服务,当主服务器出现故障时,虚拟IP地址会自动漂移到备份服务器.   首先需要配置MySQL的双主配置,传送门https://www.cnblogs.com…
版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客的高可用集群是建立在完全分布式基础之上的,详情请参考:https://www.cnblogs.com/yinzhengjie/p/9065191.html.并且需要新增一台Linux服务器,用于Namenode的备份节点. 一.实验环境准备 需要准备五台Linux操作系统的服务器,配置参数最好一样,由于我的虚拟机是之前完全分布式部署而来的,因此我的环境都一致. 1>.NameNode服务器(s101) 2>.DataNode服务器(s…
HDFS HA Namenode HA  详解 hadoop2.x 之后,Clouera 提出了 QJM/Qurom Journal Manager,这是一个基于 Paxos 算法(分布式一致性算法)实现的 HDFS HA 方案,它给出了一种较好的解决思路和方案,QJM 主要优势如下: 不需要配置额外的高共享存储,降低了复杂度和维护成本. 消除 spof(单点故障). 系统鲁棒性(Robust)的程度可配置.可扩展. 基本原理就是用 2N+1 台 JournalNode 存储 EditLog,每…
本篇介绍在centos7中搭建hadoop2.10高可用集群,首先准备6台机器:2台nn(namenode);4台dn(datanode):3台jns(journalnodes) IP hostname 进程 192.168.30.141 s141 nn1(namenode),zkfc(DFSZKFailoverController),zk(QuorumPeerMain) 192.168.30.142 s142 dn(datanode), jn(journalnode),zk(QuorumPee…
记录apache版本的hadoop和hbase的安装,并启用高可用模式. 1. 主机环境 我这里使用的操作系统是centos 6.5,安装在vmware上,共三台. 主机名 IP 操作系统 用户名 安装目录 node1 192.168.1.101 centos 6.5 wxyuan /opt/hadoop,/opt/hbase node2 192.168.1.102 centos 6.5 wxyuan /opt/hadoop,/opt/hbase node3 192.168.1.103 cent…
本系列会分析OpenStack 的高可用性(HA)概念和解决方案: (1)OpenStack 高可用方案概述 (2)Neutron L3 Agent HA - VRRP (虚拟路由冗余协议) (3)Neutron L3 Agent HA - DVR (分布式虚机路由器) (4)Pacemaker 和 OpenStack Resource Agent (RA) (5)RabbitMQ HA (6)MySQL HA 1. MySQL HA 方案 1.1 各种方案概述 Mysql HA 方案有很多种,…