hadoop hdfs ha 模式

这是我自己在公司一个搭建公司大数据框架是自己的选项，在配置yarn ha 出现了nodemanager起不来的问题
于是我把yarn搭建为普通yarn 如果有人解决 高yarn的nodemanager问题，请能留下留言，希望我的这个小日志能
初学者有所帮助。

在此例中采用的是 hadoop 2.6.5 版本
由于在建助hadoop 普通模式将基于hadoop的搭建都基本搭建起来，因而这里采用的是 on tez 模式
如果您不需要on tez 模式，你可以选择 将 yarn-tez 改成 yarn既可以了，这里也提供结合tez的方式。

在这里就不是介绍zookeeper 集群搭建，因为太简单了，只要注意
server.1 server.2 server.3 和 data 下面的myid 数字 123对应起来不要乱了就可以。
core-site.xml

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://ft-hadoop-dev-01-d:9000</value>

    </property>

    <property>

        <name>io.file.buffer.size</name>

        <value>131072</value>

     </property>

    <property>

        <name>fs.trash.interval</name>

        <value>1440</value>

        <description>删除文件表一天时间默认分钟</description>

    </property>  

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/home/workspace/hadoop/tmp</value>

    </property>

    <property>

        <name>hadoop.proxyuser.u0.hosts</name>

        <value>*</value>

    </property>

     <property>

        <name>hadoop.proxyuser.u0.groups</name>

        <value>*</value>

    </property> 

    <property>

        <name>ha.zookeeper.quorum</name>

        <value>ft-hadoop-dev-01-d:2181,ft-hadoop-dev-02-d:2181,ft-hadoop-dev-03-d:2181</value>

        <description>hadoop 高配集群制定zookeeper集群</description>

    </property> 

</configuration>

hdfs-site.xml

 <configuration>

    <property>

    <name>dfs.replication</name>

    <value>3</value>

    </property>  

    <property>

    <name>dfs.permissions.enabled</name>

    <value>false</value>

    </property>     

    <property>

    <name>dfs.blocksize</name>

    <value>134217728</value>

    </property>  

    <property>

    <name>dfs.nameservices</name>

    <value>mycluster</value>

    <description>指定hdfs的nameservices名称为mycluster</description>

    </property>

    <property>

    <name>dfs.ha.namenodes.mycluster</name>

    <value>nn1,nn2</value>

    </property>  

    <property>

    <name>dfs.namenode.rpc-address.mycluster.nn1</name>

    <value>ft-hadoop-dev-01-d:8020</value>

    <description>配置nn1,nn2的rpc通信端口</description>

    </property>  

    <property>

    <name>dfs.namenode.rpc-address.mycluster.nn2</name>

    <value>ft-hadoop-dev-02-d:8020</value>

    <description>配置nn1,nn2的rpc通信端口</description>

    </property>  

    <property>

    <name>dfs.namenode.http-address.mycluster.nn1</name>

    <value>ft-hadoop-dev-01-d:50070</value>

    <description>web端口</description>

    </property>

    <property>

    <name>dfs.namenode.http-address.mycluster.nn2</name>

    <value>ft-hadoop-dev-02-d:50070</value>

    <description>web端口</description>

    </property>   

    <property>

    <name>dfs.namenode.shared.edits.dir</name>

    <value>qjournal://ft-hadoop-dev-02-d:8485;ft-hadoop-dev-02-d:8485;ft-hadoop-dev-02-d:8485/mycluster</value>

    <description>指定namenode元数据存储在journalnode中的路径</description>

    </property>

    <property>

    <name>dfs.journalnode.edits.dir</name>

    <value>/home/bigdata/hadoop/journal-metastore</value>

    <description>指定journalnode日志文件存储的路径</description>

    </property>>  

    <property>

    <name>dfs.client.failover.proxy.provider.mycluster</name>

    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

    <description>指定HDFS客户端连接active namenode的java类</description>

    </property>  

    <property>

    <name>dfs.ha.fencing.methods</name>

    <value>sshfence

        shell(/bin/true)</value>

    <description>使HA模式下不会同时出现两个master，不允许出现两个activity状态下的Namenodeh</description>

    </property>  

    <property>

    <name>dfs.ha.fencing.ssh.private-key-files</name>

    <value>/root/.ssh/id_rsa</value>

    <description>指定秘钥的位置</description>

    </property>  

    <property>

    <name>dfs.ha.automatic-failover.enabled</name>

    <value>true</value>

    <description>这个是开启自动故障转移</description>

    </property>    

</configuration>

mapred-site.xml

    <property>             

        <name>mapreduce.framework.name</name>

        <value>yarn-tez</value>

    </property>

    <property>     

        <name>mapreduce.jobhistory.address</name>

        <value>ft-hadoop-dev-01-d:10020</value>

    </property>

    <property>

        <name>mapreduce.jobhistory.webapp.address</name>

        <value>ft-hadoop-dev-01-d:19888</value>

    </property>

</configuration>

yarn-site.xml

<configuration>

    <property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

    </property>  

    <property>

    <name>yarn.resourcemanager.hostname</name>

    <value>ft-hadoop-dev-01-d</value>

    </property>  

   <property>

    <name>yarn.log-aggregation-enable</name>

    <value>true</value>

    </property>  

    <property>

    <name>yarn.log-aggregation.retain-seconds</name>

    <value>106800</value>

    </property>  

    <property>

    <name>yarn.nodemanager.resource.memory-mb</name>

    <value>4056</value>

    <description>配置nodemanager可用的资源内存</description>

    </property>  

    <property>

    <name>yarn.nodemanager.resource.cpu-vcores</name>

    <value>4</value>

    <description>配置nodemanager可用的资源CPU</description>

    </property>    

</configuration>

将tez 和 hadoop结合，tez可以减少hadoop初始化的时间，从而在大量数据面前提高是hadoop处理数据的速度
大幅度压缩初始化时间.

 <?xml version="1.0" encoding="UTF-8"?>

 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <configuration>

 <property>

     <name>tez.lib.uris</name>

     <value>${fs.defaultFS}/tez/tez.tar.gz</value>

 </property>

 <property>

    <name>tez.use.cluster.hadoop-libs</name>

     <value>false</value>

 </property>

 </configuration>

　在hadoop-env.sh最下面加入如下内容

这里主要是引入tez的配置文件和jar包

#tez 环境变量

TEZ_CONF_DIR=/home/bigdata/hadoop/etc/hadoop/tez-site.xml

TEZ_JARS=/opt/software/tez

export HADOOP_CLASSPATH=${HADOOP_CLASSPATH}:${TEZ_CONF_DIR}:${TEZ_JARS}/*:${TEZ_JARS}/lib/*

hadoop hdfs ha 模式的更多相关文章

cdh5.13.1 hadoop hdfs HA模式无法启动
经过观察日志发现,JN三个节点启动正常,只有NN节点启动时提示JN节点没有格式化停止HDFS下面所有服务先启动JN节点然后启动一个NN节点,观察三个JN节点日志发现其中一个节点的日志正常,没有 ...
Hadoop HDFS HA启动出现两个StandBy NameNode
可能是zkfc服务没有启动,正确的流程如下: 1.在nn001上格式化zkfc sudo -u hdfs hdfs zkfc -formatZK 2.在三个(或以上)节点上启动journalnode ...
hadoop hdfs 高可用
单点故障: 如果某一个节点或服务出了问题,导致服务不可用单点故障解决方式: 1.给容易出故障的地方安排备份 2.一主一备,要求同一时刻只能有一个对外提供服务 3.当active挂掉之后,standb ...
使用Cloudera Manager搭建zookeeper集群及HDFS HA实战篇
使用Cloudera Manager搭建zookeeper集群及HDFS HA实战篇作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.使用Cloudera Manager搭建zo ...
Hadoop 学习笔记（九） hadoop2.2.0 生产环境部署 HDFS HA部署方法
step1:将安装包hadoop-2.2.0.tar.gz存放到某一个目录下,并解压 step2:修改解压后的目录中的文件夹/etc/hadoop下的xml配置文件(如果文件不存在,则自己创建) 包括 ...
一脸懵逼学习Hadoop分布式集群HA模式部署（七台机器跑集群）
1)集群规划:主机名 IP 安装的软件运行的进程master 192.168.199.130 jdk.hadoop ...
安装部署Apache Hadoop (完全分布式模式并且实现NameNode HA和ResourceManager HA)
本节内容: 环境规划配置集群各节点hosts文件安装JDK1.7 安装依赖包ssh和rsync 各节点时间同步安装Zookeeper集群添加Hadoop运行用户配置主节点登录自己和其他节点不 ...
[hadoop][会装]HBase集群安装--基于hadoop ha模式
可以参考部署HBase系统(分布式部署) 和基于无HA模式的hadoop下部署相比,主要是修改hbase-site .xml文件,修改如下参数即可: <property> <name ...
[hadoop][会装]hadoop ha模式安装
1.简介 2.X版本后namenode支持了HA特性,使得整个文件系统的可用性更加增强. 2.安装前提 zookeeper集群,zookeeper的安装参考[hadoop][会装]zookeeper安 ...

随机推荐

mybatis中 keyProperty="id" 的作用
keyProperty="id"的作用是: 一般都是结合数据库自动生成主键来使用,由于是数据库生成的主键, 所以在这个对象持久化到数据库之前是对象中的这个属性是没有属性值的,但是在 ...
.net aop 操作切面应用 Castle.Windsor框架 spring 可根据接口自动生成一个空的实现接口的类
通过unget 安装Castle.Windsor using Castle.DynamicProxy; using System; using System.Collections.Generic; ...
react中根据后台值动态配置
业务中我们要实现对应的数据是1是男,2是女,这就要根据键来进行动态匹配,通常后台来给你一个1或者2,你来进行匹配,这样的数据一般在表格中比较常见. <Card title="Mock- ...
iTOP-4418开发板Android 5.1/4.4丨Linux + Qt5.7丨Ubuntu12.04系统
核心板参数尺寸:50mm*60mm 高度:核心板连接器组合高度1.5mm PCB层数:6层PCB沉金设计 4418 CPU:ARM Cortex-A9 四核 S5P4418处理器 1.4GHz 68 ...
2018-2019-2 网络对抗技术 20165221 Exp3 免杀原理与实践
2018-2019-2 网络对抗技术 20165221 Exp3 免杀原理与实践基础问题回答杀软是如何检测出恶意代码的? 主要依托三种恶意软件检测机制. 基于特征码的检测:一段特征码就是一段或者多 ...
LeetCode第十八题-四数之和
4Sum 问题简介:定n个整数和整数目标的数组nums,是否有元素a,b,c,d在nums中,使a+b+c+d=target? 举例: 给定数组 nums = [1, 0, -1, 0, -2, 2] ...
论文笔记：Learning wrapped guidance for blind face restoration
这篇论文主要是讲人脸修复的,所谓人脸修复,其实就是将低清的,或者经过压缩等操作的人脸图像进行高清复原.这可以近似为针对人脸的图像修复工作.在图像修复中,我们都会假设退化的图像是高清图像经过某种函数映射 ...
2018-2019-2 20165231王杨鸿永《网络对抗》Exp1 PC平台逆向破解
实践目标本次实践的对象是一个名为pwn1的linux可执行文件. 该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串. 该程序同时包含另一个代码片段,getShe ...
【转】pyhton之Reportlab模块——生成pdf文件
[转]pyhton之Reportlab模块 reportlab模块是用python语言生成pdf文件的模块安装:pip install reportlab 模块默认不支持中文,如果使用中文需要注册 ...
ngx_string()错误分析
#define ngx_string(str) { sizeof(str) - 1, (u_char) str } typedef struct { uint len; u_char* data; } ...

hadoop hdfs ha 模式

hadoop hdfs ha 模式的更多相关文章

随机推荐

热门专题