hadoop_2.6.5集群安装

安装hadoop2.6.5集群：

1.规划设计：

JacK6：NameNode，jobtracker

JacK7:secondnode,datenode,tasktracker

JacK8:datanode,tasktracker

2.配置ssh免密钥登录

1.关闭SElinux

su root

setenforce 0

vi /etc/selinux/config

SELINUX=disabled

2.配置ssh免密钥：分别在6、7、8(需要免密钥自己)执行（pssh值得研究）

ssh-keygen -t rsa -P ''

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@JacK7

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@JacK8

ssh JacK7

3. 系统配置：

1.关闭防火墙

service iptables stop

service iptables status

chkconfig iptables off

2.关闭透明大页

查看：cat /sys/kernel/mm/redhat_transparent_hugepage/defrag

[always] madvise never 标识启用

关闭：echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag

echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled

3.修改swappiness

Linux内核参数vm.swappiness，值的范围为0~100，表示系统什么时候开始进行物理内存与虚拟内存的交换。

举个例子，系统总内存为64G，vm.swappiness为60，表示在系统内存使用64*0.4=25.6G 的时候开始物理内存与虚拟内存的交换，

这个动作势必会影响系统的性能。因此，Cloudera建议把这个值修改为1~10。

查看：cat /proc/sys/vm/swappiness

修改：

临时：sysctl -w vm.swappiness=10

永久生效：

echo "vm.swappiness=10" >> /etc/sysctl.conf

4.修改文件打开最大数和最大进程数：后面两个文件有待研究

查看：ulimit -a

修改可打开的最大文件数：vi /etc/security/limits.conf

* soft nofile 65535

* hard nofile 65535

* soft nproc 65535

* hard nproc 65535

hadoop soft nproc 10240

hadoop hard nofile 10240

hadoop soft nproc 10240

hadoop hard nproc 10240

重启生效，其他两个文件：

/etc/security/limits.d/90-nproc.conf文件尾添加

* soft nproc 204800

* hard nproc 204800

/etc/security/limits.d/def.conf文件尾添加

* soft nofile 204800

* hard nofile 204800

5.禁用IPv6:以后再看

vi /etc/sysconfig/network

6.屏蔽文件访问时间:以后再看

4.建立本地yum仓库：以后再建

5.NTP配置：以后

6.安装Java

7.hadoop安装

1.mkdir Hadoop_2.6.5

tar -xvf /data/tar/hadoop-2.6.5.tar.gz -C /data/hadoop/Hadoop_2.6.5/

tar -xvf hadoop-native-64-2.6.0.tar -C /data/hadoop/Hadoop_2.6.5/lib/native

vi ~/.bash_profile

#Hadoop_2.6.5

export HADOOP_HOME=/data/hadoop/Hadoop_2.6.5

export HADOOP_PREFIX=$HADOOP_HOME

export HADOOP_MAPRED_HOME=${HADOOP_PREFIX}

export HADOOP_COMMON_HOME=${HADOOP_PREFIX}

export HADOOP_HDFS_HOME=${HADOOP_PREFIX}

export YARN_HOME=${HADOOP_PREFIX}

# Native Path

export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_PREFIX}/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib/native"

export PATH=$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin:

$JAVA_HOME/bin:$PATH

scp .bash_profile JacK7

scp .bash_profile JacK8

2.修改配置文件：

cd /data/hadoop/Hadoop_2.6.5/etc/hadoop

1.vi hadoop-env.sh

# 明确指定JAVA_HOME

export JAVA_HOME=/usr/software/java_1.8

# 明确指定log的存放目录，默认位置是安装目录下的logs文件夹

export HADOOP_LOG_DIR=/data/tmp_data/hadoop_data/logs

2.vi yarn-env.sh

export JAVA_HOME=/usr/software/java_1.8

#if [ "$JAVA_HOME" != "" ]; then

# #echo "run java in $JAVA_HOME"

# JAVA_HOME=$JAVA_HOME

#fi

#if [ "$JAVA_HOME" = "" ]; then

# echo "Error: JAVA_HOME is not set."

# exit 1

#fi

3.vi slaves 修改namenode和secondnode上的slaves文件

JacK7

JacK8

4.vi core-site.xml 配置core-site文件

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>file:/data/tmp_data/hadoop_data/tmp</value>

<description>Abase for other temporary directories.</description>

</property>

</configuration>

5.vi hdfs-site.xml配置secondnamenode

<name>dfs.namenode.secondary.http-address</name>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:/data/tmp_data/hadoop_data/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/data/tmp_data/hadoop_data/hdfs</value>

</property>

</configuration>

6.cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

7.vi yarn-site.xml

<name>yarn.resourcemanager.hostname</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

8.复制到其他节点：

scp -r Hadoop_2.6.5/ JacK7:/data/hadoop/

scp -r Hadoop_2.6.5/ JacK8:/data/hadoop/

9.启停测试：

1 $hdfs namenode -format HDFS格式化

首次启动需要先在 Master 节点执行 NameNode 的格式化，之后的启动不需要再去进行：

2 start-dfs.sh 在主节点启动所有守护进程，通过在各节点jps来查看

start-yarn.sh

mr-jobhistory-daemon.sh start historyserver

3. hdfs dfsadmin -report 主节点查看集群的DataNode是否启动

4. stop-yarn.sh

stop-dfs.sh

mr-jobhistory-daemon.sh stop historyserver

hadoop_2.6.5集群安装的更多相关文章

【Oracle 集群】Oracle 11G RAC教程之集群安装（七)
Oracle 11G RAC集群安装(七) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总. ...
kafka集群安装部署
kafka集群安装使用的版本系统:centos6.5 centos6.7 jdk:1.7.0_79 zookeeper:3.4.9 kafka:2.10-0.10.1.0 一.环境准备[只列,不具 ...
CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
Hadoop多节点集群安装配置
目录: 1.集群部署介绍 1.1 Hadoop简介 1.2 环境说明 1.3 环境配置 1.4 所需软件 2.SSH无密码验证配置 2.1 SSH基本原理和用法 2.2 配置Master无密码登录所有 ...
codis集群安装
在网上找了很多codis的集群安装方法,看起来都是大同小异,本人结合了大多种方法完成了一套自己使用的codis的集群安装,可以供大家学习使用,如果有什么问题或者不懂的地方欢迎指正 1.集群规划: 三台 ...
[bigdata] spark集群安装及测试
在spark安装之前,应该已经安装了hadoop原生版或者cdh,因为spark基本要基于hdfs来进行计算. 1. 下载 spark: http://mirrors.cnnic.cn/apache ...
(原) 1.2 Zookeeper伪集群安装
本文为原创文章,转载请注明出处,谢谢 Zookeeper伪集群安装 zookeeper单机安装配置可以查看 1.1 zookeeper单机安装 1.复制三份zookeeper,分别为zookeeper ...
一步步教你Hadoop多节点集群安装配置
1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统HDFS(Hadoop Distributed Filesys ...
kafka 集群安装与安装测试
一.集群安装 1. Kafka下载:wget https://archive.apache.org/dist/kafka/0.8.1/kafka_2.9.2-0.8.1.tgz 解压 tar zxvf ...

随机推荐

boostrap-非常好用但是容易让人忽略的地方【1】：modal
使用bootstrap框架好久了,在开发中也用到了或者遇到了很多的问题,所以跟大家分享一下 bootstrap modal 组件的样式 .modal-lg .modal-sm 说明:这个是bootst ...
Unitils集成DBUnit、Spring-单元测试(转)
1.maven-pom文件中引入相关jar包  <dependency> <groupId>org.u ...
freemarker<二>
一.FreeMarker模板文件组成 ①.文本,直接输出的部分 ②.注释,即<#--...-->格式不会输出 ③.FTL指令:FreeMarker指令,和HTML标记类似,名字前加#予以区 ...
洛谷$P$2472 蜥蜴 $[SCOI2007]$ 网络流
正解:网络流解题报告: 传送门! $umm$一看就是个最大流呗,,,就直接考虑怎么建图趴$QwQ$ 首先看到这个高度减小其实就相当于对这个点的次数有约束,就显然拆点呗,流量为高度然后$S$连向左侧 ...
08_jquery里面的$(this)和this都什么时候用，有什么区别
当你用的是jquery时,就用$(this),如果是JS,就用this $(this).html( $(this).html() + " BAM! "); 这个里的html()是J ...
机器学习实战笔记（一）- 使用SciKit-Learn做回归分析
一.简介这次学习的书籍主要是Hands-on Machine Learning with Scikit-Learn and TensorFlow(豆瓣:https://book.douban.com ...
Django之form组件自动校验数据
目录一.form介绍二.普通方式手写注册功能 views.py register.html 三.使用form组件实现注册功能 views.py register2.html 四.pycharm的专 ...
UGUI ScrollView中显示模型和特效
游戏开发中有时候会遇到在UI上显示模型和特效的需求,这次需要在ScrollView上显示.我们使用UGUI的Screen Space - Camera模式,修改模型和特效的layer使之显示在UI上面 ...
python字典的遍历
遍历字典: keys() .values() .items() 1. xxx.keys() : 返回字典的所有的key 返回一个序列,序列中保存有字典的所有的键效果图: 代码: ...
cogs 2109. [NOIP 2015] 运输计划提高组Day2T3 树链剖分求LCA 二分答案差分
2109. [NOIP 2015] 运输计划 ★★★☆ 输入文件:transport.in 输出文件:transport.out 简单对比时间限制:3 s 内存限制:256 MB [题 ...

hadoop_2.6.5集群安装

hadoop_2.6.5集群安装的更多相关文章

随机推荐

热门专题