01.hadoop集群环境搭建

hadoop集群搭建的步骤

1.安装jdk
2修改ip地址
3.关闭防火墙
4.修改hostname
5.设置ssh自动登陆
6.安装hadoop
-----------------------------------------------------------------------
1.1安装jdk

上传jdk-6u24-linux-i586.bin到/home/

#cd /home/

#./jdk-6u24-linux-i586.bin

#mv jdk-6u24-linux-i586.bin jdk

#vi /etc/profile，在文件尾部添加

export JAVA_HOME=/home/jdk

export PATH=$JAVA_HOME/bin:$PATH

保存退出

#source /etc/profile

#java -version

1.2修改ip地址

ifcfg-eth0文件参考：
vim /etc/sysconfig/network-scripts/ifcfg-eth0

DEVICE="eth0"

BOOTPROTO="static"

ONBOOT="yes"

TYPE="Ethernet"

IPADDR=192.168.8.100

GATEWAY=192.168.8.1

1.3关闭防火墙，修改主机名（hostname）

#hostname <机器名>

#vi /etc/sysconfig/network

HOSTNAME=<机器名> 保存退出，重启

修改/etc/hosts

修改/etc/sysconfig/network-scripts/相应的网络配置

关闭防火墙

#service iptables stop

1.5.设置ssh免密码登录
　
Hadoop运行过程中需要管理远端Hadoop守护进程，在Hadoop启动以后，NameNode是通过SSH（Secure
Shell）来无密码登录启动和停止各个DataNode上的各种守护进程的同样原理，DataNode上也能使用SSH无密码登录到NameNode。

从namenode到本身及各datanode免密码登录

在各机器上执行

#ssh-keygen -t rsa一路回车

在~/.ssh/生成文件id_rsa id_rsa.pub

在namenode机器上执行：

#cd ~/.ssh/

#scp id_rsa.pub root@<各datanode的IP>:/home

在各datanode机器上执行：

#cd /home/

#cat id_rsa.pub >>/root/.ssh/authorized_keys

1.6.安装hadoop
1.6.1在namenode上安装hadoop

Hadoop的安装位置（HADOOP_HOME）：/HOME/hadoop

1.用软件上传hadoop-1.0.4.tar.gz到/home

#cp hadoop-1.0.4.tar.gz /home

2.解压文件

#cd /home

#tar -zxvf hadoop-1.0.4.tar.gz

#mv hadoop-1.0.4 hadoop

3.修改/etc/profile

#vi /etc/profile

export JAVA_HOME=/home/java

export HADOOP_HOME=/home/hadoop

export PATH=$JAVA_HOME/bin:$PATH:$HADOOP_HOME/bin

保存退出

#source /etc/profile

1.6.3修改hadoop的配置文件

1.修改conf/hadoop-env.sh

export JAVA_HOME=/home/java

export HADOOP_PID_DIR=/home/hadoop/pids

保存退出

2.配置conf/core-site.xml，增加以下内容

<name>fs.default.name</name>

<value>hdfs://hadoop00:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/tmp</value>

</property>

3.配置conf/hdfs-site.xml

<name>dfs.replication</name>

</property>

4.配置conf/mapred-site.xml

<name>mapred.job.tracker</name>

<value>hdfs://hadoop00:9001/</value>

</property>

5.配置master节点

配置conf/masters

hadoop00

6.pei'zhi配置slaves节点

配置conf/slaves

hadoop01

hadoop02

hadoop03

7:复制hadoop到各datanode并修改

把hadoop00的hadoop目录、jdk目录、/etc/hosts、/etc/profile复制到hadoop01，hadoop02、hadoop03节点

#cd $HADOOP_HOME/..

#scp -r hadoop hadoop01:/home

#scp -r hadoop hadoop02:/home

#scp -r hadoop hadoop03:/home

1.6.4启动和停止hadoop集群

终端查看集群状态：

#hadoop dfsadmin -report

在hadoop0上

第一次启动Hadoop,必须先格式化namenode

#cd $HADOOP_HOME /bin

#hadoop namenode –format

启动Hadoop

#cd $HADOOP_HOME/bin

#./start-all.sh

如果启动过程，报错safemode相关的Exception

执行命令

# hadoop dfsadmin -safemode leave

然后再启动Hadoop

停止Hadoop

cd $HADOOP_HOME/bin

#./stop-all.sh

01.hadoop集群环境搭建的更多相关文章

hadoop集群环境搭建之zookeeper集群的安装部署
关于hadoop集群搭建有一些准备工作要做,具体请参照hadoop集群环境搭建准备工作 (我成功的按照这个步骤部署成功了,经实际验证,该方法可行) 一.安装zookeeper 1 将zookeeper ...
hadoop集群环境搭建之安装配置hadoop集群
在安装hadoop集群之前,需要先进行zookeeper的安装,请参照hadoop集群环境搭建之zookeeper集群的安装部署 1 将hadoop安装包解压到 /itcast/ (如果没有这个目录 ...
hadoop集群环境搭建准备工作
一定要注意hadoop和linux系统的位数一定要相同,就是说如果hadoop是32位的,linux系统也一定要安装32位的. 准备工作: 1 首先在VMware中建立6台虚拟机(配置默认即可).这是 ...
Hadoop集群环境搭建步骤说明
Hadoop集群环境搭建是很多学习hadoop学习者或者是使用者都必然要面对的一个问题,网上关于hadoop集群环境搭建的博文教程也蛮多的.对于玩hadoop的高手来说肯定没有什么问题,甚至可以说事“ ...
Spark集群环境搭建——Hadoop集群环境搭建
Spark其实是Hadoop生态圈的一部分,需要用到Hadoop的HDFS.YARN等组件. 为了方便我们的使用,Spark官方已经为我们将Hadoop与scala组件集成到spark里的安装包,解压 ...
大数据 -- Hadoop集群环境搭建
首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网 ...
简单Hadoop集群环境搭建
最近大数据课程需要我们熟悉分布式环境,每组分配了四台服务器,正好熟悉一下hadoop相关的操作. 注:以下带有(master)字样为只需在master机器进行,(ALL)则表示需要在所有master和 ...
Hadoop集群环境搭建(一)
1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据的存储,集群中的角色主要有 NameNode / DataN ...
Java+大数据开发——Hadoop集群环境搭建(一)
1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据的存储,集群中的角色主要有 NameNode / DataN ...

随机推荐

pytest.7.常见套路
From: http://www.testclass.net/pytest/common_useage/ 在使用pytest的时候,下面这些问题我们可能会经常遇到,这里给出官方的解决方案,按照套路来执 ...
Selenium+Python：下载文件(Firefox 和 Chrome)
引自 https://blog.csdn.net/Momorrine/article/details/79794146 1. 环境操作系统 Win10 IDE Eclipse (Oxyg ...
【Maven】从Maven中导出项目依赖的Jar包
从SVN上下载源代码 svn export https://10.200.1.201/xxxx/PLATFORM code/ --force --username xxx --password xxx ...
QT中实现应用程序的单例化
一介绍通过编写一个QSingleApplication类,来实现Qt程序的单例化,原文的作者是在Windows Vista + Qt4.4 下实现的,不过应用在其他平台上是没问题的.(本文是我在ht ...
【SQL Server】MS SQL Server中的CONVERT日期格式化大全
CONVERT 函数将某种数据类型的表达式显式转换为另一种数据类型.SQL Server中将日期格式化. SQL Server 支持使用科威特算法的阿拉伯样式中的数据格式. 在表中,左侧的两列表示将 ...
廖雪峰Java2面向对象编程-3继承和多态-2多态
1.重载子类覆写父类的方法称为重载Override. 父类和子类拥有一摸一样的方法(方法的名字.返回值.参数是相同的,但是方法的语句是不一样的) 方法签名如果不同就不是重载,而是创建了一个新的方法. ...
TextView 多文字字体颜色及多事件监听
像微信朋友圈点赞功能如:张三.李四.王五.这种格式最早做法是在layout中创建一个父类容器如linearlayout然后在创建一个子layout,在代码中通过for循环addView添加到父类容 ...
T-SQL 简单子查询
1.使用变量的方式实现的查询 use StudentManageDB go declare @StuId int --查询张永利学号 select @StuId=StudentId from Stud ...
C/C++ 与 Python 的通信
作者:Jerry Jho链接:https://www.zhihu.com/question/23003213/answer/56121859来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商 ...
SAS 输出内容到HTML
OPTIONS USER=SASHELP; ODS TAGSETS.HTMLPANEL PATH='F:\'(URL=NONE) FILE='A.HTML'; ODS GRAPHICS ON/IMAG ...

01.hadoop集群环境搭建

01.hadoop集群环境搭建的更多相关文章

随机推荐

热门专题