hadoop的集群安装

1、安装JDK,解压jar,配置环境变量

1.1、解压jar

tar -zxvf jdk-7u79-linux-x64.tar.gz -C /opt/install   //将jdk解压到对应的文件目录下

1.2、配置环境变量,

 sudo vim /etc/profile
//添加下面内容:
export JAVA_HOME=/opt/install/jdk1.7.0_79
export PATH=$JAVA_HOME/bin:$PATH

2、下载hadoop压缩包,解压jar,配置文件

2.1、解压jar

tar -zxvf hadoop-1.2.1.tar.gz -C /opt/install  //将jar解压到对应的目录下面

2.2、配置环境变量

 sudo vim /etc/profile
//添加HADOOP_HOME变量,修改path变量
export HADOOP_HOME=/opt/install/hadoop
export HADOOP_HOME_WARN_SUPPRESS=1 //防止hadoop在操作的时候有警告
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

2.3、配置hadoop文件

2.3.1、修改hadoop/conf/hadoop-env.sh

//将JAVA_HOME修改为在/etc/profile中配置的环境变量 
export JAVA_HOME=/opt/install/jdk1.7.0_79

2.3.2、修改hadoop/conf/core-site.xml

<configuration>
<property>
<name>fs.default.name</name> //namenode所在主机
<value>hdfs://192.168.203.128:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name> //hadoop的临时文件目录
<value>/opt/data/hadoop1.2</value>
</property>
</configuration>

2.3.3、修改/hadoop/conf/hdfs-site.xml

<configuration>
<property>
<name>dfs.replication</name> //副本数
<value>3</value>
</property>
<property>
<name>dfs.permissions</name> //文件权限
<value>false</value>
</property>
</configuration>

2.3.4、修改/hadoop/conf/masters文件,该文件配置的secondnamenode所在位置

192.168.203.128  //自己的主机ip,最好是修改/etc/hosts文件

  2.3.5、修改hadoop/conf/slaves,该文件配置的datanode

192.168.203.129
192.168.203.130
192.168.203.131

2.3.6、修改/hadoop/conf/mapred-site.xml文件,设置jobtrocker

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>192.168.203.128:9001</value>
</property>
</configuration>

2.3.7、在其他机器上也进行相同的配置,但是最好是在配置好ssh以后通过 scp的命令进行复制。

3、配置ssh免密码登录

3.1、查看本地是否能够ssh免密码登录

ssh localhost

3.2、如果需要密码就要生成密钥,

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

3.3、配置远程免密码登录,让配置namenode主机能够免密码登录到datanode主机

scp ~/.ssh/id_dsa.pub hadoop@192.168.203.129:~  //将本机的公钥复制到192.168.203.129这台主机上

cat ~/id_dsa.pub >> ~/.ssh/authorized_keys   //在192.168.203.129的主机上执行这条命令,追加公钥到authorized_keys

4、启动hadoop

4.1、跳转到/hadoop/bin目录下,进行namenode的初始化

 hadoop namenode -format

4.2、启动hadoop

./start-all.sh   //启动hdfs已经mapreduce

./start-dfs.sh //启动hdfs

4.3、检验是否启动成功,执行jps命令,看namenode,secondnamenode,。。。等进程是否启动

5、通过hdfs的命令行进行操作,下面是一些简单的命令

hadoop fs -ls / 根目录
hadoop fs -lsr / 递归遍历根目录 hadoop fs -mkdir /user 创建文件夹 hadoop fs -put 文件 hdfs folder 上传文件,如果文件夹路径不存在,文件名字就是定义的名字 hadoop fs -get <hdfs file> <linux folder> 下载在linux中 hadoop fs -text <hdfs file> 查看文件内容 hadoop fs -rm <hdfs file> 删除文件 hadoop fs -rmr <hdfs folder> 删除文件夹 hadoop fs 显示hdfs文件相关参数 hadoop fs -help ls 命令描述

hadoop的集群安装的更多相关文章

  1. 基于zookeeper的高可用Hadoop HA集群安装

    (1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com ...

  2. hadoop 分布式集群安装

    这一套环境搭完,你有可能碰到无数个意想不到的情况. 用了1周的时间,解决各种linux菜鸟级的问题,终于搭建好了.. 沿途的风景,甚是历练. 环境介绍: 系统:win7 内存:16G(最低4G,不然跑 ...

  3. Hadoop分布式集群安装

        环境准备     操作系统使用ubuntu-16.04.2 64位 JDK使用jdk1.8 Hadoop使用Hadoop 2.8版本     镜像下载  操作系统     操作系统使用ubun ...

  4. Shell脚本完成hadoop的集群安装

    虽然整体实现的自动安装,但还是有很多需要完善的地方,比如说: 1. 代码目前只能在root权限下运行,否则会出错,这方面需要加权限判断: 2.另外可以增加几个函数,减少代码冗余: 3.还有一些判断不够 ...

  5. CentOS下Hadoop-2.2.0集群安装配置

    对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...

  6. Hadoop多节点集群安装配置

    目录: 1.集群部署介绍 1.1 Hadoop简介 1.2 环境说明 1.3 环境配置 1.4 所需软件 2.SSH无密码验证配置 2.1 SSH基本原理和用法 2.2 配置Master无密码登录所有 ...

  7. 一步步教你Hadoop多节点集群安装配置

    1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统HDFS(Hadoop Distributed Filesys ...

  8. Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS

    摘自:http://www.powerxing.com/install-hadoop-cluster/ 本教程讲述如何配置 Hadoop 集群,默认读者已经掌握了 Hadoop 的单机伪分布式配置,否 ...

  9. hadoop学习之hadoop完全分布式集群安装

    注:本文的主要目的是为了记录自己的学习过程,也方便与大家做交流.转载请注明来自: http://blog.csdn.net/ab198604/article/details/8250461 要想深入的 ...

随机推荐

  1. 关于 rand() 函数返回值的值域的疑问

    <C语言参考手册>中关于 rand() 函数有如下描述. (1)rand() 函数的原型 int rand(void); (2)连续调用 rand 将返回 0 到 int 类型的最大可表示 ...

  2. 使用 PyQt 转换网页到 PDF(使用QtWebKit加载完毕后,打印整个窗口就行了,真简单!)

    import sys try: from PyQt4 import QtWebKit from PyQt4.QtCore import QUrl from PyQt4.QtGui import QAp ...

  3. c++ 静态多态与动态多态

    多态polymorphism是指具有多种形态的情况,它能根据单一的标记关联不同的行为.多态是面向对象程序设计的基础.在面向对象程序设计中的多态是一种运行时的多态.C++中有两种多态,称为动多态(运行时 ...

  4. Noip2013错误避免

    很多的时候,我们会说,这道题我会做,算法想出来了,但是这里那里少了一些判断,导致一分未得,或是说变量名错误,或者说干脆是文件名错误.这些都不是理由,如果火箭发射半空爆炸,可以说是控制器中一个运算符错误 ...

  5. 最新 Cocos2d-x 3.2 开发环境搭建(windows环境下)

    本篇是基于Cocos2d-x-3.2和vs2012的环境下配置. 1.先从官方站点(www.cocos2d-x.org)下载 Cocos2d-x-3.2文件. 2.因为Cocos2d-x 3.0以上的 ...

  6. Boost源代码学习---shared_ptr.hpp

    最近观看Boost库源代码.Boost功能强大的库,但它的许多源代码,十一细读太费时间,毕竟,还有其他东西要学.所以我决定脱脂感兴趣的章节,他们的设计思路和难以理解的地方记录. shared_ptr是 ...

  7. foundation 框架 NSString常用总结(二)

    以此作为NSString常用总结(一)的补充 NSString* str = [NSString stringWithFormat:@"I love programing! You, com ...

  8. 如何学习Javascript ?

    先说说学js的条件 论条件,咱是文科生,大学专业工商管理,和计算机毛关系都没:有人说英语,读了四年大学,很遗憾,咱还四级没混过:就咱这条件都学得乐呵呵的,您还等啥.当然学习JS也是有门槛的,就是你的h ...

  9. Could not load type System.ServiceModel.Activation.HttpModule解决办法

    等注册完成后网站就可以打开了. win2008下提示未能从程序集“System.ServiceModel, Version=3.0.0.0问题解决 在Windows Server 2008中的IIS服 ...

  10. Java 日期字符串与日期类型转换

    1.SimpleDateFormat.format 把日期类型转化到指定格式字符串 public static String convToString(Calendar cld,String temp ...