hadoop的集群安装

1、安装JDK，解压jar，配置环境变量

1.1、解压jar

tar -zxvf jdk-7u79-linux-x64.tar.gz -C /opt/install   //将jdk解压到对应的文件目录下

1.2、配置环境变量，

 sudo vim /etc/profile

//添加下面内容：
export JAVA_HOME=/opt/install/jdk1.7.0_79

export PATH=$JAVA_HOME/bin:$PATH

2、下载hadoop压缩包，解压jar，配置文件

2.1、解压jar

tar -zxvf hadoop-1.2.1.tar.gz -C /opt/install  //将jar解压到对应的目录下面

2.2、配置环境变量

 sudo vim /etc/profile

//添加HADOOP_HOME变量，修改path变量
export HADOOP_HOME=/opt/install/hadoop  
export HADOOP_HOME_WARN_SUPPRESS=1  //防止hadoop在操作的时候有警告

export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

2.3、配置hadoop文件

2.3.1、修改hadoop/conf/hadoop-env.sh

//将JAVA_HOME修改为在/etc/profile中配置的环境变量 
export JAVA_HOME=/opt/install/jdk1.7.0_79

2.3.2、修改hadoop/conf/core-site.xml

<configuration>

     <property>

         <name>fs.default.name</name>  //namenode所在主机

         <value>hdfs://192.168.203.128:9000</value>

     </property>

     <property>

         <name>hadoop.tmp.dir</name> //hadoop的临时文件目录

         <value>/opt/data/hadoop1.2</value>

     </property>

</configuration>

2.3.3、修改/hadoop/conf/hdfs-site.xml

<configuration>

     <property>

         <name>dfs.replication</name>  //副本数

         <value>3</value>

     </property>

     <property>

        <name>dfs.permissions</name>   //文件权限

        <value>false</value>

     </property>

</configuration>

2.3.4、修改/hadoop/conf/masters文件，该文件配置的secondnamenode所在位置

192.168.203.128  //自己的主机ip，最好是修改/etc/hosts文件

　 2.3.5、修改hadoop/conf/slaves,该文件配置的datanode

192.168.203.129

192.168.203.130

192.168.203.131

2.3.6、修改/hadoop/conf/mapred-site.xml文件，设置jobtrocker

<configuration>

     <property>

         <name>mapred.job.tracker</name>

         <value>192.168.203.128:9001</value>

     </property>

</configuration>

2.3.7、在其他机器上也进行相同的配置，但是最好是在配置好ssh以后通过 scp的命令进行复制。

3、配置ssh免密码登录

3.1、查看本地是否能够ssh免密码登录

ssh localhost

3.2、如果需要密码就要生成密钥，

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

3.3、配置远程免密码登录，让配置namenode主机能够免密码登录到datanode主机

scp ~/.ssh/id_dsa.pub hadoop@192.168.203.129:~  //将本机的公钥复制到192.168.203.129这台主机上

cat ~/id_dsa.pub >> ~/.ssh/authorized_keys   //在192.168.203.129的主机上执行这条命令，追加公钥到authorized_keys

4、启动hadoop

4.1、跳转到/hadoop/bin目录下，进行namenode的初始化

 hadoop namenode -format

4.2、启动hadoop

./start-all.sh   //启动hdfs已经mapreduce
或
./start-dfs.sh   //启动hdfs

4.3、检验是否启动成功，执行jps命令，看namenode，secondnamenode，。。。等进程是否启动

5、通过hdfs的命令行进行操作，下面是一些简单的命令

hadoop fs -ls / 根目录

hadoop fs -lsr / 递归遍历根目录

hadoop fs -mkdir /user 创建文件夹

hadoop fs -put 文件 hdfs folder 上传文件，如果文件夹路径不存在，文件名字就是定义的名字

hadoop fs -get <hdfs file> <linux folder> 下载在linux中

hadoop fs -text <hdfs file> 查看文件内容

hadoop fs -rm <hdfs file> 删除文件

hadoop fs -rmr <hdfs folder> 删除文件夹

hadoop fs 显示hdfs文件相关参数

hadoop fs -help ls 命令描述

hadoop的集群安装的更多相关文章

基于zookeeper的高可用Hadoop HA集群安装
(1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com ...
hadoop 分布式集群安装
这一套环境搭完,你有可能碰到无数个意想不到的情况. 用了1周的时间,解决各种linux菜鸟级的问题,终于搭建好了.. 沿途的风景,甚是历练. 环境介绍: 系统:win7 内存:16G(最低4G,不然跑 ...
Hadoop分布式集群安装
环境准备操作系统使用ubuntu-16.04.2 64位 JDK使用jdk1.8 Hadoop使用Hadoop 2.8版本镜像下载操作系统操作系统使用ubun ...
Shell脚本完成hadoop的集群安装
虽然整体实现的自动安装,但还是有很多需要完善的地方,比如说: 1. 代码目前只能在root权限下运行,否则会出错,这方面需要加权限判断: 2.另外可以增加几个函数,减少代码冗余: 3.还有一些判断不够 ...
CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
Hadoop多节点集群安装配置
目录: 1.集群部署介绍 1.1 Hadoop简介 1.2 环境说明 1.3 环境配置 1.4 所需软件 2.SSH无密码验证配置 2.1 SSH基本原理和用法 2.2 配置Master无密码登录所有 ...
一步步教你Hadoop多节点集群安装配置
1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统HDFS(Hadoop Distributed Filesys ...
Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS
摘自:http://www.powerxing.com/install-hadoop-cluster/ 本教程讲述如何配置 Hadoop 集群,默认读者已经掌握了 Hadoop 的单机伪分布式配置,否 ...
hadoop学习之hadoop完全分布式集群安装
注:本文的主要目的是为了记录自己的学习过程,也方便与大家做交流.转载请注明来自: http://blog.csdn.net/ab198604/article/details/8250461 要想深入的 ...

随机推荐

四轴飞行器1.2.3 STM32F407时钟配置和升级标准库文件
原创文章,欢迎转载,转载请注明出处这个星期进度比较慢哈,只有周末和晚上下班回来才能做,事件不连续,琐碎的事情又比较多,挺烦的,有多琐碎呢? 1.本人有点小强迫症哈,虽然RTT将文 ...
每天一个小算法（4）----在O(1)时间删除指定结点
O(1)时间内删除结点的思路只能是复制该结点下一个结点的数据,然后删除该结点的下一个结点,来等效删除此结点. 需要注意的地方是删除头结点和尾结点的处理. #include <stdio.h> ...
服务启动项 Start类型详解
注册表的服务启动项 Start类型详解 HKLM\SYSTEM\CurrentControlSet\services\ 下的服务项.不论有没有在services.msc服务管理控制台中显示,在注册表中 ...
简单介绍一下ODI的几个基本概念
简单介绍一下ODI的几个基本概念 ODI的几个基本概念是本文我们主要要介绍的内容,接下来我们就开始介绍这一过程,一起来看看吧! 什么是资料库 ODI资料库可安装在任何支持ANSIISO89的数据库 ...
组合框里添加复选框的方法（使用勾选的假象，用图片代替而已，并非QT原生支持）
组合框可以看作是列表框和文本框的组合,因其占据的空间少,使用操作方便,常被界面设计人员用于界面开发设计中,在有限个输入的条件下,组合框常用来代替文本框,这样从用户使用角度来看,更趋人性化,所见即所得. ...
Jsoup代码解读之二-DOM相关对象
Jsoup代码解读之二-DOM相关对象之前在文章中说到,Jsoup使用了一套自己的DOM对象体系,和Java XML API互不兼容.这样做的好处是从XML的API里解脱出来,使得代码精炼了很多 ...
调用Android自带日历功能（日历列表单、添加一个日历事件）
调用Android自带日历功能觉得这篇文章不错,转载过来. 转载:http://blog.csdn.net/djy1992/article/details/9948393 Android手机配备有 ...
我的MYSQL学习心得 mysql日志
这一篇<我的MYSQL学习心得(十五)>将会讲解MYSQL的日志 MYSQL里的日志主要分为4类,使用这些日志文件,可以查看MYSQL内部发生的事情. 分别是 1.错误日志:记录mysql ...
Windows下Oracle服务介绍
如图,截取的是11gR2下RAC其中一个节点的Oracle服务列表. oracle在处理一般事务时并不需要全部启动其后台的所有服务由于oracle服务所占用系统资源比较大,一般情况下,对于单实例的OR ...
HTML,JAVASCRIPT代码美化demo
看见别人的博客里面的源码展示十分漂亮,一时兴起,就自己做了个. 当然,网上已经有别人做好的非常完善的codemirror.highlight.prettify.而我在写自己的这个小demo之前呢,也没 ...

hadoop的集群安装

hadoop的集群安装的更多相关文章

随机推荐

热门专题