hadoop的集群安装
hadoop的集群安装
1、安装JDK,解压jar,配置环境变量
1.1、解压jar
tar -zxvf jdk-7u79-linux-x64.tar.gz -C /opt/install //将jdk解压到对应的文件目录下
1.2、配置环境变量,
sudo vim /etc/profile
//添加下面内容:
export JAVA_HOME=/opt/install/jdk1.7.0_79
export PATH=$JAVA_HOME/bin:$PATH
2、下载hadoop压缩包,解压jar,配置文件
2.1、解压jar
tar -zxvf hadoop-1.2.1.tar.gz -C /opt/install //将jar解压到对应的目录下面
2.2、配置环境变量
sudo vim /etc/profile
//添加HADOOP_HOME变量,修改path变量
export HADOOP_HOME=/opt/install/hadoop
export HADOOP_HOME_WARN_SUPPRESS=1 //防止hadoop在操作的时候有警告
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
2.3、配置hadoop文件
2.3.1、修改hadoop/conf/hadoop-env.sh
//将JAVA_HOME修改为在/etc/profile中配置的环境变量
export JAVA_HOME=/opt/install/jdk1.7.0_79
2.3.2、修改hadoop/conf/core-site.xml
<configuration>
<property>
<name>fs.default.name</name> //namenode所在主机
<value>hdfs://192.168.203.128:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name> //hadoop的临时文件目录
<value>/opt/data/hadoop1.2</value>
</property>
</configuration>
2.3.3、修改/hadoop/conf/hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name> //副本数
<value>3</value>
</property>
<property>
<name>dfs.permissions</name> //文件权限
<value>false</value>
</property>
</configuration>
2.3.4、修改/hadoop/conf/masters文件,该文件配置的secondnamenode所在位置
192.168.203.128 //自己的主机ip,最好是修改/etc/hosts文件
2.3.5、修改hadoop/conf/slaves,该文件配置的datanode
192.168.203.129
192.168.203.130
192.168.203.131
2.3.6、修改/hadoop/conf/mapred-site.xml文件,设置jobtrocker
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>192.168.203.128:9001</value>
</property>
</configuration>
2.3.7、在其他机器上也进行相同的配置,但是最好是在配置好ssh以后通过 scp的命令进行复制。
3、配置ssh免密码登录
3.1、查看本地是否能够ssh免密码登录
ssh localhost
3.2、如果需要密码就要生成密钥,
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
3.3、配置远程免密码登录,让配置namenode主机能够免密码登录到datanode主机
scp ~/.ssh/id_dsa.pub hadoop@192.168.203.129:~ //将本机的公钥复制到192.168.203.129这台主机上 cat ~/id_dsa.pub >> ~/.ssh/authorized_keys //在192.168.203.129的主机上执行这条命令,追加公钥到authorized_keys
4、启动hadoop
4.1、跳转到/hadoop/bin目录下,进行namenode的初始化
hadoop namenode -format
4.2、启动hadoop
./start-all.sh //启动hdfs已经mapreduce
或
./start-dfs.sh //启动hdfs
4.3、检验是否启动成功,执行jps命令,看namenode,secondnamenode,。。。等进程是否启动
5、通过hdfs的命令行进行操作,下面是一些简单的命令
hadoop fs -ls / 根目录
hadoop fs -lsr / 递归遍历根目录 hadoop fs -mkdir /user 创建文件夹 hadoop fs -put 文件 hdfs folder 上传文件,如果文件夹路径不存在,文件名字就是定义的名字 hadoop fs -get <hdfs file> <linux folder> 下载在linux中 hadoop fs -text <hdfs file> 查看文件内容 hadoop fs -rm <hdfs file> 删除文件 hadoop fs -rmr <hdfs folder> 删除文件夹 hadoop fs 显示hdfs文件相关参数 hadoop fs -help ls 命令描述
hadoop的集群安装的更多相关文章
- 基于zookeeper的高可用Hadoop HA集群安装
(1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com ...
- hadoop 分布式集群安装
这一套环境搭完,你有可能碰到无数个意想不到的情况. 用了1周的时间,解决各种linux菜鸟级的问题,终于搭建好了.. 沿途的风景,甚是历练. 环境介绍: 系统:win7 内存:16G(最低4G,不然跑 ...
- Hadoop分布式集群安装
环境准备 操作系统使用ubuntu-16.04.2 64位 JDK使用jdk1.8 Hadoop使用Hadoop 2.8版本 镜像下载 操作系统 操作系统使用ubun ...
- Shell脚本完成hadoop的集群安装
虽然整体实现的自动安装,但还是有很多需要完善的地方,比如说: 1. 代码目前只能在root权限下运行,否则会出错,这方面需要加权限判断: 2.另外可以增加几个函数,减少代码冗余: 3.还有一些判断不够 ...
- CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
- Hadoop多节点集群安装配置
目录: 1.集群部署介绍 1.1 Hadoop简介 1.2 环境说明 1.3 环境配置 1.4 所需软件 2.SSH无密码验证配置 2.1 SSH基本原理和用法 2.2 配置Master无密码登录所有 ...
- 一步步教你Hadoop多节点集群安装配置
1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统HDFS(Hadoop Distributed Filesys ...
- Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS
摘自:http://www.powerxing.com/install-hadoop-cluster/ 本教程讲述如何配置 Hadoop 集群,默认读者已经掌握了 Hadoop 的单机伪分布式配置,否 ...
- hadoop学习之hadoop完全分布式集群安装
注:本文的主要目的是为了记录自己的学习过程,也方便与大家做交流.转载请注明来自: http://blog.csdn.net/ab198604/article/details/8250461 要想深入的 ...
随机推荐
- mysql 特殊语句
1.获取下当前mysql的插件目录select @@plugin_dir 2.mysql移动文件 select load_file('文件路径') into dumpfile '导出路径' 3.des ...
- Cortex-M3动态加载三(模块调用系统函数)
在我的arm动态加载实验中需要解决一个模块调用系统函数的问题,可以使用以下的一个方法.将系统函数固定在某一段地址空间,然后导出这一块的符号表到符号文件中,要记载的模块link的时候使用这个符号表文件, ...
- (iOS)Storyboard/xib小技巧
1.选择被view覆盖住的view 当你想直接在view中选择自己想要的元素时,但是又碍于一个view上叠加的元素太多很难直接选中,那么在这时,你同时按住键盘上的shift和 control键,然后在 ...
- java调用C++ DLL库方法
最近一个项目要开发网页端人脸识别项目,人脸识别的算法已经写好,是C++版,但是网页端要求使用Java后台,这就涉及到Java调用DLL的问题.经过查找,实现了一个简单的例子. 1.第一步,先在Java ...
- ie7(z-index)
父级元素加上position:relative;并设置z-index. 父级元素的z-index优先,子元素的z-index是相对于父级元素的index. <div style="po ...
- BZOJ 4259 残缺的字符串(FFT)
[题目链接] http://www.lydsy.com/JudgeOnline/problem.php?id=4259 [题目大意] 给出两个包含*和小写字母的字符串,*为适配符,可以和任何字符匹配, ...
- hdoj 2546 饭卡(0-1背包)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2546 思路分析:该问题为0-1背包问题的变形题:问题求余额最少,设开始的余额为V,则求得用V-5可以买 ...
- HDU 11488 Hyper Prefix Sets (字符串-Trie树)
H Hyper Prefix Sets Prefix goodness of a set string is length of longest common prefix*number of str ...
- MySql事务无法回滚的原因
使用MySQL时.假设发现事务无法回滚,但Hibernate.Spring.JDBC等配置又没有明显问题时.不要苦恼,先看看MySQL创建的表有没有问题.即表的类型. InnoDB和MyISAM是在使 ...
- hdu 4612 Warm up 双连通缩点+树的直径
首先双连通缩点建立新图(顺带求原图的总的桥数,事实上因为原图是一个强连通图,所以桥就等于缩点后的边) 此时得到的图类似树结构,对于新图求一次直径,也就是最长链. 我们新建的边就一定是连接这条最长链的首 ...