hadoop+eclipse集群搭建及测试
前段时间搭了下hadoop,每次都会碰到很多问题,也没整理过,每次搜索都麻烦,现在整理下
一.准备工作
1.准备俩计算机,安装linux系统,分别装好jdk(虚拟机操作一样)
nano /etc/hostname 修改hostname
nano /etc/hosts 添加ip及hostname信息
2.计算机信息如下
| 主机名 | ip地址 | 作用 | 启动的进程 |
| test1 | 192.168.155.2 | master/slave | namenode,jobtracker,secondarynamenode |
| test2 | 192.168.155.3 | slave | datanode,tasktracker |
注:要配置多个节点的集群操作一样,我就按着两台来了,配置差不多就行。我的环境:ubuntu13.0.4+jdk1.7+hadoop1.0.4+hbase0.94.3
特别提醒:各台机子使用相同用户名,各安装目录均相同,比如hadoop目录都为/home/smallby/hadoop-1.0.4
3.用户选择
分别创建用户hadoop,属于hadoop用户组
useradd hadoop
cd /home/hadoop
chown -R hadoop /usr/local/hadoop-0.20./
chgrp -R hadoop /usr/local/hadoop-0.20./
4.ssh免登陆
4.1.安装ssh
sudo apt-get install ssh
netstat -nat 查看22端口是否开启了。
ssh localhost 测试ssh,输入密码,回车
4.2.ssh免登陆配置
ssh-keygen -t rsa 生成的密钥对id_rsa,id_rsa.pub
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys 把id_rsa.pub追加到授权的key里面去,若无权限使用chmod赋权限
ssh localhost 再次测试,输入yes,发现本机已不用输入密码登陆
scp ~/.ssh/authorized_key test2:/home/hadoop/.ssh/ 测试test2节点,ssh test2,输入yes,成功免密码登陆
二.配置阶段
1.配置hadoop
下载解压缩hadoop-1.0.4至home目录,在home下可看到hadoop-1.0.4目录,进入conf目录
1.1修改hadoop-env.sh
尾部添加
export JAVA_HOME=/home/hadoop/jdk1..0_51 为安装jdk的目录
1.2修改core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://test1:9000</value> //namenode路径
</property>
<property>
<name>hadoop.tmp.dir</name> //hadoop临时路径
<value>/home/hadoop/hadoop_1.0.4/var</value>
</property>
</configuration>
1.3修改hdfs-site.xml
<configuration>
<property>
<name>dfs.name.dir</name>
<value>/home/hadoop/name1, /home/hadoop/name2</value> //hadoop的name目录路径
<description> </description>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/hadoop/data1, /home/hadoop/data2</value>
<description> </description>
</property>
<property>
<name>dfs.replication</name>
<value></vaue> //俩节点,备份2份。这里的数目不能超过节点数
</property>
</configuration>
1.4修改mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>test1:</value>
</property>
<property>
<name>mapred.local.dir</name>
<value>/home/hadoop/hadoop_1.0.4/var</value>
</property>
</configuration>
1.5修改masters,slaves
masters test1 slaves test1
test2
2.配置环境变量
nano ~/.bashrc
尾部添加
#java
export JAVA_HOME=/home/hadoop/jdk1.7.0_51
export PATH=$PATH:$JAVA_HOME/bin
#hadoop
export HADOOP_HOME=/home/hadoop/hadoop-1.0.4
export PATH=$PATH:$HADOOP_HOME/bin
. ~/.bashrc
3.向节点中传送hadoop文件
scp -r /home/hadoop/hadoop-1.0.4 hadoop@test2:/home/hadoop/
4.格式化namenode
hadoop namenode -format
5.启动hadoop
start-all.sh
使用jps在test1看到datanode,namenode,jobtracker,tasktracker,secondnamenode
test2看到datanode,tasktracker
进入test1:50030看到俩节点
6.停止hadoop
stop-all.sh
时间仓促,hbase和eclipse还没整理
hadoop+eclipse集群搭建及测试的更多相关文章
- Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
- hadoop+spark集群搭建入门
忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...
- Hadoop+HBase 集群搭建
Hadoop+HBase 集群搭建 1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP ...
- hadoop ha集群搭建
集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...
- Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04
前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...
- hadoop 3.x 完全分布式集群搭建/异常处理/测试
共计三台虚拟机分别为hadoop002(master,存放namenode),hadoop003(workers,datanode以及resourcemanage),hadoop004(workers ...
- hadoop分布式集群搭建(2.9.1)
1.环境 操作系统:ubuntu16 jdk:1.8 hadoop:2.9.1 机器:3台,master:192.168.199.88,node1:192.168.199.89,node2:192.1 ...
- Hadoop分布式集群搭建_1
Hadoop是一个开源的分布式系统框架 一.集群准备 1. 三台虚拟机,操作系统Centos7,三台主机名分别为k1,k2,k3,NAT模式 2.节点分布 k1: NameNode DataNode ...
- hadoop分布式集群搭建前期准备(centos7)
那玩大数据,想做个大数据的从业者,必须了解在生产环境下搭建集群哇?由于hadoop是apache上的开源项目,所以版本有些混乱,听说都在用Cloudera的cdh5来弄?后续研究这个吧,就算这样搭建不 ...
随机推荐
- Adjacent Bit Counts(动态规划 三维的)
/** 题意: 给出一个01串 按照题目要求可以求出Fun(X)的值 比如: 111 Fun(111)的值是2: 输入: t (t组测试数据) n k (有n位01串 Fun()的值为K) 输出:有多 ...
- python-从redis数据库中读数据
读string,list,set,sort_set,hash类型的数据 import redis class DataBase: def __init__(self, host, port): sel ...
- STRUCTS 2 LABLE
{LJ?Dragon}[标题]structs2标签的作用 {LJ?Dragon}[Diary]2017年,愉快的开始:离别不一定总伤感,虽然只是安慰着自己......... 问与答 问题 在Strut ...
- ASP.NET DropDownList1_SelectedIndexChanged使用
DropDownList1.AutoPostBack 属性 今天写代码给DropDownList1添加DropDownList1_SelectedIndexChanged事件,在运行测试时发现Drop ...
- HDU 2066-一个人的旅行(最短路Dijkstra)
一个人的旅行 Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Sub ...
- ORACLE 11G EXP导出空表方法
EXP在导出11G的库的时候,与过去10G,9I的版本有很大的差别. 就是没有数据的表是不会分配空间的. 从Oracle 11.2.0.1版本开始,Oracle又提供了一种新的空间分配方法: Crea ...
- SmartFoxServer 2x的pythonclient
最近的研究SmartFoxServer 2x.这是一个对网络游戏的Web开发框架.服务器基于java netty为发展框架,client支持flash,unity, ios, android(java ...
- JVM中java类的加载时机(转载:http://blog.csdn.net/chenleixing/article/details/47099725)
Java虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的加载机制.类从被加载到虚拟机内存中开始,到卸载出内 ...
- HUD 2089 位数dp
/* 做的不多的位数dp 暴力的话 不知道多少组数据 会T 所以写dp 思路就和数学课本上那种“不超过xxx的x位偶数有几个” 这里可以类似的维护一个前缀和模样的东西(但又不同于前缀和) 状态:f[i ...
- C#学习第四天
今天主要学习了结构方面的知识,首先是定义,代码: struct<typeName> { <memberDeclarations> } struct route { public ...