前段时间搭了下hadoop,每次都会碰到很多问题,也没整理过,每次搜索都麻烦,现在整理下

一.准备工作

  1.准备俩计算机,安装linux系统,分别装好jdk(虚拟机操作一样)

  nano /etc/hostname  修改hostname 
  nano /etc/hosts 添加ip及hostname信息

2.计算机信息如下

主机名 ip地址 作用 启动的进程
test1   192.168.155.2 master/slave namenode,jobtracker,secondarynamenode
test2 192.168.155.3 slave datanode,tasktracker

  

注:要配置多个节点的集群操作一样,我就按着两台来了,配置差不多就行。我的环境:ubuntu13.0.4+jdk1.7+hadoop1.0.4+hbase0.94.3

特别提醒:各台机子使用相同用户名,各安装目录均相同,比如hadoop目录都为/home/smallby/hadoop-1.0.4

  3.用户选择

分别创建用户hadoop,属于hadoop用户组

useradd hadoop
cd /home/hadoop
chown -R hadoop /usr/local/hadoop-0.20./
chgrp -R hadoop /usr/local/hadoop-0.20./

  4.ssh免登陆  

   4.1.安装ssh

sudo apt-get install ssh  
netstat -nat 查看22端口是否开启了。 
ssh localhost  测试ssh,输入密码,回车

   4.2.ssh免登陆配置

ssh-keygen  -t  rsa                                生成的密钥对id_rsa,id_rsa.pub
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys 把id_rsa.pub追加到授权的key里面去,若无权限使用chmod赋权限
ssh localhost 再次测试,输入yes,发现本机已不用输入密码登陆
scp ~/.ssh/authorized_key test2:/home/hadoop/.ssh/ 测试test2节点,ssh test2,输入yes,成功免密码登陆

二.配置阶段

  1.配置hadoop

    下载解压缩hadoop-1.0.4至home目录,在home下可看到hadoop-1.0.4目录,进入conf目录

1.1修改hadoop-env.sh

尾部添加
export JAVA_HOME=/home/hadoop/jdk1..0_51 为安装jdk的目录

    1.2修改core-site.xml

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://test1:9000</value> //namenode路径
</property>
<property>
<name>hadoop.tmp.dir</name> //hadoop临时路径
<value>/home/hadoop/hadoop_1.0.4/var</value>
</property>
</configuration>

    1.3修改hdfs-site.xml

<configuration>
<property>
<name>dfs.name.dir</name>
<value>/home/hadoop/name1, /home/hadoop/name2</value> //hadoop的name目录路径
<description> </description>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/hadoop/data1, /home/hadoop/data2</value>
<description> </description>
</property>
<property>
<name>dfs.replication</name>
<value></vaue> //俩节点,备份2份。这里的数目不能超过节点数
</property>
</configuration>

    1.4修改mapred-site.xml

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>test1:</value>
</property>
<property>
<name>mapred.local.dir</name>
<value>/home/hadoop/hadoop_1.0.4/var</value>
</property>
</configuration>    

      1.5修改masters,slaves                                                                           

masters   test1

slaves      test1
test2

2.配置环境变量

nano ~/.bashrc
尾部添加
#java
export JAVA_HOME=/home/hadoop/jdk1.7.0_51
export PATH=$PATH:$JAVA_HOME/bin
#hadoop
export HADOOP_HOME=/home/hadoop/hadoop-1.0.4
export PATH=$PATH:$HADOOP_HOME/bin
. ~/.bashrc

3.向节点中传送hadoop文件

scp -r /home/hadoop/hadoop-1.0.4 hadoop@test2:/home/hadoop/

4.格式化namenode

hadoop namenode -format

5.启动hadoop

start-all.sh
使用jps在test1看到datanode,namenode,jobtracker,tasktracker,secondnamenode
test2看到datanode,tasktracker
进入test1:50030看到俩节点

6.停止hadoop

stop-all.sh

时间仓促,hbase和eclipse还没整理

hadoop+eclipse集群搭建及测试的更多相关文章

  1. Hadoop分布式集群搭建

    layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...

  2. hadoop+spark集群搭建入门

    忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...

  3. Hadoop+HBase 集群搭建

    Hadoop+HBase 集群搭建 1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP ...

  4. hadoop ha集群搭建

    集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...

  5. Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04

    前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...

  6. hadoop 3.x 完全分布式集群搭建/异常处理/测试

    共计三台虚拟机分别为hadoop002(master,存放namenode),hadoop003(workers,datanode以及resourcemanage),hadoop004(workers ...

  7. hadoop分布式集群搭建(2.9.1)

    1.环境 操作系统:ubuntu16 jdk:1.8 hadoop:2.9.1 机器:3台,master:192.168.199.88,node1:192.168.199.89,node2:192.1 ...

  8. Hadoop分布式集群搭建_1

    Hadoop是一个开源的分布式系统框架 一.集群准备 1. 三台虚拟机,操作系统Centos7,三台主机名分别为k1,k2,k3,NAT模式 2.节点分布 k1: NameNode DataNode ...

  9. hadoop分布式集群搭建前期准备(centos7)

    那玩大数据,想做个大数据的从业者,必须了解在生产环境下搭建集群哇?由于hadoop是apache上的开源项目,所以版本有些混乱,听说都在用Cloudera的cdh5来弄?后续研究这个吧,就算这样搭建不 ...

随机推荐

  1. jdk环境变量配置方法

    jdk环境变量配置方法: 在安装完jdk后,还需要对jdk的环境变量进行配置才能正常使用,下面教大家如何配置jdk环境变量: 1.右键选择 计算机→属性→高级系统设置→高级→环境变量 2.系统变量→新 ...

  2. Android从网络中获取xml文件并解析数据

    public class XmlwebData { @SuppressLint("UseValueOf") public static List<Person> get ...

  3. 浅谈二维RMQ

    针对一些二维区间最值问题,用一维RMQ来解决显然是不够的.所以,要改进算法.鉴于网上没有PASCAL版的RMQ标程与解析,所以小可在这里简单的讲一下. 核心思想和一维的一样,只是在计算区间时略有不同. ...

  4. 菜鸟成长日记之新手备忘录-IOS开发第一个项目总结

    2013年5月3号,开始找IOS开发工作(自学了大半年,做了一个功能不全的Demo,该出去见见世面了!),5月4号面试了第一家公司(是家刚成立一段时间的外包公司),5月5号第一家公司已二轮电话面试,5 ...

  5. AbpZero--4.不使用谷歌字体,提升加载速度

    jtable控件样式中会使用到谷歌字体,每次访问都特别慢 1.打开jtable.css文件 [..\MyCompanyName.AbpZeroTemplate.Web\libs\jquery-jtab ...

  6. linux —— ubuntu 初次安装问题

    本文收集了我自己安装ubuntu系统时的一些想法和遇到的一些问题,以及一些我自己感兴趣的软件的安装方法等 1. 50G ubuntu 分区方案 <plan> <key> / & ...

  7. Percona Live 2016 PPT整理-zhaiwx_yinfeng

    https://yq.aliyun.com/articles/54454?spm=5176.100239.bloglist.32.CllwIr

  8. Qt 学习之路:线程和事件循环

    前面一章我们简单介绍了如何使用QThread实现线程.现在我们开始详细介绍如何“正确”编写多线程程序.我们这里的大部分内容来自于Qt的一篇Wiki文档,有兴趣的童鞋可以去看原文. 在介绍在以前,我们要 ...

  9. migrate from weblogic to tomcat: directory mapping--reference

    Question: I am trying to migrate from weblogic to tomcat. in weblogic I have <virtual-directory-m ...

  10. Undefined symbols for architecture i386

    这个错误的发生原因一般是“XXX”这个文件(类库)虽然引入了工程中,但是由于种种原因(常见于多人开发,svn同步不规范)导致“XXX”并未被添加到project.pbxproj这个文件中. 解决方法是 ...