1、 Build Linux env

my env is VM RedHat Linux 6.5 64bit
    set fixed IP    
              vim /etc/sysconfig/network-scripts/ifcfg-eth0

set IP to : 192.168.38.128

modify hostname: vim /etc/hosts

set hostname to :  itbuilder1

2、install JDK

config JDK env variables

3、install Hadoop env

download Apache hadoop pkg

addr:http://archive.apache.org/dist/hadoop/core/stable2/hadoop-2.7.1.tar.gz

3.1  Extract the package to the specified directory

create a dir : mkdir /usr/local/hadoop

extract file to dir : /usr/local/hadoop :tar -zxvf hadoop-2.7.1.tar.gz -C /usr/local/hadoop

3.2 Modify the configuration file

hadoop2.7.1 version need to modify 5 config files :

1、hadoop-env.sh

2、core-site.xml

3、hdfs-site.xml

4、mapred-site.xml(mapred-site.xml.template)

5、yarn-site.xml

these file all under etc of hadoop, the detail dir is : /usr/local/hadoop/hadoop-2.7.1/etc/hadoop/

3.2.1 Modfiy env variable (hadoop-env.sh)

vim hadoop-env.sh

set up JDK root directory, as shown below:

export JAVA_HOME=/usr/java/jdk1.8.0_20

3.2.2  core-site.xml ,set namenode and temp file addr of HDFS.

<configuration>
        <!--set HDFS addr (NameNode) -->
            <property> 
                    <name>fs.defaultFS</name>
                    <value>hdfs://itbuilder1:9000</value>
            </property>
        <!--set dir of Hadoop runtime file storage directory-->
            <property> 
                    <name>hadoop.tmp.dir</name>
                    <value>/usr/local/hadoop/hadoop-2.7.1/tmp</value>
            </property> 
      </configuration>

3.2.3 hdfs-site.xml (set duplicate quantity)

<configuration>
          <property> 
                <name>dfs.replication</name>
                <value>1</value>
            </property>
        </configuration>

3.2.4 mapred-site.xml  ( tell hadoop that later MR runs on yarn )

<configuration>
                <property>
                      <name>mapreduce.framework.name</name>
                        <value>yarn</value>
                  </property>
            </configuration>

3.2.5 yarn-site.xml

<configuration>
                  <!-- tell nodemanager the way to get data is shuffle -->
                  <property> 
                              <name>yarn.nodemanager.aux-services</name>
                                <value>mapreduce_shuffle</value>
                    </property>

<!--set yarn addr (ResourceManager) -->
                    <property>
                              <name>yarn.resourcemanager.hostname</name>
                                <value>itbuilder1</value>
                    </property>

</configuration>

4、add hadoop to env variable

vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.8.0_20
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.7.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

#refresh /etc/profile
 source /etc/profile

5、Initialize (format) file system (HDFS)
    #hadoop namenode -format 
    hdfs namenode -format

6、start hadoop (hdfs yarn)
./start-all.sh (need to input linux password)
./start-hdfs.sh
./start-yarn.sh

View the current process of opening by JPs command

[root@linuxidc ~]# jps
3461 ResourceManager
3142 DataNode
3751 NodeManager
3016 NameNode
5034 Jps
3307 SecondaryNameNode

Access the management interface :
http://192.168.38.128:50070 (hdfs management interface)
http://192.168.38.128:8088 (mr management interface)

Linux_hadoop_install的更多相关文章

随机推荐

  1. 《University Calculus》-chaper13-多重积分-二重积分的引入

    这一章节我们开始对多重积分的研究. 在此之前,我们首先来回忆起积分的过程,在平面中,面临求解不规则图形的面积(常叫曲边梯形)的时候,我们可以采取建立直角坐标系,然后通过得到不规则图形边界的函数表达式f ...

  2. 《算法问题实战策略》-chaper21-树的实现和遍历

    这一章节开始介绍一个数据结构中的一个基本概念——树. 我们从数据结构的解读来解释树结构的重要性,现实世界的数据除了最基本的线性结构(我们常用队列.数组和链表等结构表征),还有一个重要的特性——层级结构 ...

  3. python-类和对象(属性、方法)的动态绑定

    动态绑定 # coding=utf-8 ''' 当我们定义了一个class,创建了一个class的实例后,我们可以给该实例绑定任何属性和方法,这就是动态语言的灵活性 ''' from types im ...

  4. 深入理解java垃圾回收算法

    Java虚拟机的内存区域中,程序计数器.虚拟机栈和本地方法栈三个区域是线程私有的,随线程生而生,随线程灭而灭:栈中的栈帧随着方法的进入和退出而进行入栈和出栈操作,每个栈帧中分配多少内存基本上是在类结构 ...

  5. Spring Boot 启动原理分析

    https://yq.aliyun.com/articles/6056 转 在spring boot里,很吸引人的一个特性是可以直接把应用打包成为一个jar/war,然后这个jar/war是可以直接启 ...

  6. autoIT 自动化上传/下载文件图文详解【python selenium】

    情景: 在用selenium进行web页面自动化时,时不时会遇到上传附件的情况,常见的情况就是一个上传按钮,点击后弹出windows窗口,选择文件后上传,如下图1所示 图1 这种情况超出了seleni ...

  7. Android技术精髓-Bitmap详解

    Bitmap (android.graphics.Bitmap) Bitmap是Android系统中的图像处理的最重要类之一.用它可以获取图像文件信息,进行图像剪切.旋转.缩放等操作,并可以指定格式保 ...

  8. php session_set_save_handler 函数的用法(mysql)(转)

    <?php /*============================文件说明======================================== @filename:     s ...

  9. nginix 笔记

    1. 一个master进程,多个worker进程,worker进程数目可自动配置为核的数目 2. 配置文件ngnix.conf存放在linux的/etc/ngnix目录下

  10. 获取context path或者basePath

    转自:http://hexudonghot.blog.163.com/blog/static/532043422012112264411234/ 在jsp中获取context path或者basePa ...