大数据学习——hadoop2.x集群搭建

1.准备Linux环境

    1.0先将虚拟机的网络模式选为NAT

    1.1修改主机名

        vi /etc/sysconfig/network

        NETWORKING=yes

        HOSTNAME=itcast    ###

    1.2修改IP

        两种方式：

        第一种：通过Linux图形界面进行修改（强烈推荐）

            进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual -> 点击add按钮 -> 添加IP：192.168.1.101 子网掩码：255.255.255.0 网关：192.168.1.1 -> apply

        第二种：修改配置文件方式（屌丝程序猿专用）

            vim /etc/sysconfig/network-scripts/ifcfg-eth0

            DEVICE="eth0"

            BOOTPROTO="static"               ###

            HWADDR="00:0C:29:3C:BF:E7"

            IPV6INIT="yes"

            NM_CONTROLLED="yes"

            ONBOOT="yes"

            TYPE="Ethernet"

            UUID="ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c"

            IPADDR="192.168.1.101"           ###

            NETMASK="255.255.255.0"          ###

            GATEWAY="192.168.1.1"            ###

    1.3修改主机名和IP的映射关系

        vim /etc/hosts

        192.168.1.101    itcast

    1.4关闭防火墙

        #查看防火墙状态

        service iptables status

        #关闭防火墙

        service iptables stop

        #查看防火墙开机启动状态

        chkconfig iptables --list

        #关闭防火墙开机启动

        chkconfig iptables off

关闭linux服务器的图形界面：

vi /etc/inittab 

    1.5重启Linux

        reboot

2.安装JDK

    2.1上传alt+p 后出现sftp窗口，然后put d:\xxx\yy\ll\jdk-7u_65-i585.tar.gz

    2.2解压jdk

        #创建文件夹

        mkdir /home/hadoop/app

        #解压

        tar -zxvf jdk-7u55-linux-i586.tar.gz -C /home/hadoop/app

    2.3将java添加到环境变量中

        vim /etc/profile

        #在文件最后添加

        export JAVA_HOME=/home/hadoop/app/jdk-7u_65-i585

        export PATH=$PATH:$JAVA_HOME/bin

        #刷新配置

        source /etc/profile

3.安装hadoop2.4.1

    先上传hadoop的安装包到服务器上去/home/hadoop/

    注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop

    伪分布式需要修改5个配置文件

    3.1配置hadoop

    第一个：hadoop-env.sh

        vim hadoop-env.sh

        #第27行

        export JAVA_HOME=/usr/java/jdk1.7.0_65

    第二个：core-site.xml

        <!-- 指定HADOOP所使用的文件系统schema（URI），HDFS的老大（NameNode）的地址 -->

        <property>

            <name>fs.defaultFS</name>

            <value>hdfs://weekend-1206-01:9000</value>

        </property>

        <!-- 指定hadoop运行时产生文件的存储目录 -->

        <property>

            <name>hadoop.tmp.dir</name>

            <value>/home/hadoop/hadoop-2.4.1/tmp</value>

    </property>

    第三个：hdfs-site.xml

        <!-- 指定HDFS副本的数量 -->

        <property>

            <name>dfs.replication</name>

            <value>1</value>

    </property>

    <property>

              <name>dfs.secondary.http.address</name>

           <value>192.168.1.152:50090</value>

    </property>

    第四个：mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)

        mv mapred-site.xml.template mapred-site.xml

        vim mapred-site.xml

        <!-- 指定mr运行在yarn上 -->

        <property>

            <name>mapreduce.framework.name</name>

            <value>yarn</value>

    </property>

    第五个：yarn-site.xml

        <!-- 指定YARN的老大（ResourceManager）的地址 -->

        <property>

            <name>yarn.resourcemanager.hostname</name>

            <value>weekend-1206-01</value>

    </property>

        <!-- reducer获取数据的方式 -->

    <property>

            <name>yarn.nodemanager.aux-services</name>

            <value>mapreduce_shuffle</value>

     </property>

    3.2将hadoop添加到环境变量

    vim /etc/proflie

        export JAVA_HOME=/usr/java/jdk1.7.0_65

        export HADOOP_HOME=/itcast/hadoop-2.4.1

        export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    source /etc/profile

    3.3格式化namenode（是对namenode进行初始化）

        hdfs namenode -format (hadoop namenode -format)

    3.4启动hadoop

        先启动HDFS

        sbin/start-dfs.sh

        再启动YARN

        sbin/start-yarn.sh

    3.5验证是否启动成功

        使用jps命令验证

        27408 NameNode

        28218 Jps

        27643 SecondaryNameNode

        28066 NodeManager

        27803 ResourceManager

        27512 DataNode

        http://192.168.1.101:50070 （HDFS管理界面）

        http://192.168.1.101:8088 （MR管理界面）

4.配置ssh免登陆

    #生成ssh免登陆密钥

    #进入到我的home目录

    cd ~/.ssh

    ssh-keygen -t rsa （四个回车）

    执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）

    将公钥拷贝到要免密登陆的目标机器上

    ssh-copy-id localhost

大数据学习——hadoop2.x集群搭建的更多相关文章

大数据之Linux服务器集群搭建
之前写过一篇关于Linux服务器系统的安装与网关的配置,那么现在我们要进一步的搭建多台Linux服务器集群. 关于单台服务器的系统搭建配置就不在赘述了,详情见https://www.cnblogs.c ...
大数据学习之hdfs集群安装部署04
1-> 集群的准备工作 1)关闭防火墙(进行远程连接) systemctl stop firewalld systemctl -disable firewalld 2)永久修改设置主机名 vi ...
Hadoop2.x 集群搭建
Hadoop2.x 集群搭建一些重复的细节参考Hadoop1.X集群完全分布式模式环境部署 1 HADOOP 集群搭建 1.1 集群简介 HADOOP 集群具体来说包含两个集群:HDFS 集群和YA ...
大数据 -- zookeeper和kafka集群环境搭建
一运行环境从阿里云申请三台云服务器,这里我使用了两个不同的阿里云账号去申请云服务器.我们配置三台主机名分别为zy1,zy2,zy3. 我们通过阿里云可以获取主机的公网ip地址,如下: 通过secu ...
大数据【一】集群配置及ssh免密认证
八月迷情,这个月会对大数据进行一个快速的了解学习. 一.所需工具简介首先我是在大数据实验一体机上进行集群管理学习,管理五台实验机,分别为master,slave1,slave2,slave3,cli ...
kafka学习(二)-zookeeper集群搭建
zookeeper概念 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等.Zookeeper是h ...
kafka学习(三)-kafka集群搭建
kafka集群搭建下面简单的介绍一下kafka的集群搭建,单个kafka的安装更简单,下面以集群搭建为例子. 我们设置并部署有三个节点的 kafka 集合体,必须在每个节点上遵循下面的步骤来启动 k ...
【转载】MQTT的学习之Mosquitto集群搭建
本文出自:http://www.cnblogs.com/yinyi521/p/6087215.html 文章钢要: 1.进行双服务器搭建 2.进行多服务器搭建一.Mosquitto的分布式集群部署 ...
redis 学习笔记-cluster集群搭建
一.下载最新版redis 编译目前最新版是3.0.7,下载地址:http://www.redis.io/download 编译很简单,一个make命令即可,不清楚的同学,可参考我之前的笔记: red ...

随机推荐

noip初赛
运算符联结词名称异或 ⊕ 非¬(-) 否定与∧(·) 对应集合∩交集对应按位与符号& 合取或∨(+) 对应集合∪并集对应按位或符号| 析取条件→ ...
[已读]编写高质量代码改善JavaScript程序的188个建议
吐槽一万遍,买的最后悔的一本,没有之一,大量篇幅抄袭<高性能javascript>,我记得还有部分抄袭<javascript精粹>,<javascript模式>有没 ...
sleep与wait的对比
链接:https://www.nowcoder.com/questionTerminal/eeff0fdb43034ee7b43838fb9de4519e来源:牛客网 sleep是线程类(Thread ...
机器学习概念之特征选择（Feature selection）之RFormula算法介绍
不多说,直接上干货! RFormula算法介绍: RFormula通过R模型公式来选择列.支持R操作中的部分操作,包括‘~’, ‘.’, ‘:’, ‘+’以及‘-‘,基本操作如下: 1. ~分隔目标和 ...
Spark网络通信分析
之前分析过spark RPC的基本流程(spark RPC详解),其实无论是RPC还是Spark内部的数据(Block)传输,都依赖更底层的网络通信,本文将对spark的网络通信做一下剖析. 1,概要 ...
IDEA代码注释<斜体>的解决方法
打开设置将上图的checkbox取消勾选即可.
Spring-aop(一)
写一个计算类,计算前后需要打印日志. interface ArithmeticCalculator { public int add(int i, int j); public int sub(int ...
字符串、数组、json
一.字符串 string 1.字符串的定义: (1).var s="haha"; (2).var s=new string ("hello") 对象形式定义 2 ...
JVM内存区域参数配置
转自:https://www.jianshu.com/p/5946c0a414b5 需要提前了解的知识点: JVM内存模型 JVM垃圾回收算法下图是JVM内存区域划分的逻辑图 JVM内存区域逻辑 ...
RHEL6.4上Samba/NFS服务器简单配置
近期在RHEL6.4上尝试搭建一个NAS,底层使用XFS文件系统,对外主要提供samba协议和NFS协议共享,这里把主要步骤记录下来. 环境:RHEL6.4,IP:192.168.50.117 1.关 ...

大数据学习——hadoop2.x集群搭建

大数据学习——hadoop2.x集群搭建的更多相关文章

随机推荐

热门专题