一:准备Linux环境[安装略]
        a.修改主机名
                vim /etc/sysconfig/network
                NETWORKING=yes
                HOSTNAME=kevin1
         b.修改IP(通过修改配置文件)
                 vim /etc/sysconfig/network-scripts/ifcfg-eth0        
                        DEVICE="eth0"
                        BOOTPROTO="static"               
                        HWADDR="00:0C:29:3C:BF:E7"
                        IPV6INIT="yes"
                        NM_CONTROLLED="yes"
                        ONBOOT="yes"
                        TYPE="Ethernet"
                        UUID="ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c"
        IPADDR="192.168.1.118"                                  
NETMASK="255.255.255.0"          
                  GATEWAY="192.168.1.1"                                    
        c.修改主机名和IP的映射关系
                vim /etc/hosts          192.168.1.118        kevin1
        d.关闭防火墙
                  防火墙状态     service iptables status
             关闭防火墙     service iptables stop
                  查看防火墙开机启动状态    chkconfig iptables --list
                  关闭防火墙开机启动        chkconfig iptables off
   e.重启linux  reboot
二:安装JDK
        a.上传        
        b.解压jdk
                创建文件夹 mkdir /soft/
                解压 tar -zxvf tar包 -C /soft/
        c.将java添加到环境变量中
                vim /etc/profile
                #在文件最后添加
                export JAVA_HOME=/root/soft/jdk1.8.0_71                
export PATH=$PATH:$JAVA_HOME/bin
        d.让配置即可生效   source /etc/profile                
三:安装配置hadoop-2.6.5
        注意:hadoop2.x配置文件$HADOOP_HOME/etc/hadoop
伪分布式需要修改5个配置文件
        a.配置hadoop
          1.hadoop-env.sh  
vim hadoop-env.sh  修改export JAVA_HOME=/root/soft/jdk1.8.0_71
          2.core-site.xml
                     <property>  <!—指定HDFS的主节点(NameNode)的地址->
                              <name>fs.defaultFS</name>
                              <value>hdfs://kevin1:9000</value>
                    </property>
                           <property>    <!-指定hadoop运行时产生文件的存储目录 ->
                             <name>hadoop.tmp.dir</name>
                             <value>/root/soft/hadoop-2.6.5/tmp</value>
        </property>
         3.hdfs-site.xml
                <property>   <!-- 指定HDFS副本的数量 -->
                        <name>dfs.replication</name>
                        <value>1</value>
     </property>
         4.mapred-site.xml(mv mapred-site.xml.template mapred-site.xml)
                vim mapred-site.xml
                <property>  <!-- 指定mr运行在yarn上 –->
                        <name>mapreduce.framework.name</name>
                        <value>yarn</value>
      </property>
          5.yarn-site.xml 
                <property>        <!--指定YARN的ResourceManager地址-->
                          <name>yarn.resourcemanager.hostname</name>
                          <value>kevin1</value>
       </property>
                  <property>   <!--mapreduce获取数据的方式-->
                           <name>yarn.nodemanager.aux-services</name>
                           <value>mapreduce_shuffle</value>
        </property>
        

b.将hadoop添加到环境变量 vim /etc/proflie
         export JAVA_HOME=/root/soft/jdk1.8.0_71
         export HADOOP_HOME=/root/soft/hadoop-2.6.5
         export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
c.让配置文件及时生效:source /etc/profile
        
        d.格式化namenode(是对namenode进行初始化)
                hdfs namenode -format                
        e.启动hadoop
                先启动HDFS sbin/start-dfs.sh                        
                再启动YARN sbin/start-yarn.sh                                
        f.验证是否启动成功
                使用jps命令验证,获取到以下进程证明启动成功
                  27408 NameNode
                  28218 Jps
                  27643 SecondaryNameNode
                  28066 NodeManager
                  27803 ResourceManager
                  27512 DataNode
   g.在浏览器中验证
                http://192.168.135.129:50070 (HDFS管理界面)
                http://192.168.135.129:8088  (MR管理界面)
   h.通过上传下载进行测试HDFS功能
      上传命令:hadoop fs –put 文件 hdfs:192.168.135.129:9000/tomcat7
      下载命令:hadoop fs –get hdfs:192.168.135.129:9000/tomcat7 地址
      第2种方式下载:通过浏览器直接点击(可能映射不到)
          添加linux主机名和IP的映射关系
             C:\Windows\System32\drivers\etc\hosts添加
              192.168.135.129  kevin1

i.测试MR
  1.cd  /root/soft/hadoop-2.6.5/share/hadoop/mapreduce
    vim gs.txt  添加相关内容并保存退出
   2.把该文件上传至hdfs上
      Hadoop fs –put 文件路径 hdfs路径
hadoop fs -put goodStudy.txt hdfs://kevin1:9000/gs
      查看是否上传成功:hadoop fs –ls hdfs路径
   3.运行jar测试(命令)
      Hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount hdfs:// computer1:9000/gs hdfs://kevin1:9000/gsCount
   4.浏览器打开文件下载查看统计次数

Hadoop安装-部署-测试的更多相关文章

  1. 记一次Hadoop安装部署过程

    实验名称:Hadoop安装部署 一.实验环境: 虚拟机数量:3个 (1个master,2个slave:slave01,slave02) 主节点master信息: 操作系统:CentOS7.5 软件包位 ...

  2. redis cluster安装部署(测试环境)

    redis 应用于web前端,做缓存和数据存取的速度是挺可观的,最近看了一些资料,手痒了,就弄了一个测试环境,两台方案,试用一下. ##Redis 集群部署## 一,方案调研: 参考博客: http: ...

  3. zookeeper,hadoop安装部署其实与防火墙无关

    网上查看了很多人关于hadoop,zookeeper的文章,大多都把关闭防火墙作为首要前提,个人觉得这大可不必. 首先你需要知道你部署的是什么东西,它需要哪些端口即可.把相关端口打开就可以了啊.然后把 ...

  4. Hive Server 2 安装部署测试

    Hive 0.11 包含了Hive Server 1 和 Hive Server 2,还包含1的原因是为了做到向下兼容性.从长远来看都会以Hive Server 2作为首选 1. 配置hive ser ...

  5. presto-mysql/elasticsearch6.0.0安装部署测试,异种数据源关联查询入门实践

    本文简单记录一次实践使用过程,涉及presto-mysql,presto-elasticsearch,文中参数未做注释,请参考官方文档,希望能帮到大家 1 下载安装 presto-0.228 < ...

  6. Hadoop安装部署

    Hadoop伪分布式搭建 1.准备Linux环境 ①开启网络,ifconfig指令查看ip ②修改主机名为自己名字(hadoop) vim /etc/sysconfig/network NETWORK ...

  7. nfs服务安装部署测试

    nfs:网络文件系统作用:某个文件或目录共享,使其它用户可以通过网络访问此共享目录或文件.***特别注意共享的目录权限1.使用nfs需要先安装 yum install -y nfs-utils rpc ...

  8. Hadoop+Hbas完全分布式安装部署

    Hadoop安装部署基本步骤: 1.安装jdk,配置环境变量. jdk可以去网上自行下载,环境变量如下: 编辑  vim  /etc/profile 文件,添加如下内容: export JAVA_HO ...

  9. 安装部署Apache Hadoop (本地模式和伪分布式)

    本节内容: Hadoop版本 安装部署Hadoop 一.Hadoop版本 1. Hadoop版本种类 目前Hadoop发行版非常多,有华为发行版.Intel发行版.Cloudera发行版(CDH)等, ...

随机推荐

  1. 不能为虚拟电脑 ubuntu 打开一个新任务.

    使用virtualbox报错: 不能为虚拟电脑 ubuntu3 打开一个新任务. The virtual machine 'ubuntu3' has terminated unexpectedly d ...

  2. PAT乙级-1043. 输出PATest(20)

    给定一个长度不超过10000的.仅由英文字母构成的字符串.请将字符重新调整顺序,按"PATestPATest...."这样的顺序输出,并忽略其它字符.当然,六种字符的个数不一定是一 ...

  3. 【Unity3D与23种设计模式】模板方法模式(Template Method)

    GoF中定义: "在一个操作方法中定义算法的流程,其中某些步骤由子类完成. 模板方法模式让子类在不变更原有算法流程的情况下,还能够重新定义其中的步骤" 每一次武器攻击目标时,都要按 ...

  4. EF ( Entity Framework) 操作ArcCataLog 生成的(Sql Server)空间数据库

    因为项目需求,现在需要利用EF 操作由Arccatalog生成的sql server空间数据库..在此之前,一直没有接触过空间数据库,在操作空间数据库时 绕了许多弯... 因此写一篇随笔做一个总结. ...

  5. 阿里云ECS的CPU100%排查

    一.背景和现象 初创公司,架构lanmp,web前端和后端分开服务器,业务驱动主要是nginx和apache,nginx主要是处理静态文件和反向代理,前后端.搜索引擎.缓存.队列等附加的服务都是用do ...

  6. 通过jersey-client客户端调用Jersey的Web服务模拟CURD

    一.总体说明 通过jersey-client接口,创建客户端程序,来调用Jersey实现的RESTful服务,实现增.删.改.查等操作. 服务端主要是通过内存的方式,来模拟用户的增加.删除.修改.查询 ...

  7. [mysql] MySQL解压缩安装步骤

    以前装的MySQL出问题了,只好卸载了. 又下载了一个mysql-5.6.24-win32.1432006610.zip.msi文件直接安装就行了.这里需要解压到指定目录,配置后可使用. 环境变量配置 ...

  8. Mybatis 常用标签

    MyBatis 的强大特性之一便是它的动态 SQL.如果你有使用 JDBC 或其他类似框架的经验,你就能体会到根据不同条件拼接 SQL 语句有多么痛苦.拼接的时候要确保不能忘了必要的空格,还要注意省掉 ...

  9. http的CA证书安装(也就是https)

    近几年随着安全意识的提高,https流行起来,很多小伙伴不太了解https是什么,其实http和https并没有区别,简单的来说,https就是将http通信进行了加密和解密的一个过程.加上谷歌浏览器 ...

  10. JAVA连接SAP

    1.首先需要在SAP事务码SE37中新建一个可以被远程调用的RFC 事务码:SE37 新建一个函数组:输入事务码SE37回车后,来到函数构建器屏幕,到上面一排菜单栏:转到 -> 函数组 -> ...