Hadoop生态和其他生态最大的不同之一就是“单一平台多种应用”的理念了。

hadoop能解决是什么问题:

1、HDFS :海量数据存储

MapReduce: 海量数据分析

   YARN :资源管理调度

理解: 1、资源管理调度(YARN)通过海量数据分析(MapReduce)进行对海量数据(HDFS)进行分析运算。  其中MapReduce是通过开发人员进行开发利用。

    2、Hadoop在2.0将资源管理从MapReduce中独立出来变成通用框架后,就从1.0的三层结构演变为了现在的四层架构:

    1.   底层——存储层,文件系统HDFS

    2.   中间层——资源及数据管理层,YARN以及Sentry等

    3.   上层——MapReduce、Impala、Spark等计算引擎

    4.   顶层——基于MapReduce、Spark等计算引擎的高级封装及工具,如Hive、Pig、Mahout等等

  

2、安装hadoop

  下载hadoop安装包并解压,解压后看到如下目录:

  bin: 可执行文件存放对hadoop相关服务(HDFS,YARN)进行操作的脚本

  sbin:hadoop系统可执行文件存放启动或停止hadoop相关服务的脚本

etc:hadoop的配置文件目录,存放hadoop的配置文件

lib  :存放hadoop的本地库(对数据进行压缩解压缩功能)

  share:存放hadoop的依赖jar包和文档,文档可以被删除掉

3、修改hadoop配置文件

  修改 hadoop-2.4.1/etc/hadoop目录下:

    core-site.xml 文件:

              <configuration>

              <!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的master节点(老大节点)(NameNode)的地址 -->

                <property>
                  <name>fs.defaultFS</name>
                  <value>hdfs://hadoop1:9000/</value>
                </property>

                <property>
                  <name>hadoop.tmp.dir</name>
                  <value>/home/hadoop/app</value>
                </property>

              </configuration>

    hdfs-site.xml 文件:        

              <configuration>
                <property>

                    <!-- 配置HDFS副本的数量 -->
                  <name>dfs.replication</name>
                  <value>1</value>
                </property>
              </configuration>

    注意:至此HDFS已经可以独立运行

    mapred-site.xml 文件:

              <configuration>
                <property>

                  <!-- 指定mr运行在yarn上 -->
                  <name>mapreduce.framework.name</name>
                  <value>yarn</value>

                </property>

              </configuration>

    yarn-site.xml 文件:

              <configuration>

              <!-- 指定YARN的老大(ResourceManager)的地址 -->

              <!-- Site specific YARN configuration properties -->
                <property>
                  <name>yarn.resourcemanager.hostname</name>
                  <value>hadoop1</value>  

                </property>

              <!-- reducer获取数据的方式 -->

                <property>
                  <name>yarn.nodemanager.aux_services</name>
                  <value>mapreduce_shuffle</value>
                </property>

</configuration>

4、此时,基本配置都已完成,但需要关闭防火墙,以免防火请将hadoop需要的端口禁用掉。

    查看防火墙状态:service iptables status

    打开防火墙:service iptables start

    关闭防火墙:service iptables stop

    查看防火墙启动配置:sudo chkconfig iptables  --list  

      

         分别表示服务的七个档 :

            # 0 - 停机
            # 1 - 单用户模式 
            # 2 - 多用户,没有NFS 
            # 3 - 完全多用户模式(标准的运行级) 
            # 4 - 没有用到 
            # 5 - X11(xwindow) 
            # 6 - 重新启动

    开机不自启动防火请:chkconfig  iptables off

5、linux 环境变量配置

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL
export JAVA_HOME=/home/hadoop/jdk1.7.0_65
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
export HADOOP_HOME=/home/hadoop/app/hadoop-2.4.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

6、修改 /home/hadoop/app/hadoop-2.4.1/etc/hadoop/hadoop-env.sh文件

  不修改的话,启动时,会报错JAVA_HOME找不到。

 

到此,hadoop配置基本完成

hadoop学习笔记壹 --环境搭建及配置文件的修改的更多相关文章

  1. Android Studio 学习笔记(一)环境搭建、文件目录等相关说明

    Android Studio 学习笔记(一)环境搭建.文件目录等相关说明 引入 对APP开发而言,Android和iOS是两大主流开发平台,其中区别在于 Android用java语言,用Android ...

  2. Hadoop学习之基础环境搭建

    期望目的 基于VMware workstation 10.0 + CentOS 7 + hadoop 3.2.0,在虚拟机上搭建一套Hadoop集群环境,总共包含4个节点,其中1个master节点.3 ...

  3. 我的Java学习笔记 -开发环境搭建

    开始学习Java~ 一.Java简介 Java编程语言是一种简单.面向对象.分布式.解释型.健壮安全.与系统无关.可移植.高性能.多线程和动态的语言. Java分为三个体系: JavaSE(J2SE) ...

  4. Django学习笔记 开发环境搭建

    为什么使用django?1.支持快速开发:用python开发:数据库ORM系统,并不需要我们手动地构造SQL语句,而是用python的对象访问数据库,能够提升开发效率.2.大量内置应用:后台管理系统a ...

  5. cocos2d-x lua 学习笔记(1) -- 环境搭建

    Cocos2d-x 3.0以上版本的环境搭建和之前的Cocos2d-x 2.0 版差异较大的,同时从Cocos2d-x 3.0项目打包成apk安卓应用文件,搭建安卓环境的步骤有点繁琐,但搭建一次之后, ...

  6. Mybatis学习笔记之---环境搭建与入门

    Mybatis环境搭建与入门 (一)环境搭建 (1)第一步:创建maven工程并导入jar包 <dependencies> <dependency> <groupId&g ...

  7. 【Django学习笔记】-环境搭建

    对于初学django新手,根据以下步骤可以快速进行Django环境搭建 虚拟环境创建 使用virtualenv创建并启用虚拟机环境 ,关于virtualenv可参考https://www.yuque. ...

  8. SpringData JPA的学习笔记之环境搭建

    一.环境搭建 1.加入jar包   spring jar+jpa jar +springData jar >>SpringData jar包     2.配置applicationCont ...

  9. 前端框架vue学习笔记:环境搭建

    兼容性 不兼容IE8以下 Vue Devtools 能够更好的对界面进行审查和调试 环境搭建 1.nodejs(新版本的集成了npm)[npm是node包管理 node package manager ...

随机推荐

  1. mui 实用封装销毁页面

    /* * 描述:页面销毁封装 * 说明:针对订单特殊定位页面 * 返回首页,页面空白前进行销毁页面处理 * 使用:plusReady之后 */ (function(w) { var destructi ...

  2. MySQL学习(三) SQL基础查询

    其实在数据库最经常用的当属查询操作 基本语法 SELECT [ALL | DISTINCT | DISTINCTROW ] 字段列表 AS 字段别名 [FROM 表名 WHERE 条件表示式 GROU ...

  3. 详解 ESLint 规则,规范你的代码

    在很久之前就想通过工具来规范自己的代码风格,减少程序出错的概率,如果看过我的 一个前端程序猿的Sublime Text3的自我修养 ,这篇博客的朋友,肯定知道在当时我使用 SublimeLinter- ...

  4. 关于wsgi协议的理解

    基础概念 首先要了解 WSGI 规范的概念,WSGI(Web Server Gateway Interface)规范描述了web server(Gunicorn,uWSGI等)如何与web appli ...

  5. 【20181031】arcgis10.6破解不成功的问题

    首先需要下好正确版本的crack文件,license10.6文件夹里应该有ARCGIS.exe和service.txt两个文件,我的问题就是因为crack文件不完整,没有ARCGIS.exe文件,所以 ...

  6. 【读书笔记】iOS-对iOS应用进行模糊测试

    一,模糊测试,是指通过反复向待测应用发送畸形的数据,对应用进行动态测试的过程. 二,模糊测试,也称动态分析,是一种构造非法输入并将其提供给应用,以期让应用暴露出某些安全问题的艺术和科学. 参考资料:& ...

  7. PL/SQL Developer使用小技巧

    1.PL/SQL Developer记住登陆密码         在使用PL/SQL Developer时,为了工作方便希望PL/SQL Developer记住登录Oracle的用户名和密码:    ...

  8. linux定时任务调度定系统——opencron

    linux定时任务调度定系统——opencron https://gitee.com/terrytan/opencron/#%E8%BF%90%E8%A1%8C%E7%8E%AF%E5%A2%83 一 ...

  9. Kotlin入门(16)容器的遍历方式

    Kotlin号称全面兼容Java,于是乎Java的容器类仍可在Kotlin中正常使用,包括大家熟悉的队列ArrayList.映射HashMap等等.不过Kotlin作为一门全新的语言,肯定还是要有自己 ...

  10. 洗礼灵魂,修炼python(42)--巩固篇—type内置函数与类的千丝万缕关系

    type函数的隐藏属性 相信大家都知道内置函数type是用来查看对象的数据类型的.例: 那比如我对int类查看类型呢? 有朋友会说,int是内置类啊,用自定义的应该不会这样,我们自定义一个类呢? 还是 ...