一、hadoop2.0安装部署流程

        1、自动安装部署:Ambari、Minos(小米)、Cloudera Manager(收费)

        2、使用RPM包安装部署:Apache hadoop不支持、HDP与CDH提供

        3、使用jar包安装部署:各版本均提供。(初期为了理解hadoop,建议使用这种方式)

        部署流程:

                准备硬件(Linux操作系统)

                准备软件安装包,并安装基础软件(主要是JDK)

                将hadoop安装包分发到各个节点的同一个目录下,并解压

                修改配置文件

                启动服务

                验证是否启动成功

二、hadoop2.0软硬件准备

        硬件准备:测试环境仅需要一台Linux机器。生成环境需要多台Linux机器。

                建议内存不小于4G(性能)

        软件准备:JDK1.6+(CDH5建议JDK7)、hadoop2.0安装包。

        1、建议使用非root用户安装hadoop。(hadoop某些功能不允许在root用户下操作)

        2、配置SSH免密码登录:为了启动hadoop集群方便。

三、hadoop2.0安装包下载

        建议选择商业公司的免费版本:主要是考虑不需要版本的选择。

http://archive.cloudera.com/cdh4/cdh/4

http://archive.cloudera.com/cdh5/cdh/5

        hadoop目录结构分析:

            bin:最基本的管理脚本和使用脚本所在目录。这些脚本是sbin目录下管理脚本的基础实现。

            etc:配置文件所在的目录,包括core-site.xml、hdfs-site.xml、mapred-site.xml等,yarn-site.xml

            include:对外提供的编程库头文件。通常用于C++程序访问HDFS。

            lib:该目录包含了hadoop对外提供的编程动态库和静态库。

            libexec:各个服务对应的shell配置文件所在目录。

            sbin:hadoop管理脚本所在目录,主要包含HDFS和YARN中各类服务的启动关闭脚本。

            share:hadoop各个模块编译后的jar包所在目录。

四、hadoop2.0测试环境(单机)搭建方法

    此处仅为理论说明。

    1、首先将安装包存放到某个目录下,并解压。

    2、修改解压后的目录中的文件夹etc/hadoop下的xml配置文件:

            hadoop-env.sh修改以下配置:export JAVA_HOME=/home/....

            Slaves文件修改为以下配置:YARN001

            mapred-site.xml中:mapreduce.framework.name=yarn

            core-site.xml:fs.default.name=hdfs://YAR001:8020

            yarn-site.xml:yarn.nodenamager.aux-services=mapreduce_shuffle

            core-site.xml:dfs.replication=1

    3、启动服务:

            格式化HDFS: bin/hadoop namenode -format

            启动HDFS:sbin/start-dfs.sh

            启动YART:sbin/start-yarn.sh

    4、验证是否成功:

            jps查看对应的服务是否已经启动:

            NameNode\DataNode\NodeManager\ResourceManager\SecondaryNameNode

            访问yarn:http://yarn001:8088

            访问hdfs:http://yarn001:50070

    常见问题:

        虚拟机搭建重启后无法启动成功:原因是/tmp文件夹被清空了,配置一个非/tmp的文件夹即可。

        在core-site.xml中添加:dfs.namenode.name.dir=/xxx;   dfs.datanode.data.dir=/xxxx;

五、hadoop2.0生产环境(多机)搭建方法

    1、将安装包存放到某一目录下,并解压。

    2、修改解压目录中的文件夹etc/hadoop下的xml配置文件。

    3、格式化并启动HDFS

    4、启动YARN

    与单机环境的不同之处在于步骤2中修改的配置文件的内容有所不同。以及步骤3 的详细步骤不同。

    HDFS HA部署方法:详见后续文章

    HDFS HA+Federation的部署方法:详见后续文章

    YARN部署方法:详见后续文章

hadoop入门(3)——hadoop2.0理论基础:安装部署方法的更多相关文章

  1. Storm-0.9.0.1安装部署 指导

    可以带着下面问题来阅读本文章: 1.Storm只支持什么传输 2.通过什么配置,可以更改Zookeeper默认端口 3.Storm UI必须和Storm Nimbus部署在同一台机器上,UI无法正常工 ...

  2. 大数据篇:DolphinScheduler-1.2.0.release安装部署

    大数据篇:DolphinScheduler-1.2.0.release安装部署 1 配置jdk #查看命令 rpm -qa | grep java #删除命令 rpm -e --nodeps xxx ...

  3. 微服务(入门一):netcore安装部署consul

    环境准备  vs开发环境:vs2017 consul版本: 1.4.4 netcore版本:2.1 安裝Consul  1.从官网下载consul到本地,选择系统对应的版本进行下载到本地,下载地址:h ...

  4. kafka_2.11-2.0.0_安装部署

    参考博文:kafka 配置文件参数详解 参考博文:Kafka[第一篇]Kafka集群搭建 参考博文:如何为Kafka集群选择合适的Partitions数量 参考博文:Kafka Server.prop ...

  5. elasticsearch+kibana+metricbeat安装部署方法

    elasticsearch+kibana+metricbeat安装部署方法 本文是elasticsearch + kibana + metricbeat,没有涉及到logstash部分.通过beat收 ...

  6. 【原创 Hadoop&Spark 动手实践 1】Hadoop2.7.3 安装部署实践

    目录: 第一部分:操作系统准备工作: 1. 安装部署CentOS7.3 1611 2. CentOS7软件安装(net-tools, wget, vim等) 3. 更新CentOS7的Yum源,更新软 ...

  7. hadoop2 Ubuntu 下安装部署

    搭建Hadoop环境( 我以hadoop 2.7.3 为例, 系统为 64bit Ubuntu14.04 ) hadoop 2.7.3 官网下载 , 选择自己要安装的版本.注意每个版本对应两个下载选项 ...

  8. hadoop2.5.2安装部署

    0x00 说明 此处已经省略基本配置步骤参考Hadoop1.0.3环境搭建流程,省略主要步骤有: 建立一般用户 关闭防火墙和SELinux 网络配置 0x01 配置master免密钥登录slave 生 ...

  9. Hadoop1.0.3安装部署

    0x00 大数据平台相关链接 官网:http://hadoop.apache.org/ 主要参考教程:http://www.cnblogs.com/xia520pi/archive/2012/05/1 ...

随机推荐

  1. HTML5图形图像处理技术研究

    摘要:图形图像处理平台大部分是传统的C/S架构的桌面应用程序,维护困难,共享性差,而B/S架构的Web程序具有易维护.易共享的优点.本文研究了基于HTML5的Web图形图像处理技术,用HTML5实现了 ...

  2. Interface小例子

    using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace Cons ...

  3. Brackets前端开发IDE工具

    Brackets是一个开源的前端开发IDE工具,网页设计师和前端开发人员必备的前端开发IDE工具. 它能够使你在开发WEB网站实时预览你的网页,目前版本只适用于Chrome浏览器可以实时预览效果 支持 ...

  4. diff 比较两个文件的差异

    功能:比较两个文件的差异,并把不同地方的信息显示出来.默认diff格式的信息. diff比较两个文件或文件集合的差异,并记录下来,生成一个diff文件,这也是我们常说的补丁文件.也使用patch命令对 ...

  5. ExtJs 实现表单联动

    最近做的项目使用Extjs.遇到表单联动的业务.下面来说说主要实现思想: 说明:表单联动一般存在从属关系,有大范围的对象和大范围中的小对象.比如地理位置的选定(例:浙江省-杭州市-某某县).在这里,我 ...

  6. Linux下百度云盘报 获取bdstoken失败

    在用linux下百度云盘工具(bcloud),登录时,报获取bdstoken失败. 在网上搜了一下,解决办法如下. 找到auth.py文件 locate auth.py |grep bcloud 结果 ...

  7. hadoop集群安装_实战

    spark1.6.2+ hadoop2.6.2 词频统计完整案例:http://blog.csdn.net/zythy/article/details/17852579 hadoop学习:http:/ ...

  8. undefined method `environment' for nil:NilClass when importing Bootstrap into rails

    今天做项目时往Gemfile里加了各gem, 然后bundle update了一下, 然后悲剧了,出现了undefined method `environment' for nil:NilClass ...

  9. XHTML的规则

    以正确的DOCTYPE和命名空间开始文档 使用meta内容元素声明你的字符编码 用小写字母写所有元素和属性名称 给所有属性值加引号 给所有属性赋一个值 关闭所有标签 用空格和斜杠关闭“空”标签 不要在 ...

  10. 微信5.4安卓版重回ios风格 导航菜单都放底栏位置

    微信5.4安卓版发布更新了,由于本人的手机设置软件自动更新,中午的时候才发现微信换成了5.4版本,启动微信后是一个大大的“转账,就是发消息”,进入微信界面有点小惊喜,导航菜单都改为底部tab方式,顶部 ...