hadoop入门(3)——hadoop2.0理论基础:安装部署方法
一、hadoop2.0安装部署流程
1、自动安装部署:Ambari、Minos(小米)、Cloudera Manager(收费)
2、使用RPM包安装部署:Apache hadoop不支持、HDP与CDH提供
3、使用jar包安装部署:各版本均提供。(初期为了理解hadoop,建议使用这种方式)
部署流程:
准备硬件(Linux操作系统)
准备软件安装包,并安装基础软件(主要是JDK)
将hadoop安装包分发到各个节点的同一个目录下,并解压
修改配置文件
启动服务
验证是否启动成功
二、hadoop2.0软硬件准备
硬件准备:测试环境仅需要一台Linux机器。生成环境需要多台Linux机器。
建议内存不小于4G(性能)
软件准备:JDK1.6+(CDH5建议JDK7)、hadoop2.0安装包。
1、建议使用非root用户安装hadoop。(hadoop某些功能不允许在root用户下操作)
2、配置SSH免密码登录:为了启动hadoop集群方便。
三、hadoop2.0安装包下载
建议选择商业公司的免费版本:主要是考虑不需要版本的选择。
http://archive.cloudera.com/cdh4/cdh/4
http://archive.cloudera.com/cdh5/cdh/5
hadoop目录结构分析:
bin:最基本的管理脚本和使用脚本所在目录。这些脚本是sbin目录下管理脚本的基础实现。
etc:配置文件所在的目录,包括core-site.xml、hdfs-site.xml、mapred-site.xml等,yarn-site.xml
include:对外提供的编程库头文件。通常用于C++程序访问HDFS。
lib:该目录包含了hadoop对外提供的编程动态库和静态库。
libexec:各个服务对应的shell配置文件所在目录。
sbin:hadoop管理脚本所在目录,主要包含HDFS和YARN中各类服务的启动关闭脚本。
share:hadoop各个模块编译后的jar包所在目录。
四、hadoop2.0测试环境(单机)搭建方法
此处仅为理论说明。
1、首先将安装包存放到某个目录下,并解压。
2、修改解压后的目录中的文件夹etc/hadoop下的xml配置文件:
hadoop-env.sh修改以下配置:export JAVA_HOME=/home/....
Slaves文件修改为以下配置:YARN001
mapred-site.xml中:mapreduce.framework.name=yarn
core-site.xml:fs.default.name=hdfs://YAR001:8020
yarn-site.xml:yarn.nodenamager.aux-services=mapreduce_shuffle
core-site.xml:dfs.replication=1
3、启动服务:
格式化HDFS: bin/hadoop namenode -format
启动HDFS:sbin/start-dfs.sh
启动YART:sbin/start-yarn.sh
4、验证是否成功:
jps查看对应的服务是否已经启动:
NameNode\DataNode\NodeManager\ResourceManager\SecondaryNameNode
访问yarn:http://yarn001:8088
访问hdfs:http://yarn001:50070
常见问题:
虚拟机搭建重启后无法启动成功:原因是/tmp文件夹被清空了,配置一个非/tmp的文件夹即可。
在core-site.xml中添加:dfs.namenode.name.dir=/xxx; dfs.datanode.data.dir=/xxxx;
五、hadoop2.0生产环境(多机)搭建方法
1、将安装包存放到某一目录下,并解压。
2、修改解压目录中的文件夹etc/hadoop下的xml配置文件。
3、格式化并启动HDFS
4、启动YARN
与单机环境的不同之处在于步骤2中修改的配置文件的内容有所不同。以及步骤3 的详细步骤不同。
HDFS HA部署方法:详见后续文章
HDFS HA+Federation的部署方法:详见后续文章
YARN部署方法:详见后续文章
hadoop入门(3)——hadoop2.0理论基础:安装部署方法的更多相关文章
- Storm-0.9.0.1安装部署 指导
可以带着下面问题来阅读本文章: 1.Storm只支持什么传输 2.通过什么配置,可以更改Zookeeper默认端口 3.Storm UI必须和Storm Nimbus部署在同一台机器上,UI无法正常工 ...
- 大数据篇:DolphinScheduler-1.2.0.release安装部署
大数据篇:DolphinScheduler-1.2.0.release安装部署 1 配置jdk #查看命令 rpm -qa | grep java #删除命令 rpm -e --nodeps xxx ...
- 微服务(入门一):netcore安装部署consul
环境准备 vs开发环境:vs2017 consul版本: 1.4.4 netcore版本:2.1 安裝Consul 1.从官网下载consul到本地,选择系统对应的版本进行下载到本地,下载地址:h ...
- kafka_2.11-2.0.0_安装部署
参考博文:kafka 配置文件参数详解 参考博文:Kafka[第一篇]Kafka集群搭建 参考博文:如何为Kafka集群选择合适的Partitions数量 参考博文:Kafka Server.prop ...
- elasticsearch+kibana+metricbeat安装部署方法
elasticsearch+kibana+metricbeat安装部署方法 本文是elasticsearch + kibana + metricbeat,没有涉及到logstash部分.通过beat收 ...
- 【原创 Hadoop&Spark 动手实践 1】Hadoop2.7.3 安装部署实践
目录: 第一部分:操作系统准备工作: 1. 安装部署CentOS7.3 1611 2. CentOS7软件安装(net-tools, wget, vim等) 3. 更新CentOS7的Yum源,更新软 ...
- hadoop2 Ubuntu 下安装部署
搭建Hadoop环境( 我以hadoop 2.7.3 为例, 系统为 64bit Ubuntu14.04 ) hadoop 2.7.3 官网下载 , 选择自己要安装的版本.注意每个版本对应两个下载选项 ...
- hadoop2.5.2安装部署
0x00 说明 此处已经省略基本配置步骤参考Hadoop1.0.3环境搭建流程,省略主要步骤有: 建立一般用户 关闭防火墙和SELinux 网络配置 0x01 配置master免密钥登录slave 生 ...
- Hadoop1.0.3安装部署
0x00 大数据平台相关链接 官网:http://hadoop.apache.org/ 主要参考教程:http://www.cnblogs.com/xia520pi/archive/2012/05/1 ...
随机推荐
- linux-ntpdate同步更新时间
Linux服务器运行久时,系统时间就会存在一定的误差,一般情况下可以使用date命令进行时间设置,但在做数据库集群分片等操作时对多台机器的时间差是有要求的,此时就需要使用ntpdate进行时间同步 安 ...
- win10下JDK的安装与环境变量配置
1.到官网下载最新版本的JDK http://www.oracle.com/technetwork/java/javase/downloads/index.html 2.安装JDK,同安装其他软件一样 ...
- input-placeholder
:-moz-placeholder { /* Mozilla Firefox 4 to 18 */ color: #f00; } ::-moz-placeholder { /* Mozilla Fir ...
- windows下cmd记录MYSQL操作
我们在cmd下操作MYSQL,当需要复制某条命令的时候,需要右键标记,然后选取,然后......各种不方便! 有没有比较方便的方式,可以将我们的操作记录自动的实时保存下来,当我们需要操作的时候,可以高 ...
- redis源码安装
#安装目录 mkdir -p /data/apps/redis cd /data/tgz wget http://download.redis.io/releases/redis-3.2.1.tar. ...
- 【总结】详细说说@Html.ActionLink()的用法
一.@Html.ActionLink()概述 在MVC的Rasor视图引擎中,微软采用一种全新的方式来表示从前的超链接方式,它代替了从前的繁杂的超链接标签,让代码看起来更加简洁,通过浏览器依然会解析成 ...
- Web编程基础--HTML、CSS、JavaScript 学习之课程作业“仿360极速浏览器新标签页”
Web编程基础--HTML.CSS.JavaScript 学习之课程作业"仿360极速浏览器新标签页" 背景: 作为一个中专网站建设出身,之前总是做静态的HTML+CSS+DIV没 ...
- 通过ipv6访问 g o o g l e
Google.Youtube.Facebook等均支持IPv6访问,IPv4网络的用户大部分都无法访问,比如Gmail,Google Docs等等各种相关服务.而该类网站大部分均已接入IPv6网络,因 ...
- Unslider.js Tiny Sample
<!-- The HTML --><!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"&g ...
- [Head First设计模式]生活中学设计模式——迭代器模式
系列文章 [Head First设计模式]山西面馆中的设计模式——装饰者模式 [Head First设计模式]山西面馆中的设计模式——观察者模式 [Head First设计模式]山西面馆中的设计模式— ...