Hadoop-2.6.5安装

简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。

Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求，可以以流的形式访问（streaming access）文件系统中的数据。

Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。

环境说明

角色	主机名	IP	功能	存储分区
Master	controller	192.168.128.166	NameNode\|Secondarynamenode\|JobTracker	/data
Slave	compute	192.168.128.165	DataNode\|TaskTracker	/data

Hadoop部署

部署Hadoop需要Master与所有Salve主机实现无秘密访问登录，即配置免秘钥登录，相关配置见：http://www.cnblogs.com/Dev0ps/p/8259099.html

修改主机名并且加入hosts文件：

192.168.128.166   controller

192.168.128.165   compute

安装java环境：

[root@controller ~]# yum install -y java

[root@controller jvm]# vim  /etc/profile 

添加以下java环境

    #set java environment 

    JAVA_HOME=/usr/lib/jvm/jre-1.8.0-openjdk-1.8.0.151-5.b12.el7_4.x86_64

    PATH=$PATH:$JAVA_HOME/bin 

    CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar 

    export JAVA_HOME  CLASSPATH  PATH 

 [root@controller jvm]# source /etc/profile

[root@controller ~]# cd /usr/local/

[root@controller local]# wget http://mirrors.shuosc.org/apache/hadoop/common/hadoop-2.6.5/hadoop-2.6.5.tar.gz

[root@controller local]# tar xf hadoop-2.6.5.tar.gz

[root@controller local]# cd hadoop-2.6.5/etc/hadoop/

修改hadoop-env.sh

[root@controller hadoop]# vim hadoop-env.sh

export    JAVA_HOME=/usr/lib/jvm/jre-1.8.0-openjdk-1.8.0.151-5.b12.el7_4.x86_64

修改core-site.xml

[root@controller hadoop]# vim core-site.xml

<configuration>

<!-- 设置提供HDFS服务的主机名和端口号，即NameNode运行的节点 --> 

<property>

<name>fs.default.name</name>

<value>hdfs://controller:9000</value>

<final>true</final>

</property>

<!-- 指定hadoop运行时产生文件的存储路径 -->  

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

<description>A base for other temporary directories</description>

</property>

</configuration>

修改hdfs-site.xml

[root@controller hadoop]# vim hdfs-site.xml

<configuration>

<property>

<name>dfs.name.dir</name>

<value>/usr/local/hadoop/name</value>

<final>true</final>

</property>

<property>

<name>dfs.data.dir</name>

<value>/usr/local/hadoop/data</value>

<final>true</final>

</property>

   <!-- 设置hdfs中文件保存的份数，伪分布式设为1 -->  

<property>

<name>dfs.replication</name>

<value>1</value>

<final>true</final>

</property>

</configuration>

修改mapred-site.xml

[root@controller hadoop]# vim mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>192.168.128.166:9001</value>

<final>true</final>

</property>

</configuration>

配置环境变量

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin 

export HADOOP_COMMON_LIB_NATIVE_DIR=/usr/local/hadoop/lib/native 

export HADOOP_OPTS=-Djava.library.path=/usr/local/hadoop/lib

格式化hdsf

hdfs namenode –format

启动服务

[root@controller hadoop]# /usr/local/hadoop/sbin/start-all.sh

访问hadoop的管理界面：  

HDFS管理界面：http://xxxx:50070  

MR管理界面：http://xxxx:8088

Hadoop-2.6.5安装的更多相关文章

Hadoop集群搭建安装过程（三）（图文详解---尽情点击！！！）
Hadoop集群搭建安装过程(三)(图文详解---尽情点击!!!) 一.JDK的安装安装位置都在同一位置(/usr/tools/jdk1.8.0_73) jdk的安装在克隆三台机器的时候可以提前安装 ...
Hadoop集群搭建安装过程（二）（图文详解---尽情点击！！！）
Hadoop集群搭建安装过程(二)(配置SSH免密登录)(图文详解---尽情点击!!!) 一.配置ssh无密码访问 ®生成公钥密钥对 1.在每个节点上分别执行: ssh-keygen -t rsa(一 ...
Ganglia监控Hadoop集群的安装部署[转]
Ganglia监控Hadoop集群的安装部署一. 安装环境 Ubuntu server 12.04 安装gmetad的机器:192.168.52.105 安装gmond的机器:192.168.52 ...
【原】Hadoop伪分布模式的安装
Hadoop伪分布模式的安装 [环境参数] (1)Host OS:Win7 64bit (2)IDE:Eclipse Version: Luna Service Release 2 (4.4.2) ( ...
hadoop的集群安装
hadoop的集群安装 1.安装JDK,解压jar,配置环境变量 1.1.解压jar tar -zxvf jdk-7u79-linux-x64.tar.gz -C /opt/install //将jd ...
Hadoop 发行版本 Hortonworks 安装详解（一）准备工作
一.前言目前Hadoop发行版非常多,所有这些发行版均是基于Apache Hadoop衍生出来的,之所以有这么多的版本,完全是由Apache Hadoop的开源协议决定的:任何人可以对其进行修改,并 ...
Hadoop 发行版本 Hortonworks 安装详解（二）安装Ambari
一.通过yum安装ambari-server 由于上一步我们搭建了本地源,实际上yum是通过本地源安装的ambari-server,虽然也可以直接通过官方源在线安装,不过体积巨大比较费时. 这里我选择 ...
Hadoop生态圈-使用FreeIPA安装Kerberos和LDAP
Hadoop生态圈-使用FreeIPA安装Kerberos和LDAP 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 有些大数据平台只是简单地通过防火墙来解决他们的网络安全问题.十分 ...
基于zookeeper的高可用Hadoop HA集群安装
(1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com ...
Hadoop分布式HA的安装部署
Hadoop分布式HA的安装部署前言单机版的Hadoop环境只有一个namenode,一般namenode出现问题,整个系统也就无法使用,所以高可用主要指的是namenode的高可用,即存在两个n ...

随机推荐

oracle分页，带有排序字段
select detail_num,carriage_num,ed_date,created_date from (select rownum id,detail_num,carriage_num,e ...
Python 集合深浅copy
一,集合. 集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的.以下是集合最重要的两点: 去重,把一个列表变成集合,就自动去重了. ...
七牛php-sdk使用-多媒体处理
在七牛对象存储可以创建公共的bucket和私有的bucket,私有的不可以直接使用域名加资源key的方式进行访问,需要附加下载凭证. 私有bucket 关于下载凭证的生成,php-sdk已经提供了方法 ...
SpringBoot（四）之thymeleaf的使用
这篇文章将更加全面详细的介绍thymeleaf的使用.thymeleaf 是新一代的模板引擎,在spring4.0中推荐使用thymeleaf来做前端模版引擎. thymeleaf介绍简单说, Th ...
Codeforces 754A Lesha and array splitting(简单贪心)
A. Lesha and array splitting time limit per test:2 seconds memory limit per test:256 megabytes input ...
hdu_1027(好吧。。。牛。。。next_permutation也可以水过)
#include<cstdio> #include<cstring> #include<algorithm> using namespace std; ; int ...
python笔记三（面向对象）
Python3 面向对象 Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的.本章节我们将详细介绍Python的面向对象编程. 如果你以前没有接触 ...
将简单的lambda表达式树转为对应的sqlwhere条件
1.Lambda的介绍园中已经有很多关于lambda的介绍了.简单来讲就是vs编译器给我带来的语法糖,本质来讲还是匿名函数.在开发中,lambda给我们带来了很多的简便.关于lambda的演变过程可 ...
IntelliJ IDEA 配置 smartGit
教你如何在IntelliJ IDEA中配置smartGit? 一.第一种方式: 1.在启动IDEA工具时,点击下拉按钮"Check out from Version Control" ...
1.移植3.4内核-分析内核启动过程,重新分区,烧写jffs2文件系统
1.在上章-移植uboot里.我们来分析下uboot是如何进入到内核的首先,uboot启动内核是通过bootcmd命令行实现的,在我们之前移植的bootcmd命令行如下所示: bootcmd=nan ...

Hadoop-2.6.5安装

Hadoop-2.6.5安装的更多相关文章

随机推荐

热门专题