hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6

1 rpm 安装

yum install rpm

2 JDK安装

《《一定要先删除JDK！！！！！！》》

rpm -qa | grep java

rpm -e --nodeps

rpm -qa | grep java

下载 JDK

tar -zxvf or xvf java

环境变量更改

/usr/local/opt/jdk1.7.0_67

jdk环境变量

8.1) vi /etc/profile

8.2)

export JAVA_HOME=/usr/local/opt/jdk1.7.0_67

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

1 下载Hadoop

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.5.1/hadoop-2.5.1.tar.gz

wget http://mirror.bit.edu.cn/apache/hbase/hbase-1.0.2/hbase-1.0.2-bin.tar.gz

wget http://mirror.bit.edu.cn/apache/hbase/1.1.2/hbase-1.1.2-bin.tar.gz

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.6.0/hadoop-2.6.0.tar.gz

如果环境变量崩了就子机whereis vim 应该是这样 /usr/bin/vim /etc/profile

hadoop 环境变量

vi /etc/profile

/usr/local/opt/hadoop-2.5.1

/home/hadoop/hadoop/hadoop-2.6.0

export HADOOP_HOME=/usr/local/opt/hadoop-2.7.2

export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$HADOOP_HOME/lib:$HIVE_HOME/lib

export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$HIVE_HOME/bin

hive 环境变量

export HIVE_HOME=/usr/hive-0.11.0

4 hdfs 初始化 yarn 初始化

进入hadoop下面的etc/hadoop/不是系统的etc，是hadoop下面的），ls，看到很多配置文件。

修改core-site.xml

<configuration>
<property>
<name>fs.defaultFS</name>
<value</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-data/tmp/hadoop-${user.name}</value>
<description>A base for other temporary directories.</description>
</property>
</configuration>

修改hdfs-site.xml

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value></value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/hdfs/data</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
<property>
<name>dfs.federation.nameservices</name>
<value>t1</value>
</property>
<property>
<name>dfs.namenode.rpc-address.master</name>
<value>t1:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.master</name>
<value>t1:23001</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address.master</name>
<value>t1:23002</value>
</property>

</configuration>

修改mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

修改yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

host is the hostname of the resource manager and port is the port on which the NodeManagers contact the Resource Manager

</description>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

the hostsis the hostname of the ResourceManager and the port is the port on which the clients can talk to the Resource Manager.

</description>

<name>yarn.resourcemanager.address</name>

</property>

host is the hostname of the resourcemanager and port is the port on which the Applications in the cluster talk to the Resource Manager.

</description>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<description>The address of the RM admin interface.</description>

<name>yarn.resourcemanager.admin.address</name>

</property>

<description>Resource Manager的Web访问地址</description>

<name>yarn.resourcemanager.webapp.address</name>

</property>

<name>yarn.nodemanager.local-dirs</name>

<value>${hadoop.tmp.dir}/nodemanager/local</value>

<description>the local directories used by the nodemanager to store the temp file</description>

</property>

<name>yarn.nodemanager.log-dirs</name>

<value>${hadoop.tmp.dir}/nodemanager/logs</value>

<description>the directories used by Nodemanagers as log directories</description>

</property>

</configuration>

修改 hadoop-env.sh、yarn-env.sh

export JAVA_HOME=/usr/local/jdk

5 配置 slave

vi etc/hadoop/slaves

加入

6 HDFS 初始化

./bin/hdfs namenode -format

如果 format 出异常 JAVA环境变量监察一下。

7 将 hadoop 目录分发至其余节点

整文件夹拷贝

scp -r file root@slave1:/path

8 启动所有。

./sbin/start-all.sh

http://master:50070/ hdfs

http://master:50030/ mapReduce

成功后可以运行个例子

hadoop-2.7.2/share/hadoop/mapreduce 这里有一坨。

**************************** HDFS ***************************

yum install gcc

查看系统的libc版本
# ll /lib64/libc.so.6
lrwxrwxrwx 1 root root 11 Apr 24 16:49 /lib64/libc.so.6 -> libc-2.5.so
系统中的版本为2.5
将系统中的glibc升级为2.9
下载glibc
wget http://ftp.gnu.org/gnu/glibc/glibc-2.9.tar.bz2
下载glibc-linuxthreads
wget http://ftp.gnu.org/gnu/glibc/glibc-linuxthreads-2.5.tar.bz2
解压
$tar -jxvf glibc-2.9.tar.bz2
$cd glibc-2.9
$tar -jxvf ../glibc-linuxthreads-2.5.tar.bz2
$cd ..
$export CFLAGS="-g -O2"
$./glibc-2.9/configure --prefix=/usr --disable-profile --enable-add-ons --with-headers=/usr/include --with-binutils=/usr/bin
$make
#make install
安装编译过程中需要注意三点：
1、要将glibc-linuxthreads解压到glibc目录下。
2、不能在glibc当前目录下运行configure。
3、加上优化开关，export CFLAGS="-g -O2"，否则会出现错误

***************************** HIVE *****************************

http://apache.fayea.com/hive/

hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6的更多相关文章

hadoop与云技术、云计算混肴澄清
本文引用自:http://www.aboutyun.com/blog-61-248.html 一.初学者问题: 请教个问题在实际的生成环境里面,数据源产生的地方部署Hadoop,还是需要程序把数据给迁 ...
Hadoop — HDFS的概念、原理及基本操作
1. HDFS的基本概念和特性设计思想——分而治之:将大文件.大批量文件分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析.在大数据系统中作用:为各类分布式运算框架(如:map ...
Hadoop家族学习路线、实践案例
作者:Han Hsiao链接:https://www.zhihu.com/question/19795366/answer/24524910来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商 ...
hadoop第一部分-安装、测试
一.hadoop安装(本地模式及伪分布式安装) hadoop历史版本下载网站:http://archive.apache.org/dist/运行模式: 本地模式 yarn模式 hadoop ...
hadoop配置文件详解、安装及相关操作
一. Hadoop伪分布配置 1. 在conf/hadoop-env.sh文件中增加:export JAVA_HOME=/home/Java/jdk1.6 2. 在c ...
【转帖】Hadoop — HDFS的概念、原理及基本操作
Hadoop — HDFS的概念.原理及基本操作 https://www.cnblogs.com/swordfall/p/8709025.html 分类: Hadoop undefined 1. HD ...
五十九.大数据、Hadoop 、 Hadoop安装与配置、 HDFS
1.安装Hadoop 单机模式安装Hadoop 安装JAVA环境设置环境变量,启动运行 1.1 环境准备 1)配置主机名为nn01,ip为192.168.1.21,配置yum源(系统源) 备 ...
linux运维、架构之路-Hadoop完全分布式集群搭建
一.介绍 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件 ...
hadoop配置文件详解、安装及相关操作补充版
一. Hadoop伪分布配置首先应该现在profile文件添加hadoop_home操作如下: export JAVA_HOME=/usr/java/jdk expor ...

随机推荐

路飞学城Python-Day10
[37.函数-命名空间]命名空间又称为name space,顾名思义就是存放名字的地方,存什么名字呢?举例说明,若变量 x = 1,存放于内存中,那名字x存放在哪里呢?名称空间正式存放名字x和1绑定关 ...
[洛谷P1892][codevs2597]团伙
题目大意:有n个强盗,他们有这样的关系:1.朋友的朋友是朋友:2.敌人的敌人是朋友. 两个人是朋友,则他们在一个团伙中,是敌人则在不同团伙中. 现在给出一些朋友或敌人的关系,问最多有多少团伙.输入保证 ...
【jQuery04】折叠树
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
vue-cli 打包使用 history模式的后端配置
apache的配置这是windows下的在httpd-vhosts.conf文件中把目录指向项目index.html文件所在的位置 # Virtual Hosts # <VirtualHos ...
groovy : poi 导出 Excel xlsx
參考 file:///poi-3.10-FINAL/docs/spreadsheet/how-to.html#sxssf text2xlsx.groovy 代码例如以下 package xlsx; i ...
Pixhawk---烧写FMU/IO bootloader
Pixhawk-FMU/IO烧写Bootloader 1 说明用J-link来烧写Bootloader,Pixhawk板FMU/IO接口说明: J-link接口说明: Pix ...
extjs Combox 调用数据
1方法一从 json获取 var typeStore = new Ext.data.Store({ proxy : new Ext.data.HttpProxy({u ...
几种常见sqlalchemy查询：
#简单查询 print(session.query(User).all()) print(session.query(User.name, User.fullname).all ...
IIS访问站点，出现connection refused
排查后,发现是因为使用了代理导致的. 需要设置 Don't use the proxy server for local addresses.
Frame Stacking ZOJ 1083，poj 1128
Frame Stacking Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 4034 Accepted: 1352 De ...

hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6

hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6的更多相关文章

随机推荐

热门专题