Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试

　　以前都是玩 java,没搞过 hadoop,所以以此系列文章来记录下学习过程

　　安装的文件版本、操作系统说明

centos-6.5-x86_64

[bamboo@hadoop-senior opt]$ uname -a

Linux hadoop-senior.bamboo.com 2.6.32-696.16.1.el6.x86_64

　　jdk、hadoop

[bamboo@hadoop-senior softwares]$ ll

total 443172

-rw-r--r--. 1 bamboo bamboo 311430119 Dec 29 23:52 hadoop-2.5.0.tar.gz

-rw-r--r--. 1 bamboo bamboo 142376665 Dec 30 02:17 jdk-7u67-linux-x64.tar.gz

1. 在 opt 目录下创建 4 个目录:

[bamboo@hadoop-senior opt]$ ll

total 20

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 datas

drwxr-xr-x. 4 bamboo bamboo 4096 Dec 30 18:32 modules

drwxr-xr-x. 2 root root 4096 Oct 3 22:14 rh

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:16 softwares

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 tools

　2.安装前先检查下 java

rpm -qa | grep java

如果有的话，会返回一系列的内容，

[bamboo@hadoop-senior opt]$ rpm -qa | grep java

[bamboo@hadoop-senior opt]$

可以看到我的机器是是没有的，如果返回有记录的话，则执行如下的命令

rpm -e --nodeps 1 2 3(1 2 3 是执行命令返回的结果集)

　　3.安装 java

    3.1 解压 jdk

　　tar -zxvf jdk*.tar.gz -C /opt/modules

　　3.2 配置环境变量

　　vim /etc/profile

　　在最后添加如下的配置

　　export JAVA_HOME=/opt/modules/jdk1.7.0_67

　　export PATH=$PATH:$JAVA_HOME/bin

　　保存退出

　　3.3 生效配置

　　source /etc/profile

　　这样即可生效

　　3.4 验证 java 是否安装成功

　　[bamboo@localhost jdk1.7.0_67]$ java -version

　　java version "1.7.0_67"

　　Java(TM) SE Runtime Environment (build 1.7.0_67-b01)

　　Java HotSpot(TM) 64-Bit Server VM (build 24.65-b04, mixed mode)

　　可以看到已经生效

4.安装 hadoop

4.1 解压 hadoop

tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

4.2 配置 hadoop-env.sh 环境变量

/opt/modules/hadoop-2.5.0/etc/hadoop/hadoop-env.sh

vim hadoop-env.sh

配置 jdk 路径

export JAVA_HOME=/opt/modules/jdk1.7.0_67

4.3 启动 hadoop (有 3 种启动方式)

4.3.1 切换到安装根目录，然后创建 input 目录

[bamboo@localhost hadoop-2.5.0]$ pwd

/opt/modules/hadoop-2.5.0

[bamboo@localhost hadoop-2.5.0]$ mkdir input

[bamboo@localhost hadoop-2.5.0]$ ls

bin etc include input lib libexec sbin share

4.3.2 把 etc/hadoop 下的 xml 文件 cp 到 input 目录下

[bamboo@localhost hadoop-2.5.0]$ cp etc/hadoop/*.xml input/

[bamboo@localhost hadoop-2.5.0]$ cd input/

[bamboo@localhost input]$ ls

capacity-scheduler.xml core-site.xml hadoop-policy.xml hdfs-site.xml httpfs-site.xml yarn-site.xml

4.3.3 启动 hadoop

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'

执行成功，并没有报错

执行 ls,可以看到多了 output目录:

[bamboo@localhost hadoop-2.5.0]$ ls

bin etc include input lib libexec output sbin share

[bamboo@localhost hadoop-2.5.0]$ cat output/*

1 dfsadmin

测试一个统计字符的

mkdir wcinput

vim wcinput

hadoop yarn

hadoop mapreduce

hadoop hdfs

yarn nodemanager

hadoop resourcemanager

然后启动 hadoop:

[bamboo@localhost hadoop-2.5.0]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount wcinput wcoutput

[bamboo@localhost hadoop-2.5.0]$ cat wcoutput/*

hadoop 4

hdfs 1

mapreduce 1

nodemanager 1

resourcemanager 1

yarn 2

[bamboo@localhost hadoop-2.5.0]$ cat wcinput/

cat: wcinput/: Is a directory

[bamboo@localhost hadoop-2.5.0]$ cat wcinput/*

hadoop yarn

hadoop mapreduce

hadoop hdfs

yarn nodemanager

hadoop resourcemanager

这个模式是 hadoop 的 Standalone Operation 启动模式.下一篇继续 Pseudo-Distributed Mode.

当然也可以参考官网的 getstart 文档，链接如下:

http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/SingleCluster.html

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试的更多相关文章

Hadoop 系列文章(二) Hadoop配置部署启动HDFS及本地模式运行MapReduce
接着上一篇文章,继续我们 hadoop 的入门案例. 1. 修改 core-site.xml 文件 [bamboo@hadoop-senior hadoop-2.5.0]$ vim etc/hadoo ...
啃掉Hadoop系列笔记(03)-Hadoop运行模式之本地模式
Hadoop的本地模式为Hadoop的默认模式,不需要启用单独进程,直接可以运行,测试和开发时使用. 在<啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建>中若环境搭建成功,则直 ...
hadoop系列一：hadoop集群安装
转载请在页首明显处注明作者与出处 http://www.cnblogs.com/zhuxiaojie/p/6384393.html 一:说明此为大数据系列的一些博文,有空的话会陆续更新,包含大数据 ...
啃掉Hadoop系列笔记(01)-Hadoop框架的大数据生态
一.Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构 2)主要解决,海量数据的存储和海量数据的分析计算问题. 3)广义上来说,HADOOP通常是指一个更广泛的概 ...
Redis 学习笔记系列文章之 Redis 的安装与配置 (一)
1. 介绍 Redis is an open source (BSD licensed), in-memory data structure store, used as database, cach ...
安装Hadoop系列 — eclipse plugin插件编译安装配置
[一].环境参数 eclipse-java-kepler-SR2-linux-gtk-x86_64.tar.gz //现在改为eclipse-jee-kepler-SR2-linux-gtk-x86_ ...
Hadoop 系列文章(三) 配置部署启动YARN及在YARN上运行MapReduce程序
这篇文章里我们将用配置 YARN,在 YARN 上运行 MapReduce. 1.修改 yarn-env.sh 环境变量里的 JAVA_HOME 路径 [bamboo@hadoop-senior ha ...
Hadoop系列教程<一>---Hadoop是什么呢？
Hadoop适合应用于大数据存储和大数据分析的应用,适合于服务器几千台到几万台的集群运行,支持PB级的存储容量.Hadoop典型应用有:搜索.日志处理.推荐系统.数据分析.视频图像分析.数据保存等.但 ...
啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式
伪分布式模式等同于完全分布式,只是她只有一个节点. 一) HDFS上运行MapReduce 程序 (1)配置集群 (a)配置:hadoop-env.sh Linux系统中获取jdk的安装路径:

随机推荐

工具函数(获取url ，时间格式化，随机数)
(function(window,$){ function Tools() { } // url Tools.prototype.readUrlToParams = function() { var ...
flask&nginx&gunicore部署
部署流程: 1.处理服务器的基础环境, 安装和Python有关的软件安装Python3-pip, Python3-dev apt install python3-pip apt install py ...
svg转png
svg转png网络上常用的方式有两种: 1.直接转base64放到图片src进行显示,测试效果不佳,始终报方法问题. 2.先转canvas,再转为png图,测试效果可以但svg透明背景到了canvas ...
ARCore中Pose类变换点的算法实现
ARCore中Pose类变换点的算法实现,主要分为两步,分别是平移和旋转. 1. 旋转向量:通过四元数计算旋转后的向量参数列表:q表示四元数, v是长度为4的float数组,表示待旋转的向量, ...
tfs填坑那些事
1.csdn下载安装(步1:装步2:激活步3:配置数据库之类选择完全配置)激活(win7能出来,win10不出来) 注意 tfs服务开启,,代理服务开启 2.选择敏捷模板 3.无法新建项目, ...
FM-分解机模型详解
https://blog.csdn.net/zynash2/article/details/80029969 FM论文地址:https://www.csie.ntu.edu.tw/~b97053/pa ...
myeclise 安装
安装.破解步骤都在gaobo百度云/工具/开发工具安装后配置环境变量:
用element-ui 时，报value.getTime is not a function错误：
在用element-ui 时,报value.getTime is not a function错误:错误分析:date-picker 的时间是格林威时间,如果Thu Jun 22 2017 19:07 ...
cdnbest设置301跳转
cdnbest设置301跳转格式:^http://kangleweb.com/(.*)$ https://www.kangleweb.com/$1 下面是站点里所有域名都跳转到https ...
javascript中的类型检测
最常见的是使用 typeof 来判断数据类型可以区分4种基本类型,即 “number”,”string”,”undefined”,”boolean”,第5种基本类型null类型返回值为object( ...

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试的更多相关文章

随机推荐

热门专题