Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试

　　以前都是玩 java,没搞过 hadoop,所以以此系列文章来记录下学习过程

　　安装的文件版本、操作系统说明

centos-6.5-x86_64

[bamboo@hadoop-senior opt]$ uname -a

Linux hadoop-senior.bamboo.com 2.6.32-696.16.1.el6.x86_64

　　jdk、hadoop

[bamboo@hadoop-senior softwares]$ ll

total 443172

-rw-r--r--. 1 bamboo bamboo 311430119 Dec 29 23:52 hadoop-2.5.0.tar.gz

-rw-r--r--. 1 bamboo bamboo 142376665 Dec 30 02:17 jdk-7u67-linux-x64.tar.gz

1. 在 opt 目录下创建 4 个目录:

[bamboo@hadoop-senior opt]$ ll

total 20

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 datas

drwxr-xr-x. 4 bamboo bamboo 4096 Dec 30 18:32 modules

drwxr-xr-x. 2 root root 4096 Oct 3 22:14 rh

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:16 softwares

drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 tools

　2.安装前先检查下 java

rpm -qa | grep java

如果有的话，会返回一系列的内容，

[bamboo@hadoop-senior opt]$ rpm -qa | grep java

[bamboo@hadoop-senior opt]$

可以看到我的机器是是没有的，如果返回有记录的话，则执行如下的命令

rpm -e --nodeps 1 2 3(1 2 3 是执行命令返回的结果集)

　　3.安装 java

    3.1 解压 jdk

　　tar -zxvf jdk*.tar.gz -C /opt/modules

　　3.2 配置环境变量

　　vim /etc/profile

　　在最后添加如下的配置

　　export JAVA_HOME=/opt/modules/jdk1.7.0_67

　　export PATH=$PATH:$JAVA_HOME/bin

　　保存退出

　　3.3 生效配置

　　source /etc/profile

　　这样即可生效

　　3.4 验证 java 是否安装成功

　　[bamboo@localhost jdk1.7.0_67]$ java -version

　　java version "1.7.0_67"

　　Java(TM) SE Runtime Environment (build 1.7.0_67-b01)

　　Java HotSpot(TM) 64-Bit Server VM (build 24.65-b04, mixed mode)

　　可以看到已经生效

4.安装 hadoop

4.1 解压 hadoop

tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

4.2 配置 hadoop-env.sh 环境变量

/opt/modules/hadoop-2.5.0/etc/hadoop/hadoop-env.sh

vim hadoop-env.sh

配置 jdk 路径

export JAVA_HOME=/opt/modules/jdk1.7.0_67

4.3 启动 hadoop (有 3 种启动方式)

4.3.1 切换到安装根目录，然后创建 input 目录

[bamboo@localhost hadoop-2.5.0]$ pwd

/opt/modules/hadoop-2.5.0

[bamboo@localhost hadoop-2.5.0]$ mkdir input

[bamboo@localhost hadoop-2.5.0]$ ls

bin etc include input lib libexec sbin share

4.3.2 把 etc/hadoop 下的 xml 文件 cp 到 input 目录下

[bamboo@localhost hadoop-2.5.0]$ cp etc/hadoop/*.xml input/

[bamboo@localhost hadoop-2.5.0]$ cd input/

[bamboo@localhost input]$ ls

capacity-scheduler.xml core-site.xml hadoop-policy.xml hdfs-site.xml httpfs-site.xml yarn-site.xml

4.3.3 启动 hadoop

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'

执行成功，并没有报错

执行 ls,可以看到多了 output目录:

[bamboo@localhost hadoop-2.5.0]$ ls

bin etc include input lib libexec output sbin share

[bamboo@localhost hadoop-2.5.0]$ cat output/*

1 dfsadmin

测试一个统计字符的

mkdir wcinput

vim wcinput

hadoop yarn

hadoop mapreduce

hadoop hdfs

yarn nodemanager

hadoop resourcemanager

然后启动 hadoop:

[bamboo@localhost hadoop-2.5.0]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount wcinput wcoutput

[bamboo@localhost hadoop-2.5.0]$ cat wcoutput/*

hadoop 4

hdfs 1

mapreduce 1

nodemanager 1

resourcemanager 1

yarn 2

[bamboo@localhost hadoop-2.5.0]$ cat wcinput/

cat: wcinput/: Is a directory

[bamboo@localhost hadoop-2.5.0]$ cat wcinput/*

hadoop yarn

hadoop mapreduce

hadoop hdfs

yarn nodemanager

hadoop resourcemanager

这个模式是 hadoop 的 Standalone Operation 启动模式.下一篇继续 Pseudo-Distributed Mode.

当然也可以参考官网的 getstart 文档，链接如下:

http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/SingleCluster.html

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试的更多相关文章

Hadoop 系列文章(二) Hadoop配置部署启动HDFS及本地模式运行MapReduce
接着上一篇文章,继续我们 hadoop 的入门案例. 1. 修改 core-site.xml 文件 [bamboo@hadoop-senior hadoop-2.5.0]$ vim etc/hadoo ...
啃掉Hadoop系列笔记(03)-Hadoop运行模式之本地模式
Hadoop的本地模式为Hadoop的默认模式,不需要启用单独进程,直接可以运行,测试和开发时使用. 在<啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建>中若环境搭建成功,则直 ...
hadoop系列一：hadoop集群安装
转载请在页首明显处注明作者与出处 http://www.cnblogs.com/zhuxiaojie/p/6384393.html 一:说明此为大数据系列的一些博文,有空的话会陆续更新,包含大数据 ...
啃掉Hadoop系列笔记(01)-Hadoop框架的大数据生态
一.Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构 2)主要解决,海量数据的存储和海量数据的分析计算问题. 3)广义上来说,HADOOP通常是指一个更广泛的概 ...
Redis 学习笔记系列文章之 Redis 的安装与配置 (一)
1. 介绍 Redis is an open source (BSD licensed), in-memory data structure store, used as database, cach ...
安装Hadoop系列 — eclipse plugin插件编译安装配置
[一].环境参数 eclipse-java-kepler-SR2-linux-gtk-x86_64.tar.gz //现在改为eclipse-jee-kepler-SR2-linux-gtk-x86_ ...
Hadoop 系列文章(三) 配置部署启动YARN及在YARN上运行MapReduce程序
这篇文章里我们将用配置 YARN,在 YARN 上运行 MapReduce. 1.修改 yarn-env.sh 环境变量里的 JAVA_HOME 路径 [bamboo@hadoop-senior ha ...
Hadoop系列教程<一>---Hadoop是什么呢？
Hadoop适合应用于大数据存储和大数据分析的应用,适合于服务器几千台到几万台的集群运行,支持PB级的存储容量.Hadoop典型应用有:搜索.日志处理.推荐系统.数据分析.视频图像分析.数据保存等.但 ...
啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式
伪分布式模式等同于完全分布式,只是她只有一个节点. 一) HDFS上运行MapReduce 程序 (1)配置集群 (a)配置:hadoop-env.sh Linux系统中获取jdk的安装路径:

随机推荐

Java -- XStreamAlias 处理节点中的属性和值
XStreamAlias 可以把objec和xml相互转换,但是有时候节点带有属性和值就需要特殊处理下: <?xml version="1.0" encoding=" ...
【学习】基础知识：数组和矢量计量【Numpy】
Numpy是高性能科学计算和数据分析的基础包.功能如下: ndarray 一个具有矢量算法运算和复杂广播能力的快速且节省空间的多维数组用于对整组数据进行快速运算的标准数学函数(无需编写循环) 用于读 ...
<记录> Razor引擎&视图布局
标识符 @ Razor支持HTML和C#代码混编,意味着可以在HTML中随意输出变量基本使用方法直接@后面跟变量(当遇到 HTML标签 .空格.换行符等特殊符号时便认为@之后到特殊符号前为变量名 ...
2018 pycharm最近激活码
今天更新了一下pycharm,结果之前的激活就不能用了,下面是新的激活方法: 1.mac下在终端进入etc目录: cd /etc 2.编辑hosts文件: vi hosts 将“0.0.0.0 acc ...
java学习-- equals和hashCode的关系
hashcode的目的就是在hashset或者hashmap等中比较两个对象相等时,减少equals的使用次数来提高效率以下为摘录 java中hashcode和equals的区别和联系 HashSe ...
K8s部署使用CFSSL创建证书
证书的编码格式 PEM(Privacy Enhanced Mail),通常用于数字证书认证机构(Certificate Authorities,CA),扩展名为.pem, .crt, .cer, 和 ...
PHP和Redis实现在高并发下的抢购及秒杀功能示例详解
抢购.秒杀是平常很常见的场景,面试的时候面试官也经常会问到,比如问你淘宝中的抢购秒杀是怎么实现的等等. 抢购.秒杀实现很简单,但是有些问题需要解决,主要针对两个问题: 一.高并发对数据库产生的压力二. ...
pyspider示例代码：解析JSON数据
pyspider示例代码官方网站是http://demo.pyspider.org/.上面的示例代码太多,无从下手.因此本人找出一下比较经典的示例进行简单讲解,希望对新手有一些帮助. 示例说明: py ...
cdnbest里站点域名不同步到节点，报400错误的一般原因
报400错误一般是站点里的域名没有同步到节点上面的原因,产生的原因一般是下面两点原因: 1.检查节点列表如下图所示的状态是否打钩,这是节点和主控的通信状态,打叉表示连接有问题这里打叉的几种原因(1) ...
day40 mysql数据类型
复习 1.环境的搭建 2.启动服务 3.库,表,字段的基本操作 create show drop alter desc insert into select from update set delet ...

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试

Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试的更多相关文章

随机推荐

热门专题