1. 下载压缩包

2. 配置环境变量

3. 配置Hadoop的JAVA_HOME路径

4. WordCount

1. 下载压缩包

下载Hadoop binary二进制压缩包 https://hadoop.apache.org/releases.html

上传到Linux并解压

2. 配置环境变量

提前先配置好java环境变量，编辑 vi /etc/profile

export HADOOP_HOME=/usr/soft/hadoop-2.7.2

PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL

运行 source /etc/profile 使配置生效

3. 配置Hadoop的JAVA_HOME路径

进入Hadoop解压目录，vi ./etc/hadoop/hadoop-env.sh
设置JAVA_HOME路径

export JAVA_HOME=/usr/soft/jdk1.8.0_144

4. WordCount

单机版Hadoop环境已经搭建完成，运行一个统计单词数量的Demo来了解一下Hadoop的运行机制

复制一些xml文件

mkdir /usr/soft/input
cp ./hadoop/*.xml /usr/soft/input

执行Hadoop命令

格式: hadoop jar <jar包> <类> <输入文件夹> <输出文件夹> <条件>

hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /usr/soft/input /usr/soft/output

注意，保证之前没有这个output目录,成功之后会产生2个文件

[root@localhost output]# ll

total 8

-rw-r--r--. 1 root root 5552 Jan  2 17:20 part-r-00000

-rw-r--r--. 1 root root    0 Jan  2 17:20 _SUCCESS

part-r-00000 结果文件
_SUCCESS 成功标志

查看结果

[root@localhost output]# more part-r-00000

"*"     17

"AS     6

--More--(1%)

查看hdfs文件列表

hdfs dfs -ls /

Hadoop Local（本地）模式搭建的更多相关文章

Scala进阶之路-Spark本地模式搭建
Scala进阶之路-Spark本地模式搭建作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Spark简介 1>.Spark的产生背景传统式的Hadoop缺点主要有以下两 ...
Hadoop伪分布式模式搭建
title: Hadoop伪分布式模式搭建 Quitters never win and winners never quit. 运行环境: Ubuntu18.10-server版镜像:ubuntu- ...
Hadoop本地模式搭建
官方文档,不同版本修改url地址中的数字即可 http://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/Single ...
【Hadoop基础教程】2、Hadoop之单机模式搭建（转）
单机模式所需要的系统资源是最少的,这种安装模式下,Hadoop的core-site.xml.mapred-site.xml.hdfs-site.xml配置文件均为空.默认情况下,官方hadoop-1. ...
hadoop完全分布式模式搭建和hive安装
简介 Hadoop是用来处理大数据集合的分布式存储计算基础架构.可以使用一种简单的编程模式,通过多台计算机构成的集群,分布式处理大数据集.hadoop作为底层,其生态环境很丰富. hadoop基础包括 ...
hadoop的安装和配置（一）本地模式
博主会用三篇文章来为大家详细的说明hadoop的三种模式: 本地模式伪分布模式完全分布模式本地模式: 思路走向 |--------------------| | ①:配置Java环境 | | ...
安装部署Apache Hadoop (本地模式和伪分布式)
本节内容: Hadoop版本安装部署Hadoop 一.Hadoop版本 1. Hadoop版本种类目前Hadoop发行版非常多,有华为发行版.Intel发行版.Cloudera发行版(CDH)等, ...
啃掉Hadoop系列笔记(03)-Hadoop运行模式之本地模式
Hadoop的本地模式为Hadoop的默认模式,不需要启用单独进程,直接可以运行,测试和开发时使用. 在<啃掉Hadoop系列笔记(02)-Hadoop运行环境搭建>中若环境搭建成功,则直 ...
Hadoop学习笔记01_Hadoop搭建
想往大数据方向转, 难度肯定是有的. 基础知识肯定是要有的,如果是熟悉JAVA开发的人,转向应该优势大. 像我这样的,只有Linux基础以及简单的PHP基础的人,转向难度很大.但是事在人为,努力学习多 ...
centos6.6安装hadoop-2.5.0（一、本地模式安装）
操作系统:centos6.6(一台服务器) 环境:selinux disabled:iptables off:java 1.8.0_131 安装包:hadoop-2.5.0.tar.gz hadoop ...

随机推荐

[Eclipse]已经写好的代码怎样切换为unix下的换行符？
问题:使用eclise提交文件到github,每行文件后面都有^M字符切换换行符的显示格式, 但是这样只能对新文件起作用,修改旧文件:
5.7.27版本mysql新增用户
因为我们目前只有root,所以只能先用root登陆mysql,再新增用户: $ bin/mysql -u root -p Enter password: Welcome to the MySQL mo ...
OpenLDAP配置坎坷路
https://segmentfault.com/a/1190000014683418 轻型目录访问协议(英文:Lightweight Directory Access Protocol,缩写:LDA ...
properties配置文件参数获取
package com.opslab.util; import org.apache.log4j.Logger; import java.io.File;import java.io.IOExcept ...
【JAVA】java注解的自定义和使用
java注解概念 Java提供了一种原程序中的元素关联任何信息和任何数据的途径和方法 java注解介绍常用注解 @Override:表示方法是重写的方法 @Deprecated:过时的方法 @Sup ...
F110增强
1.F110 删除操作的增强: 方法:SE19 ZE_F110_DELETE_CHECK 代码: ENHANCEMENT 1 ZE_F110_DELETE_CHECK. "act ...
curl命令测试网络请求中DNS解析、响应时间
https://blog.csdn.net/dreamer2020/article/details/78152576
vue-cli3 按需加载loading，服务的方式调用
安装 babel-plugin-component npm install babel-plugin-component -S 安装element-ui npm install element-ui ...
linux如何找回已经删除的文件？lsof
简介 lsof(list open files)是一个列出当前系统打开文件的工具.在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件.所以如传输控 ...
2019暑期北航培训—预培训作业-IDE的安装与初步使用(Visual Studio版)
这个作业属于那个课程 2019北航软件工程暑期师资培训这个作业要求在哪里预培训-IDE的安装与初步使用(Visual Studio版) 我在这个课程的目标是提高自身实际项目实践能力,掌握帮助学生 ...