Hadoop2.8.2 运行wordcount

1 例子jar位置

[hadoop@hadoop02 mapreduce]$ pwd

/hadoop/hadoop-2.8.2/share/hadoop/mapreduce

[hadoop@hadoop02 mapreduce]$ ls -lrt

总用量 5084

drwxr-xr-x 2 hadoop hadoop    4096 10月 20 05:11 lib

drwxr-xr-x 2 hadoop hadoop    4096 10月 20 05:11 jdiff

-rw-r--r-- 1 hadoop hadoop  301936 10月 20 05:11 hadoop-mapreduce-examples-2.8.2.jar

-rw-r--r-- 1 hadoop hadoop   77142 10月 20 05:11 hadoop-mapreduce-client-shuffle-2.8.2.jar

-rw-r--r-- 1 hadoop hadoop 1588114 10月 20 05:11 hadoop-mapreduce-client-jobclient-2.8.2-tests.jar

-rw-r--r-- 1 hadoop hadoop   67003 10月 20 05:11 hadoop-mapreduce-client-jobclient-2.8.2.jar

-rw-r--r-- 1 hadoop hadoop   31535 10月 20 05:11 hadoop-mapreduce-client-hs-plugins-2.8.2.jar

-rw-r--r-- 1 hadoop hadoop  195052 10月 20 05:11 hadoop-mapreduce-client-hs-2.8.2.jar

-rw-r--r-- 1 hadoop hadoop 1571759 10月 20 05:11 hadoop-mapreduce-client-core-2.8.2.jar

-rw-r--r-- 1 hadoop hadoop  782757 10月 20 05:11 hadoop-mapreduce-client-common-2.8.2.jar

-rw-r--r-- 1 hadoop hadoop  563771 10月 20 05:11 hadoop-mapreduce-client-app-2.8.2.jar

drwxr-xr-x 2 hadoop hadoop    4096 10月 20 05:11 sources

drwxr-xr-x 2 hadoop hadoop      29 10月 20 05:11 lib-examples

2 生成数据文件

[hadoop@hadoop01 ~]$ echo "Hello World">>word.txt

[hadoop@hadoop01 ~]$ echo "Hello Hadoop">>word.txt

[hadoop@hadoop01 ~]$ echo "Hello Hive">>word.txt

3 创建HDFS目录

[hadoop@hadoop01 ~]$ hadoop dfs -mkdir /work/data/input

DEPRECATED: Use of this script to execute hdfs command is deprecated.

Instead use the hdfs command for it.

[hadoop@hadoop01 ~]$ hadoop dfs -lsr /work/data

DEPRECATED: Use of this script to execute hdfs command is deprecated.

Instead use the hdfs command for it.

lsr: DEPRECATED: Please use 'ls -R' instead.

drwxr-xr-x   - hadoop supergroup          0 2017-11-12 09:00 /work/data/input

[hadoop@hadoop01 ~]$

4 将数据文件word.txt上传以HDFS /work/data/input目录下

[hadoop@hadoop01 ~]$ hadoop dfs -copyFromLocal word.txt /work/data/input

DEPRECATED: Use of this script to execute hdfs command is deprecated.

Instead use the hdfs command for it.

[hadoop@hadoop01 ~]$ hadoop dfs -text /work/data/input/word.txt

DEPRECATED: Use of this script to execute hdfs command is deprecated.

Instead use the hdfs command for it.

Hello World

Hello Hadoop

Hello Hive

[hadoop@hadoop01 ~]$

5 运行wordcount例子

[hadoop@hadoop01 hadoop-2.8.2]$ pwd

/hadoop/hadoop-2.8.2

[hadoop@hadoop01 hadoop-2.8.2]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.2.jar wordcount /work/data/input /work/data/output

17/11/12 09:05:14 INFO client.RMProxy: Connecting to ResourceManager at hadoop02/192.168.169.102:8032

17/11/12 09:05:15 INFO input.FileInputFormat: Total input files to process : 1

17/11/12 09:05:15 INFO mapreduce.JobSubmitter: number of splits:1

17/11/12 09:05:15 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1510447239720_0001

17/11/12 09:05:16 INFO impl.YarnClientImpl: Submitted application application_1510447239720_0001

17/11/12 09:05:16 INFO mapreduce.Job: The url to track the job: http://hadoop02:8088/proxy/application_1510447239720_0001/

17/11/12 09:05:16 INFO mapreduce.Job: Running job: job_1510447239720_0001

17/11/12 09:05:25 INFO mapreduce.Job: Job job_1510447239720_0001 running in uber mode : false

17/11/12 09:05:25 INFO mapreduce.Job:  map 0% reduce 0%

17/11/12 09:05:35 INFO mapreduce.Job:  map 100% reduce 0%

17/11/12 09:05:40 INFO mapreduce.Job:  map 100% reduce 100%

17/11/12 09:05:41 INFO mapreduce.Job: Job job_1510447239720_0001 completed successfully

17/11/12 09:05:41 INFO mapreduce.Job: Counters: 49

	File System Counters

		FILE: Number of bytes read=53

		FILE: Number of bytes written=276955

		FILE: Number of read operations=0

		FILE: Number of large read operations=0

		FILE: Number of write operations=0

		HDFS: Number of bytes read=152

		HDFS: Number of bytes written=31

		HDFS: Number of read operations=6

		HDFS: Number of large read operations=0

		HDFS: Number of write operations=2

	Job Counters

		Launched map tasks=1

		Launched reduce tasks=1

		Data-local map tasks=1

		Total time spent by all maps in occupied slots (ms)=5860

		Total time spent by all reduces in occupied slots (ms)=3296

		Total time spent by all map tasks (ms)=5860

		Total time spent by all reduce tasks (ms)=3296

		Total vcore-milliseconds taken by all map tasks=5860

		Total vcore-milliseconds taken by all reduce tasks=3296

		Total megabyte-milliseconds taken by all map tasks=6000640

		Total megabyte-milliseconds taken by all reduce tasks=3375104

	Map-Reduce Framework

		Map input records=3

		Map output records=6

		Map output bytes=59

		Map output materialized bytes=53

		Input split bytes=117

		Combine input records=6

		Combine output records=4

		Reduce input groups=4

		Reduce shuffle bytes=53

		Reduce input records=4

		Reduce output records=4

		Spilled Records=8

		Shuffled Maps =1

		Failed Shuffles=0

		Merged Map outputs=1

		GC time elapsed (ms)=224

		CPU time spent (ms)=2190

		Physical memory (bytes) snapshot=443719680

		Virtual memory (bytes) snapshot=4207517696

		Total committed heap usage (bytes)=293076992

	Shuffle Errors

		BAD_ID=0

		CONNECTION=0

		IO_ERROR=0

		WRONG_LENGTH=0

		WRONG_MAP=0

		WRONG_REDUCE=0

	File Input Format Counters

		Bytes Read=35

	File Output Format Counters

		Bytes Written=31

[hadoop@hadoop01 hadoop-2.8.2]$

6 查看结果

[hadoop@hadoop01 hadoop-2.8.2]$ hadoop dfs -lsr /work/data/output

DEPRECATED: Use of this script to execute hdfs command is deprecated.

Instead use the hdfs command for it.

lsr: DEPRECATED: Please use 'ls -R' instead.

-rw-r--r--   2 hadoop supergroup          0 2017-11-12 09:05 /work/data/output/_SUCCESS

-rw-r--r--   2 hadoop supergroup         31 2017-11-12 09:05 /work/data/output/part-r-00000

[hadoop@hadoop01 hadoop-2.8.2]$ hadoop dfs -text /work/data/output/part-r-00000

DEPRECATED: Use of this script to execute hdfs command is deprecated.

Instead use the hdfs command for it.

Hadoop	1

Hello	3

Hive	1

World	1

[hadoop@hadoop01 hadoop-2.8.2]$

Hadoop2.8.2 运行wordcount的更多相关文章

hadoop2.6.4运行wordcount
hadoop用户登录,启动服务: start-dfs.sh && start-yarn.sh 创建输入目录: hadoop df -mkdir /input 把测试文件导入/input ...
hadoop2.6.5运行wordcount实例
运行wordcount实例在/tmp目录下生成两个文本文件,上面随便写两个单词. cd /tmp/ mkdir file cd file/ echo "Hello world" ...
hadoop2.7.x运行wordcount程序卡住在INFO mapreduce.Job: Running job:job _1469603958907_0002
一.抛出问题 Hadoop集群(全分布式)配置好后,运行wordcount程序测试,发现每次运行都会卡住在Running job处,然后程序就呈现出卡死的状态. wordcount运行命令:[hado ...
CentOS上安装Hadoop2.7，添加数据节点，运行wordcount
安装hadoop的步骤比较繁琐,但是并不难. 在CentOS上安装Hadoop2.7 1. 安装 CentOS,注:图形界面并无必要 2. 在CentOS里设置静态IP,手工编辑如下4个文件 /etc ...
win10+eclipse+hadoop2.7.2+maven+local模式直接通过Run as Java Application运行wordcount
一.准备工作 (1)Hadoop2.7.2 在linux部署完毕,成功启动dfs和yarn,通过jps查看,进程都存在 (2)安装maven 二.最终效果在windows系统中,直接通过Run as ...
Spark源码编译并在YARN上运行WordCount实例
在学习一门新语言时,想必我们都是"Hello World"程序开始,类似地,分布式计算框架的一个典型实例就是WordCount程序,接触过Hadoop的人肯定都知道用MapRedu ...
解决在windows的eclipse上面运行WordCount程序出现的一系列问题详解
一．简介要在Windows下的 Eclipse上调试Hadoop2代码,所以我们在windows下的Eclipse配置hadoop-eclipse-plugin- 2.6.0.jar插件,并在运行H ...
Spark on YARN简介与运行wordcount（master、slave1和slave2）（博主推荐）
前期博客 Spark on YARN模式的安装(spark-1.6.1-bin-hadoop2.6.tgz +hadoop-2.6.0.tar.gz)(master.slave1和slave2)(博主 ...
Spark standalone简介与运行wordcount（master、slave1和slave2）
前期博客 Spark standalone模式的安装(spark-1.6.1-bin-hadoop2.6.tgz)(master.slave1和slave2) Spark运行模式概述 1. Stan ...

随机推荐

Uipath 浏览器页面最大化和最小化
文章来源东京IT青年前线http://www.rpatokyo.com/ Uipath 浏览器页面最大化和最小化浏览器在关闭时会自动记忆上次浏览器关闭时窗口的小,下次再次会以同样的大小打开.机器 ...
基于SignalR的服务端和客户端通讯处理
SignalR是一个.NET Core/.NET Framework的实时通讯的框架,一般应用在ASP.NET上,当然也可以应用在Winform上实现服务端和客户端的消息通讯,本篇随笔主要基于Sign ...
面试必问的Synchronized知道这些就可以了
Synchronized关键字算是Java的元老级锁了,一开始它撑起了Java的同步任务,其用法简单粗暴容易上手.但是有些与它相关的知识点还是需要我们开发者去深入掌握的.比如,我们都知道通过Synch ...
使用JRebel插件实现SpringBoot应用代码热加载
前言在实际的开发过程中,我们经常修改代码之后,手动的重启项目,查看修改效果.那么有没有一种方式能够快速的.自动的帮我们将修改代码自动更新,避免手动重启,从而提高开发效率呢?是有的,在我之前的文章里面 ...
判断是否存在UI被触摸
) || (Input.touchCount > && Input.GetTouch().phase == TouchPhase.Began)) { #if UNITY_ANDR ...
一分钟带你了解JWT认证！
目录一.JWT简介二.JWT认证和session认证的区别三.JWT认证流程四.JWT组成五.JWT使用场景一.JWT简介 JSON Web Token(JWT)是一个开放的标准(RFC ...
linux虚拟机（centos7）常见配置解析
1. 场景描述在win7下安装了多台虚拟机,安装后常用的几个配置记录下,因安全策略,采用的仅主机模式(内网). 2. 解决方案 2.1.更改主机名称 (1)更改主机名称,不是连接的名称,是hostn ...
基于UGUI的框架
这个框架简单易懂,上手就可以直接拿来用,主要是单例管理类,界面和界面之间的互相交流通过单例去实现,个人感觉不是很好,但是我特别喜欢他的管理层级非常分明. 之后会发一个广播机制,结合上这套UI框架,但是 ...
activeMQ 安装及启动异常处理
一.环境: [root@centos_6 ~]# cat /etc/system-release CentOS release 6.5 (Final) [root@centos_6 ~]# uname ...
python的位置参数、关键字参数、收集参数，关键字收集参数混合调用问题
参数混合调用顺序用法: 函数中参数顺序为:普通参数,收集参数,关键字参数,关键字收集参数,其顺序不能颠倒,颠倒会报错. 普通参数.关键字参数可以有n个,对量没有具体要求,收集参数和关键字收集参数要么没 ...

Hadoop2.8.2 运行wordcount

Hadoop2.8.2 运行wordcount的更多相关文章

随机推荐

热门专题