Hadoop学习6--里程碑式的开始之执行第一个程序wordcount

一、先在HDFS文件系统创建对应的目录，具体如下：

1、待处理文件存放目录

/data/wordcount（之所以创建wordcount，是为了对文件分类，对应本次任务名）

命令：hadoop fs -mkdir -p /data/wordcount (-p是同时创建子目录)

2、存放输出文件目录

/output

命令：hadoop fs -mkdir /output

tip:也可以在已连接了集群的eclipse里建立，即：Map/Reduce Location里

不过这种方式建立的文件，所有者是本机，不是我安装hadoop的用户，是否可用，需要验证下。

3、验证以上的成果：

命令：hadoop fs -ls /

二、自己在本地文件系统（也就是某一个目录下）手动创建一个文件，用于测试

1、创建文件

命令：vi ~/test/inputword（vi命令有意思，如果文件不存在，会自动创建一个空文件）

2、打开文件、手动写入一些测试内容：

hello my

hello master

what slave

hello slave

保存。

3、将该文件上传到hdfs文件系统：

命令：hadoop fs -put ~/test/inputword /data/wordcount/

验证方式：

命令：hadoop fs -text /data/wordcount/inputword

三、运行吧

命令：hadoop jar /work/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar wordcount /data/wordcount /output/wordcount

tip:

1、注意jar包的路径一定要写对，否则会提示找不到jar包

2、遇到个问题，一直提示重试连接服务器master：

15/10/29 02:26:38 INFO ipc.Client: Retrying connect to server: master/xx.xx.xx.xx:8032. Already tried 5 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

网上查了下，说是端口还是什么的，这个8032并不是我配置的，和他有关系的可能性不大。

不过其中一句话引起了我的联想，他提到了连接不上JobTacker云云

突然想起来，由于在启动hadoop集群的时候，提示start-all.sh已过时，于是使用的start-dfs.sh

这样在启动后，使用jps验证服务，是少几个的，只有两个namenode，一个datanode和一个默认的jps

于是重新执行了一次 start-all.sh

然后重新运行，成功。

Nice！

把结果截图放上来吧！

四、验证：

命令：-text /output/wordcount/part-r-00000

结果就是对单词出现个数的统计，略。

Hadoop学习6--里程碑式的开始之执行第一个程序wordcount的更多相关文章

hadoop第一个程序WordCount
hadoop第一个程序WordCount package test; import org.apache.hadoop.mapreduce.Job; import java.io.IOExceptio ...
从零开始学习PYTHON3讲义（三）写第一个程序
<从零开始PYTHON3>第三讲本页面使用了公式插件,因博客主机过滤无法显示的表示抱歉,并建议至个人主页查看原文. 我见过很多初学者,提到编程都有一种恐惧感,起源是感觉编程太难了.其 ...
Android学习——在Android中使用OpenCV的第一个程序
刚開始学习Android,因为之前比較熟悉OpenCV,于是就想先在Android上执行OpenCV试试 =============================================== ...
Mac上使用jenkins+ant执行第一个程序
本文旨在让同学们明白如何让jenkis在mac笔记本上运行,以模拟实际工作中在linux上搭建jenkins服务平台首先按照笔者的习惯先说一下如何安装jenkis和tomcat,先安装tomcat,在 ...
Spark学习之第一个程序 WordCount
WordCount程序求下列文件中使用空格分割之后,单词出现的个数 input.txt java scala python hello world java pyfysf upuptop wintp ...
Objective-C学习笔记（三）——用Objective-C编写第一个程序:Hello，World！
不管是哪一个程序猿,或者是学习哪一门计算机语言.写的第一个程序基本上就是Hello World. 今天我们用OC来实现第一个程序:Hello World. 在Xcode中选择新建一个项目,在对话框中选 ...
Hadoop学习之旅二：HDFS
本文基于Hadoop1.X 概述分布式文件系统主要用来解决如下几个问题: 读写大文件加速运算对于某些体积巨大的文件,比如其大小超过了计算机文件系统所能存放的最大限制或者是其大小甚至超过了计算机整 ...
Hadoop学习笔记—22.Hadoop2.x环境搭建与配置
自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...
Hadoop学习之旅三：MapReduce
MapReduce编程模型在Google的一篇重要的论文MapReduce: Simplified Data Processing on Large Clusters中提到,Google公司有大量的 ...

随机推荐

JS初学之-点击元素，当前的显示样式，其他变灰色
点击按钮或者其他元素,当前的变化,其他的不变(比如选项卡按钮,点击当前的变为黄色,其他的不变色),这样的情况我们有两种思路: 1.全部清空,当前添加 for(var i=0;i<aBtn.len ...
leetcode 106 Construct Binary Tree from Inorder and Postorder Traversal----- java
Given inorder and postorder traversal of a tree, construct the binary tree. Note:You may assume that ...
android解析json包（接口）
package com.http.test; 02 03 04 import org.apache.http.HttpResponse; 05 import org.apache.http ...
mysql修改列名和列类型
MySQL中修改列名或列的数据类型 (2012-04-03 08:59:25) 转载▼ 标签: mysql 修改列名修改列数据类型 it 分类: 数据库参考下面链接中的语法 http://dev. ...
记事本写JAVA程序
编写程序源码: 1.新建记事本程序,修改文件名称为HelloWorld.java 打开编辑以下内容,保存. public class HelloWorld { public static void m ...
FZU-2105 Digits Count （两种标记成段更新）
题目大意:给n个0~15之间的数,有3种更新操作,1种询问操作.3种更新操作是:1.让某个闭区间的所有数字与一个0~15之间的数字进行逻辑与运算:2.让某个闭区间的所有数字与一个0~15之间的数字进行 ...
如何在远程计算机上运行PowerShell
问题: 不能在WORKGROUP里面的远程计算机里运行PowerShell指令,报错为用户名密码错解决方法: 把两台机器上(远程计算机其和本机)都加入到trustedhosts 具体请参考 http ...
requests
>>>import requests>>> r = requests.get('http://www.zhidaow.com') # 发送请求>>&g ...
怎么保护PDF文档和扫描文件里的机密信息
从事商务工作的人,必然要处理带有机密信息的文档,需要分享这些文档的时候,如何谨慎小心地对待那些机密信息,说到底还是取决于自己.分享文档的目的不同,对文档的保护类型和级别也不一样.例如,只有授权的读者才 ...
TFS 强制撤销别人签出的代码
有个同事离职一段时间了,今天改一下她的代码,发现有个文件签出了,晕,而且TFS用的也是只允许单用户签出. 1,找原来的用的机器,已经被人占用了,系统已经重做. 2,只有用命令行来搞了. 大致如下: t ...

Hadoop学习6--里程碑式的开始之执行第一个程序wordcount

Hadoop学习6--里程碑式的开始之执行第一个程序wordcount的更多相关文章

随机推荐

热门专题