实训任务02:Hadoop基础操作
实训任务02:Hadoop基础操作
班级 学号 姓名
实训1:创建测试文件上传HDFS,并显示内容
需求说明:
在本地计算机上创建测试文件helloHadoop.txt,输入任意3行记录。将helloHadoop.txt上传到HDFS目录/user/root/filetest/下,并以HDFS命令显示 它的内容(提示:HDFS目录/user/root/filetest并不存在,因此需要先创建它。
实现思路及步骤:
(1) 用vi编辑器编写helloHadoop.txt文件。
(2) 启动hdfs
(3) 用hdfs dfs –put 命令上传文件到HDFS。
操作步骤如下(请截图)
实训2 统计文件中所有单词的平均长度
需求说明:
在集群服务器master的本地目录上有日志文件root/install.log,要求对文件中的单词进行统计,求单词的平均长度。
实现思路及步骤:
(1) 上传/root/install.log到HDFS目录/user/root/
(2) 使用Hadoop官方的示例程序包hadoop-mapreduce-eamples-2.6.4.jar,以hadoop.jar命令提交MapReduce任务。参考代码如下:
Hadoop jar \
$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6..jar \
Wordmean \
/user/root/install.log \
/user/root/wordmean
(3) 查看输出结果。
运行结果如下:(请截图)
实训3 查询与中断MapReduce任务
需求说明:
使用Web浏览器查看在实训2中执行过的MapReduce任务。依次提交3个统计单词和度的MapReduce任务,查看当前集群的计算资源使用情况,以及任务列表信息。中断第2个任务,观察后续任务的执行情况。
实现思路及步骤:
(1) 在web浏览器中输入http://master:8088/cluster/apps打开MapReduce任务列表界面。
(2) 单击列表中实训2中提交的任务链接,查询执行时间与完成状态。
(3) 在集群服务器终端,分别提交3个统计单词长度的MapReduce任务,具体执任命令参考实训2代码。注意,输出目录必须重新指定,并且3个任务参应的输出目录是不同的。
(4) 在Web浏览器中输入http://master:8088/cluster/nodes,查看当前集群及各节点的资湖使用情况。
(5) 在任务列表界面上,单击任务2并中断它。
各步骤运行结果如下:(请截图)
实验结果分析与总结
(注:必须写,这里填写你的实验达到的预期效果,是否按时完成,遇到哪些问题?如何解决的?还需要学习和提高的地方?下一步的计划和打算?)
实训任务02:Hadoop基础操作的更多相关文章
- 指导手册03:Hadoop基础操作
指导手册03:Hadoop基础操作 Part 1:查看Hadoop集群的基本信息1.查询存储系统信息(1)在WEB浏览器的地址栏输入http://master:50070/ 请查看自己的Hadoop集 ...
- hadoop - 基础操作
查看文件: [root@hadoop hadoop]# hadoop fs -lsr /drwxr-xr-x - root supergroup 0 2016-12-27 10:49 /homedrw ...
- 【东软实训】SQLselect及其相关操作
SQL select 及相关操作 SQL是用于访问和处理数据库的标准的计算机语言,我们所使用的的是Oracle SQL 一个数据库通常包含一个或多个表,每个表有一个名字表示,下图即为一个名为“emp” ...
- hadoop基础操作
通过hadoop上的hive完成WordCount 启动hadoop Hdfs上创建文件夹 上传文件至hdfs 启动Hive 创建原始文档表 导入文件内容到表docs并查看 用HQL进行词频统计,结果 ...
- 02 . Mysql基础操作及增删改查
SQL简介 SQL(Structured Query Language 即结构化查询语言) SQL语言主要用于存取数据.查询数据.更新数据和管理关系数据库系统,SQL语言由IBM开发. SQL语句四大 ...
- 实训任务01:安装Hadoop
实训任务1:安装Hadoop 实训1 :为Hadoop集群增加一个节点 需示说明: 运行环境:操作系统:centos6.8 ,hadoop2.6.4 在实训指导中搭建了3个节点的hadoop集群,要求 ...
- iNeuOS工业互联网平台,在高校教学实训领域的应用
目 录 1. 概述... 2 2. 实训柜... 2 3. 培训内容... 4 4. 二次开发培训... 5 1. 概述 中国工业互联网从 0 ...
- UML基础与Rose建模实训教程
目 录 第1章 初识UML. 1 1.1 初识UML用例图... 1 1.2 初识UML类图... 3 第2章 Rational Rose工具... 6 2.1 安装与配置Rational Ro ...
- 【CC2530入门教程-增强版】基础技能综合实训案例(基础版)-上位机源码
[CC2530入门教程-增强版]基础技能综合实训案例(基础版)-上位机源码 广东职业技术学院 欧浩源 一.需求分析 按照指定参数打开串口,与测控终端建立数据传输通道,并根据应用要求实现程序逻辑,具体 ...
随机推荐
- EvansClassification
EvansClassification In his excellent book Domain Driven Design, Eric Evans creates a classification ...
- Typora 和 markdown
目录 Typora 和 markdown Typora 简单介绍 markdown语法 导出 Typora 和 markdown Typora 简单介绍 支持markdown的一款优雅的编辑器. 绿色 ...
- Jmeter 常见错误
常见错误 https://testerhome.com/topics/10950 接口测试 https://blog.csdn.net/github_27109687/article/details/ ...
- strcmp()字符串比较函数用法
函数原型: int strcmp(const char *s1, const char *s2); 头文件: #include <string.h> 功能: 用来比较两个字符串 参数: s ...
- 遇到的Cocos2dx问题
平时工作中,多多少少,总会遇到些棘手的问题,此文章会不断更新,避免下次再入坑 Cocos 官方相关下载 https://github.com/fusijie/Cocos-Resource Easin ...
- 承接微信小程序外包 H5外包就找北京动点软件开发团队
承接小程序外包 微信小程序外包 H5外包 就找北京动点软件 长年承接微信小程序.微信公众号开发 全职的H5开发团队,开发过几十款微信小程序公众号案例 欢迎来电咨询,索取案例! QQ:372900288 ...
- OpenGL.tutorial06键盘和鼠标
1.这个图是用 Excel画的 简单示意图(单元格边框,视图-->网格线) 1.1.中间的 正立方体 处于 X/Y/Z轴的中心,边长为2 ZC:代码中 原版是 人物在 (0,0,5)处,水平夹角 ...
- 获取访问者IP
在一般情况下使用Request.getRemoteAddr()即可,但是经过nginx等反向代理软件后,这个方法会失效. * 本方法先从Header中获取X-Real-IP,如果不存在再从X- ...
- vue父子组件的传值总结
久违的博客园我又回来了.此篇文章写得是vue父子组件的传值,虽然网上已经有很多了.写此文章的目的就是记录下个人学习的一部分.接下来我们就进入主题吧! 在开发vue项目中,父子组件的传值是避免不掉的. ...
- C++ for循环语句
#include "pch.h" #include<iostream> using namespace std; int main() { int i = 1, sum ...