hdfs shell 命令以及原理

shell 操作 dfs

上传
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -put /opt/MegaRAID/MegaCli/MegaCli64 hdfs://ns1/MegaCli
或者
[hadoop@namenode ~]$ /data/hadoop/bin/hdfs dfs -put /opt/MegaRAID/MegaCli/MegaCli64 /megacli

查看
[hadoop@namenode ~]$ /data/hadoop/bin/hdfs dfs -ls /
Found 7 items
drwxr-xr-x - hadoop supergroup 0 2016-11-09 14:21 /123456
-rw-r--r-- 3 hadoop supergroup 2247752 2016-11-10 15:49 /MegaCli
drwxr-xr-x - hadoop supergroup 0 2016-11-04 15:20 /data
-rw-r--r-- 3 hadoop supergroup 2247752 2016-11-10 15:50 /megacli
drwx------ - hadoop supergroup 0 2016-11-09 12:11 /tmp
-rw-r--r-- 3 hadoop supergroup 214092195 2016-11-08 18:50 /tools
-rw-r--r-- 3 hadoop supergroup 53 2016-11-09 12:08 /worlds

下载
/data/hadoop/bin/hadoop fs -get hdfs://ns1/MegaCli ./
或者
/data/hadoop/bin/hdfs dfs -get /MegaCli ~/megacli

本地文件拷贝到hdfs中
/data/hadoop/bin/hadoop fs -copyFromLocal /data/auto_pub.sh /

查看 hdfs 文件
/data/hadoop/bin/hadoop fs -cat /auto_pub.sh | more

[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -count /
21 17 218744425 /
文件文件夹大小

递归查询，并且显示大小
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -ls -R -h /tmp

创建目录
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -mkdir /abcd

把本地文件move到hdfs上
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -moveFromLocal ~/abc.txt /

把hdfs文件move到本地
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -moveToLocal /abc.txt ~/

把hdfs文件move到hdfs
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -moveFromLocal ~/abc.txt /

把hdfs文件删除
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -rm /abc.txt

把hdfs目录删除
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -rm -r /abcd

查看hdfs 文件最后内容
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -tail -f /megacli

创建hdfs 一个空文件
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -touch /aaaa.txt

添加执行权限
[hadoop@namenode ~]$ /data/hadoop/bin/hadoop fs -chmod a+x /aaaa.txt

HDFS原理
1个client 需要读取数据，首先要和namenode联系，进行Metadata ops操作，获取元数据信息（metadata），
数据块是依次读取，不能同时读取，读一块，然后拼接。
机架感知：客户端有选择，在那台机器上读取比较近，有数据就近原则。
数据块的复制，是水平复制。

Metadata 元数据
内存与硬盘都保存一份
NameNode(FileName,replicas,block-ids,id2host......)
/test/a.log, 3,{blk_1,blk_2},[{blk_1:[h0,h1,h3]},{blk_2:[h0,h2,h4]}]
副本复制3此， /test/a.log 分成2块， blk_1 在 h0,h1,h3上， blk_2在h0,h2,h4上

NameNode是整个文件系统的管理节点。
他维护着整个文件系统的文件目录树，
文件/目录的元信息和每个文件对应的
数据块列表，接收用户的操作请求

文件包括
1 fsimage 元数据镜像文件，
2. edits 操作日志文件
3. fstime 保存最后一次checkpoint的时间

NameNode的工作特点
1.NameNode始终在内存中保存metedata，用于处理读请求。
2.到有“写请求”到来时，namenode会首先写edits到磁盘，即向edits文件中写日志，成功返回后，才会
修改内存，并且向客户端返回。
3. hadoop会维护一个fsimage文件，也就是namenode中的metedata镜像，但是fsimage不会随时与namenode
内存中的metedata保持一样，而是每隔一段时间通过合并edits文件来更新内容。
secondarynamenode 就是用来合并 fsimages和edits文件来更新 namenode的 metedata。

mapreduce 概述
mapreduce 是一种分布式计算模型，由google提出，主要用于搜索领域，解决海量数据的计算问题

MR由两个阶段组成，map和reduce，用户只需要实现map() 和 reduce() 两个函数，即可实现分布式计算，非常简单
这两个函数的形参是key、value对，表示函数的输入信息。

1. client 写好的worldcournt jar包提交给HDFS

2.nodemanager每隔一段时间就像RM发送心跳，帮自己的状态汇报给resourcemanager，领取任务。

3.resourcemanager的主要任务，是资源分配。

4.nodemanager从hdfs读取数据，reduce完成后又把数据写会到hdfs中。

5.client通过RPC协议提交任务到resourcemanager，只提交任务的描述信息。

6. nodemanager领取 resourcemanager任务的描述信息。

7.nodemanager到HDFS 领取jar包

8. 领到jar包，再启动一个进程，执行程序。

hdfs shell 命令以及原理的更多相关文章

HDFS - Shell命令
HDFS - Shell命令最近学习比较忙,本来想做一个搭建集群笔记,今天先记录HDFS-shell命令,明天,最迟明天下午我一定会做一个搭建集群的笔记.. 介绍一个我的集群搭建:一主三从 3个虚拟 ...
HDFS shell命令行常见操作
hadoop学习及实践笔记—— HDFS shell命令行常见操作附:HDFS shell guide文档地址 http://hadoop.apache.org/docs/r2.5.2/hadoop ...
hdfs shell命令及java客户端编写
一. hdfs shell命令可以通过hadoop fs 查看所有的shell命令及其用法. 传文件到hdfs: hadoop fs -put /home/koushengrui/Downloads ...
Hadoop学习记录（2）|HDFS shell命令|体系结构
HDFS的shell 调用文件系统(FS)shell命令使用hadoop fs的形式所有的FS shell命令使用URI路径作为参数. URI格式是scheme://authority/path.H ...
hadoop2.5.2学习及实践笔记（五）—— HDFS shell命令行常见操作
附:HDFS shell guide文档地址 http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/FileSy ...
HDFS Shell命令操作与java代码操作
(一)编程实现以下功能,并利用 Hadoop 提供的 Shell 命令完成相同任务: (1) 向 HDFS 中上传任意文本文件,如果指定的文件在 HDFS 中已经存在,则由用户来指定是追加到原 ...
hadoop 学习（三）之hdfs shell命令
1.HDFS shell 1.0查看帮助 hadoop fs -help <cmd> 1.1上传 hadoop fs -put <linux上文件> <hdfs上的路 ...
hadoop学习笔记（五）：HDFS Shell命令
一.HDFS文件命令以下是比较重要的一些命令: [root@master01 hadoop]# hadoop fs -ls / //查看根目录下的所有文件 [root@master01 hadoop ...
【hadoop】 hdfs shell 命令交互
1.put 本地文件上传至hdfs中 2. cat 查看内容 3. 删除文件,文件夹 4. ls 5. copyFromLocal 复制本地文件到HDFS , copyToLocal hdfs 复制到 ...

随机推荐

js冒泡排序
今天面试了家公司,最后要写个js的简单数组排序,很久都写不出来,好尴尬,随着语言的发展,这些简单方法越来越不被重视了... <html> <head> <script t ...
CozyRSS开发记录7-了解RSS
CozyRSS开发记录7-了解RSS 1.初窥RSS 多找几个RSS源就会发现,有的源是用Atom协议提供的,有的源是RSS协议提供的.RSS协议有过几个版本,0.9.1.0和2.0等,理论上支持2. ...
Appirater -- app中提示用户为app评价的提示框
Appirater是一段你可以嵌入自己工程中的代码,在用户使用应用一段时间后会自动弹出提示用户进行评分. 使用Appirater方面,你可以简单把源代码嵌入你的app工程中,并把以下代码添加至它的委托 ...
life_motto
simple,dedicated,healthy life style,love those u love...
PHP-Redis扩展使用手册（四）
/* 添加一个或者多个value到无顺序集合总,如果value已经成set中,则返回false * @param key set名称 * @param value * ... * @return in ...
Winform TextBox中只能输入数字的几种常用方法(C#)
方法一: private void tBox_KeyPress(object sender, KeyPressEventArgs e) { ; //禁止空格键 )) return; //处理负数 if ...
log4j.properties 使用
一.参数意义说明输出级别的种类 ERROR.WARN.INFO.DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告,比如session丢失 INFO 为一般要显示的信息,比如 ...
supercool.sh文件里，有哪些恶意的命令
当你在一个bash命令行中输入"*"时,bash会扩展到当前目录的所有文件,然后将他们全部作为参数传递给程序.例如:rm *,将会删除掉当前目录的所有文件. 0x01 文件名被当做 ...
谢欣伦 - OpenDev原创教程 - 无连接套接字类CxUdpSocket
这是一个精练的无连接套接字类,类名.函数名和变量名均采用匈牙利命名法.小写的x代表我的姓氏首字母(谢欣伦),个人习惯而已,如有雷同,纯属巧合. CxUdpSocket的使用如下(以某个叫做CSomeC ...
ThinkPHP 3.2.3 使用 PHPExcel 处理 Excel 表格
下载 PHPExcel(https://github.com/PHPOffice/PHPExcel) 把下载的 zip 包解压至 ./ThinkPHP/Library/Vendor 下一.导入 Ex ...

hdfs shell 命令以及原理

hdfs shell 命令以及原理的更多相关文章

随机推荐

热门专题