1、Overview

  文件系统(FS)shell包含多种能直接与HDFS(Hadoop Distributed File System)及Hadoop支持的其他文件系统,例如Local FS,HFTP FS,S3 FS等进行直接交互的命令。FS shell由bin/hadoop fs <args>发起。

所有的FS shell都将URI作为参数。URI的形式为:scheme://authority/path。HDFS的scheme为hdfs,Local FS的scheme为file。scheme和权限是可选的。如果没有指定shceme,则使用配置文件中的scheme。HDFS的文件或路径例如/parent/child可以简写为hdfs://namenodehost/parent/child或简写为/parent/child(考虑到配置设置指向hdfs://namenodehost)。

  大多数FS shell的命令与Unix命令类似。两者的差异在对每个命令说明时指出。错误信息将发送到stderr,输出信息发送到stdout。

当使用HDFS时,hdfs和dfs是同义词。

更多详细信息请参考命令手册

2 、appendToFile

  使用:hadoop fs –appendToFile <localsrc>  … <dst>

  功能:把本地的一个或多个文件添加append到目标文件系统。也可以从stdin追加到目标文件系统。

  Example:

  • hadoop fs –appendToFile localfile /user/hadoop/hadoopfile
  • hadoop fs –appendToFile localfile1 localfile2 /user/hadoop/hadoopfile
  • hadoop fs –appendToFile localfile hdfs://nn.example.com/hadoop/hadoopfile
  • hadoop fs –appendToFile –hdfs://nn.example.com/hadoop/hadoopfile Reads the input from stdin

  返回值:追加成功则返回0,否则返回1

3 、cat

使用:hadoop fs –cat URI [URI …]

功能:将原路径的内容copy到stdout

Example:

  • hadoop fs –cat hdfs://nn1.example.com/file1 hdfs://nn2.example.com/file2
  • hadoop fs –cat file:///file3 /user/hadoop/file4

返回值:成功返回0,否则返回-1

4 、checksum

使用:hadoop fs –checksum URI

功能:返回一个文件的检查值。

Example:

  • hadoop fs –checksum hdfs://nn1.example.com/file1
  • hadoop fs –checksum file:///etc/hosts

5 、chgrp

使用:hadoop fs –chgrp [-R] GROUP URI [URI …]

功能:改变文件所属组。使用该命令的用户必须是文件的所有者或者是超级用户。更多信息参考用户权限指南

选项:使用-R选项将递归改变文件组信息。

6 、chmod

使用:hadoop fs –chmod [-R] <MODE [,MODE]… |OCTALMODE> URI [URI…]

功能:改变文件的权限。使用-R选项将递归改变文件权限信息。使用该命令的用户必须是文件的所有者或超级用户。更多信息请参考用户权限指南

7 、chown

使用:hadoop fs –chown[-R]  [OWNER] [:GROUP] URI [URI]

功能:改变文件权限。使用-R选项将递归改变文件权限。使用该命令的用户必须是文件所有者或超级用户。更多信息请参考用户权限指南

8、copyFromLocal

使用:hadoop fs –copyFromLocal <localsrc> URI

功能:除了源文件必须为本地文件系统外其他与put命令相似。

选项:如果目标文件已经存在-f命令将重写目标文件。

9 、copyToLocal

使用:hadoop fs –copyToLocal [-ignorecrc] [-crc] URI <localdst>

功能:除了目标文件必须为本地文件外,其他与get命令相似。

10 、count

使用:hadoop fs –count [-q] [-h] [-v] <paths>

功能:计算指定目录下符合特定模式的文件夹、文件和字节数。使用-count输出列为:DIR_COUNT,FILE_COUNT,CONTENT_SIZE,PATHNAME

  使用-count –q的输出列为:QUOTA,REMAINING_QUATA,SPACE_QUOTA,REMAINING_SPACE_QUOTA,DIR_COUNT,FILE_COUNT,CONTENT_SIZE,PATHNAME

  使用-h选项使得输出的字节数可读性能强。

  使用-v将展示首行。

Example:

  • hadoop fs –count hdfs://nn1.example.com/file1 hdfs://nn2.example.com/file2
  • hadoop fs –count –q hdfs://nn1.example.com/file1
  • hadoop fs –count –q –h hdfs://nn1.example.com/file1
  • hdfs dfs –count –q –h –v hdfs://nn1.example.com/file1

返回值:如果成功则返回0,否则返回-1。

11、cp

使用:hadoop fs –cp [-f] [-p | -p [topax]] URI [URI…] <dest>

功能:将文件从源路径copy到目标路径。该命令允许一次copy多个文件,但是此时目标必须是路径。

Example:

  • hadoop fs –cp /user/hadoop/file1 /user/hadoop/file2
  • hadoop fs –cp /user/hadoop/file1 /user/hadoop/file2 /user/hadoop/dir

返回值:如果成功则返回0,否则返回-1。

参考文献

官方文档

从零开始学Hadoop系列之File System命令一的更多相关文章

  1. 从零开始学 Web 系列教程

    大家好,这里是「 从零开始学 Web 系列教程 」,并在下列地址同步更新…… github:https://github.com/Daotin/Web 微信公众号:Web前端之巅 博客园:http:/ ...

  2. MSDN Webcast 跟我一起从零开始学WCF系列课程

    系列课程 >跟我一起从零开始学WCF系列课程   跟我一起从零开始学WCF系列课程(1):WCF概述 (Level 200)   讲 师:徐长龙    课程简介:从 本堂课开始我们将开启一个新的 ...

  3. Hadoop系列006-HDFS概念及命令行操作

    本人微信公众号,欢迎扫码关注! HDFS概念及命令行操作 一.HDFS概念 1.1 概念 HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件:其次,它是分布式的,由很多服务器联合起来实现其 ...

  4. spring框架的学习->从零开始学JAVA系列

    目录 Spring框架的学习 框架的概念 框架的使用 Spring框架的引入 概念 作用 内容 SpringIOC的学习 概念 作用 基本使用流程 SpringIOC创建对象的三种方式 通过构造器方式 ...

  5. 跟我一起从零开始学WCF系列课程

    http://www.microsoft.com/china/msdn/events/webcasts/shared/webcast/Series/WCF_Begin.aspx 服务和协定 服务协定使 ...

  6. JAVAWEB过滤器、监听器的作用及使用>从零开始学JAVA系列

    目录 JAVAWEB过滤器.拦截器的作用及使用 过滤器Filter 什么是过滤器 为什么要使用过滤器(过滤器所能解决的问题) 配置一个过滤器完成编码的过滤 编写一个EncodingFilter(名称自 ...

  7. JSP的执行原理、JSP的内置对象、四大作用域解析、MVC模式理解>从零开始学JAVA系列

    目录 JSP的执行原理.JSP的内置对象.四大作用域解析.MVC模式理解 JSP的执行原理 这里拿一个小例子来解析JSP是如何被访问到的 首先将该项目部署到tomcat,并且通过tomcat启动 通过 ...

  8. JAVAWEB - Servlet原理及其使用>从零开始学JAVA系列

    目录 Servlet原理及其使用 什么是Servlet Servlet的使用 编写一个Servlet,使用继承HttpServlet的方式 配置web.xml 很简单的几个JSP文件 小提示,如果继承 ...

  9. JAVA数组的基础入门>从零开始学java系列

    目录 JAVA数组的基础入门 什么是数组,什么情况下使用数组 数组的创建方式 获取数组的数据 数组的内存模型 为什么数组查询修改快,而增删慢? 查询快的原因 增删慢的原因 数组的两种遍历方式以及区别 ...

随机推荐

  1. 《InsideUE4》UObject(三)类型系统设定和结构

    垃圾分类,从我做起! 引言 上篇我们谈到了为何设计一个Object系统要从类型系统开始做起,并探讨了C#的实现,以及C++中各种方案的对比,最后得到的结论是UE采用UHT的方式搜集并生成反射所需代码. ...

  2. Spring mvc 中有关 Shiro 1.2.3 配置问题

    Spring 版本:3.2.x,  4.0.x [问题说明] 首先介绍下配置出错情况: (1)项目中,Spring3 and Spring4 的 applicationContext.xml aop ...

  3. Java中的继承与组合

    本文主要说明Java中继承与组合的概念,以及它们之间的联系与区别.首先文章会给出一小段代码示例,用于展示到底什么是继承.然后演示如何通过“组合”来改进这种继承的设计机制.最后总结这两者的应用场景,即到 ...

  4. [转]python集合set

    Python中集合set是基本数据类型的一种,它有可变集合(set)和不可变集合(frozenset)两种.创建集合set.集合set添加.集合删除.交集.并集.差集的操作都是非常实用的方法. 来源网 ...

  5. css行级块级区别总结摘录

    一.块级元素:block element 每个块级元素默认占一行高度,一行内添加一个块级元素后无法一般无法添加其他元素(float浮动后除外).两个块级元素连续编辑时,会在页面自动换行显示.块级元素一 ...

  6. JS动态加载 js css

    1.动态加载js function loadScript( url ){ var script = document.createElement( "script" ); scri ...

  7. 字符串处理——strpos()函数

    strpos() 函数返回字符串在另一个字符串中第一次出现的位置. 大小写敏感 如果没有找到该字符串,则返回 false. strpos(string,find,start)  string 必需:规 ...

  8. js获取ip方法

    <script type="text/javascript" src="http://counter.sina.com.cn/ip/" charset=& ...

  9. Maven插件开发

    Maven为我们提供了丰富的插件资源,使得开发调试过程中非常方便,可以满足大多数场景下的需求.当然有时候,我们也需要根据需求定制自己的插件.下面是在开发Maven插件时的一点备忘录,具体的开发流程请G ...

  10. CentOS 基础安装

    1. 下载了 CentOS 的最小安装版本 与 VMware,基础安装流程参考百度经验:http://jingyan.baidu.com/article/eae0782787b4c01fec54853 ...