1、Overview

  文件系统(FS)shell包含多种能直接与HDFS(Hadoop Distributed File System)及Hadoop支持的其他文件系统,例如Local FS,HFTP FS,S3 FS等进行直接交互的命令。FS shell由bin/hadoop fs <args>发起。

所有的FS shell都将URI作为参数。URI的形式为:scheme://authority/path。HDFS的scheme为hdfs,Local FS的scheme为file。scheme和权限是可选的。如果没有指定shceme,则使用配置文件中的scheme。HDFS的文件或路径例如/parent/child可以简写为hdfs://namenodehost/parent/child或简写为/parent/child(考虑到配置设置指向hdfs://namenodehost)。

  大多数FS shell的命令与Unix命令类似。两者的差异在对每个命令说明时指出。错误信息将发送到stderr,输出信息发送到stdout。

当使用HDFS时,hdfs和dfs是同义词。

更多详细信息请参考命令手册

2 、appendToFile

  使用:hadoop fs –appendToFile <localsrc>  … <dst>

  功能:把本地的一个或多个文件添加append到目标文件系统。也可以从stdin追加到目标文件系统。

  Example:

  • hadoop fs –appendToFile localfile /user/hadoop/hadoopfile
  • hadoop fs –appendToFile localfile1 localfile2 /user/hadoop/hadoopfile
  • hadoop fs –appendToFile localfile hdfs://nn.example.com/hadoop/hadoopfile
  • hadoop fs –appendToFile –hdfs://nn.example.com/hadoop/hadoopfile Reads the input from stdin

  返回值:追加成功则返回0,否则返回1

3 、cat

使用:hadoop fs –cat URI [URI …]

功能:将原路径的内容copy到stdout

Example:

  • hadoop fs –cat hdfs://nn1.example.com/file1 hdfs://nn2.example.com/file2
  • hadoop fs –cat file:///file3 /user/hadoop/file4

返回值:成功返回0,否则返回-1

4 、checksum

使用:hadoop fs –checksum URI

功能:返回一个文件的检查值。

Example:

  • hadoop fs –checksum hdfs://nn1.example.com/file1
  • hadoop fs –checksum file:///etc/hosts

5 、chgrp

使用:hadoop fs –chgrp [-R] GROUP URI [URI …]

功能:改变文件所属组。使用该命令的用户必须是文件的所有者或者是超级用户。更多信息参考用户权限指南

选项:使用-R选项将递归改变文件组信息。

6 、chmod

使用:hadoop fs –chmod [-R] <MODE [,MODE]… |OCTALMODE> URI [URI…]

功能:改变文件的权限。使用-R选项将递归改变文件权限信息。使用该命令的用户必须是文件的所有者或超级用户。更多信息请参考用户权限指南

7 、chown

使用:hadoop fs –chown[-R]  [OWNER] [:GROUP] URI [URI]

功能:改变文件权限。使用-R选项将递归改变文件权限。使用该命令的用户必须是文件所有者或超级用户。更多信息请参考用户权限指南

8、copyFromLocal

使用:hadoop fs –copyFromLocal <localsrc> URI

功能:除了源文件必须为本地文件系统外其他与put命令相似。

选项:如果目标文件已经存在-f命令将重写目标文件。

9 、copyToLocal

使用:hadoop fs –copyToLocal [-ignorecrc] [-crc] URI <localdst>

功能:除了目标文件必须为本地文件外,其他与get命令相似。

10 、count

使用:hadoop fs –count [-q] [-h] [-v] <paths>

功能:计算指定目录下符合特定模式的文件夹、文件和字节数。使用-count输出列为:DIR_COUNT,FILE_COUNT,CONTENT_SIZE,PATHNAME

  使用-count –q的输出列为:QUOTA,REMAINING_QUATA,SPACE_QUOTA,REMAINING_SPACE_QUOTA,DIR_COUNT,FILE_COUNT,CONTENT_SIZE,PATHNAME

  使用-h选项使得输出的字节数可读性能强。

  使用-v将展示首行。

Example:

  • hadoop fs –count hdfs://nn1.example.com/file1 hdfs://nn2.example.com/file2
  • hadoop fs –count –q hdfs://nn1.example.com/file1
  • hadoop fs –count –q –h hdfs://nn1.example.com/file1
  • hdfs dfs –count –q –h –v hdfs://nn1.example.com/file1

返回值:如果成功则返回0,否则返回-1。

11、cp

使用:hadoop fs –cp [-f] [-p | -p [topax]] URI [URI…] <dest>

功能:将文件从源路径copy到目标路径。该命令允许一次copy多个文件,但是此时目标必须是路径。

Example:

  • hadoop fs –cp /user/hadoop/file1 /user/hadoop/file2
  • hadoop fs –cp /user/hadoop/file1 /user/hadoop/file2 /user/hadoop/dir

返回值:如果成功则返回0,否则返回-1。

参考文献

官方文档

从零开始学Hadoop系列之File System命令一的更多相关文章

  1. 从零开始学 Web 系列教程

    大家好,这里是「 从零开始学 Web 系列教程 」,并在下列地址同步更新…… github:https://github.com/Daotin/Web 微信公众号:Web前端之巅 博客园:http:/ ...

  2. MSDN Webcast 跟我一起从零开始学WCF系列课程

    系列课程 >跟我一起从零开始学WCF系列课程   跟我一起从零开始学WCF系列课程(1):WCF概述 (Level 200)   讲 师:徐长龙    课程简介:从 本堂课开始我们将开启一个新的 ...

  3. Hadoop系列006-HDFS概念及命令行操作

    本人微信公众号,欢迎扫码关注! HDFS概念及命令行操作 一.HDFS概念 1.1 概念 HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件:其次,它是分布式的,由很多服务器联合起来实现其 ...

  4. spring框架的学习->从零开始学JAVA系列

    目录 Spring框架的学习 框架的概念 框架的使用 Spring框架的引入 概念 作用 内容 SpringIOC的学习 概念 作用 基本使用流程 SpringIOC创建对象的三种方式 通过构造器方式 ...

  5. 跟我一起从零开始学WCF系列课程

    http://www.microsoft.com/china/msdn/events/webcasts/shared/webcast/Series/WCF_Begin.aspx 服务和协定 服务协定使 ...

  6. JAVAWEB过滤器、监听器的作用及使用>从零开始学JAVA系列

    目录 JAVAWEB过滤器.拦截器的作用及使用 过滤器Filter 什么是过滤器 为什么要使用过滤器(过滤器所能解决的问题) 配置一个过滤器完成编码的过滤 编写一个EncodingFilter(名称自 ...

  7. JSP的执行原理、JSP的内置对象、四大作用域解析、MVC模式理解>从零开始学JAVA系列

    目录 JSP的执行原理.JSP的内置对象.四大作用域解析.MVC模式理解 JSP的执行原理 这里拿一个小例子来解析JSP是如何被访问到的 首先将该项目部署到tomcat,并且通过tomcat启动 通过 ...

  8. JAVAWEB - Servlet原理及其使用>从零开始学JAVA系列

    目录 Servlet原理及其使用 什么是Servlet Servlet的使用 编写一个Servlet,使用继承HttpServlet的方式 配置web.xml 很简单的几个JSP文件 小提示,如果继承 ...

  9. JAVA数组的基础入门>从零开始学java系列

    目录 JAVA数组的基础入门 什么是数组,什么情况下使用数组 数组的创建方式 获取数组的数据 数组的内存模型 为什么数组查询修改快,而增删慢? 查询快的原因 增删慢的原因 数组的两种遍历方式以及区别 ...

随机推荐

  1. 安卓 报错 Check the Eclipse log for stack trace.

    移除Android Dependencies就行了. 在properties的Libraries里

  2. hdu 4631(最近点对,容器)

    点击打开链接 题意: 给你一个平面,每次加入一个点,当点数>=2时,求最近点对距离的平方,最后输出所有的平方和. 给你a,b,c x[0]=0;x[i]=(x[i-1]*a+b)%c 如果按照平 ...

  3. PHP Countable接口

    实现该接口可以使用count()方法来获取集合的总数

  4. php 数组 类对象 值传递 引用传递 区别

    一般的数据类型(int, float, bool)不做这方面的解说了 这里详细介绍一下数组和的类的对象作为参数进行值传递的区别 数组值传递 实例代码: <?php function main() ...

  5. python的sorted相关

    Python 字典排序 在python里,字典是内置的数据类型,是个无序的存储结构,每一个元素是key-value对: 有关key的解释: sorted(L,key=by_name)中的key即by_ ...

  6. SQL SERVER 数据库邮件配置

    1.简单了解数据库邮件的概念和使用的传输协议及系统体系: 数据库邮件是从 SQL Server 数据库引擎中发送电子邮件的企业解决方案.通过使用数据库邮件,数据库应用程序可以向用户发送电子邮件.邮件中 ...

  7. Python三元表达式

    我们知道Python没有三元表达式,但是我们通过技巧达到三元表达式的效果. 摘自<Dive Into Python>: 在Python 中,and 和 or 执行布尔逻辑演算,如你所期待的 ...

  8. Matlab 数理统计

    1.离散随机分布 超几何分布:M:产品总数;K:次品数;N:抽样数. hygepdf(X, M,K,N):计算超几何分布的密度. 例:hygepdf(1,10,1,3),执行结果为ans=0.3000 ...

  9. Red Hat TimesTen安装记录

    1:内核参数修改 # vi /etc/sysctl.conf kernel.sem= #sysctl –p 备注:此安装过程为测试环境,具体参数修改要参考TimesTen官方文档. 2:创建用户及组信 ...

  10. poj A Round Peg in a Ground Hole

    http://poj.org/problem?id=1584 #include<cstdio> #include<cstring> #include<cmath> ...