从零开始学Hadoop系列之File System命令一
1、Overview
文件系统(FS)shell包含多种能直接与HDFS(Hadoop Distributed File System)及Hadoop支持的其他文件系统,例如Local FS,HFTP FS,S3 FS等进行直接交互的命令。FS shell由bin/hadoop fs <args>发起。
所有的FS shell都将URI作为参数。URI的形式为:scheme://authority/path。HDFS的scheme为hdfs,Local FS的scheme为file。scheme和权限是可选的。如果没有指定shceme,则使用配置文件中的scheme。HDFS的文件或路径例如/parent/child可以简写为hdfs://namenodehost/parent/child或简写为/parent/child(考虑到配置设置指向hdfs://namenodehost)。
大多数FS shell的命令与Unix命令类似。两者的差异在对每个命令说明时指出。错误信息将发送到stderr,输出信息发送到stdout。
当使用HDFS时,hdfs和dfs是同义词。
更多详细信息请参考命令手册。
2 、appendToFile
使用:hadoop fs –appendToFile <localsrc> … <dst>
功能:把本地的一个或多个文件添加append到目标文件系统。也可以从stdin追加到目标文件系统。
Example:
- hadoop fs –appendToFile localfile /user/hadoop/hadoopfile
- hadoop fs –appendToFile localfile1 localfile2 /user/hadoop/hadoopfile
- hadoop fs –appendToFile localfile hdfs://nn.example.com/hadoop/hadoopfile
- hadoop fs –appendToFile –hdfs://nn.example.com/hadoop/hadoopfile Reads the input from stdin
返回值:追加成功则返回0,否则返回1
3 、cat
使用:hadoop fs –cat URI [URI …]
功能:将原路径的内容copy到stdout
Example:
- hadoop fs –cat hdfs://nn1.example.com/file1 hdfs://nn2.example.com/file2
- hadoop fs –cat file:///file3 /user/hadoop/file4
返回值:成功返回0,否则返回-1
4 、checksum
使用:hadoop fs –checksum URI
功能:返回一个文件的检查值。
Example:
- hadoop fs –checksum hdfs://nn1.example.com/file1
- hadoop fs –checksum file:///etc/hosts
5 、chgrp
使用:hadoop fs –chgrp [-R] GROUP URI [URI …]
功能:改变文件所属组。使用该命令的用户必须是文件的所有者或者是超级用户。更多信息参考用户权限指南。
选项:使用-R选项将递归改变文件组信息。
6 、chmod
使用:hadoop fs –chmod [-R] <MODE [,MODE]… |OCTALMODE> URI [URI…]
功能:改变文件的权限。使用-R选项将递归改变文件权限信息。使用该命令的用户必须是文件的所有者或超级用户。更多信息请参考用户权限指南。
7 、chown
使用:hadoop fs –chown[-R] [OWNER] [:GROUP] URI [URI]
功能:改变文件权限。使用-R选项将递归改变文件权限。使用该命令的用户必须是文件所有者或超级用户。更多信息请参考用户权限指南。
8、copyFromLocal
使用:hadoop fs –copyFromLocal <localsrc> URI
功能:除了源文件必须为本地文件系统外其他与put命令相似。
选项:如果目标文件已经存在-f命令将重写目标文件。
9 、copyToLocal
使用:hadoop fs –copyToLocal [-ignorecrc] [-crc] URI <localdst>
功能:除了目标文件必须为本地文件外,其他与get命令相似。
10 、count
使用:hadoop fs –count [-q] [-h] [-v] <paths>
功能:计算指定目录下符合特定模式的文件夹、文件和字节数。使用-count输出列为:DIR_COUNT,FILE_COUNT,CONTENT_SIZE,PATHNAME
使用-count –q的输出列为:QUOTA,REMAINING_QUATA,SPACE_QUOTA,REMAINING_SPACE_QUOTA,DIR_COUNT,FILE_COUNT,CONTENT_SIZE,PATHNAME
使用-h选项使得输出的字节数可读性能强。
使用-v将展示首行。
Example:
- hadoop fs –count hdfs://nn1.example.com/file1 hdfs://nn2.example.com/file2
- hadoop fs –count –q hdfs://nn1.example.com/file1
- hadoop fs –count –q –h hdfs://nn1.example.com/file1
- hdfs dfs –count –q –h –v hdfs://nn1.example.com/file1
返回值:如果成功则返回0,否则返回-1。
11、cp
使用:hadoop fs –cp [-f] [-p | -p [topax]] URI [URI…] <dest>
功能:将文件从源路径copy到目标路径。该命令允许一次copy多个文件,但是此时目标必须是路径。
Example:
- hadoop fs –cp /user/hadoop/file1 /user/hadoop/file2
- hadoop fs –cp /user/hadoop/file1 /user/hadoop/file2 /user/hadoop/dir
返回值:如果成功则返回0,否则返回-1。
参考文献
官方文档
从零开始学Hadoop系列之File System命令一的更多相关文章
- 从零开始学 Web 系列教程
大家好,这里是「 从零开始学 Web 系列教程 」,并在下列地址同步更新…… github:https://github.com/Daotin/Web 微信公众号:Web前端之巅 博客园:http:/ ...
- MSDN Webcast 跟我一起从零开始学WCF系列课程
系列课程 >跟我一起从零开始学WCF系列课程 跟我一起从零开始学WCF系列课程(1):WCF概述 (Level 200) 讲 师:徐长龙 课程简介:从 本堂课开始我们将开启一个新的 ...
- Hadoop系列006-HDFS概念及命令行操作
本人微信公众号,欢迎扫码关注! HDFS概念及命令行操作 一.HDFS概念 1.1 概念 HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件:其次,它是分布式的,由很多服务器联合起来实现其 ...
- spring框架的学习->从零开始学JAVA系列
目录 Spring框架的学习 框架的概念 框架的使用 Spring框架的引入 概念 作用 内容 SpringIOC的学习 概念 作用 基本使用流程 SpringIOC创建对象的三种方式 通过构造器方式 ...
- 跟我一起从零开始学WCF系列课程
http://www.microsoft.com/china/msdn/events/webcasts/shared/webcast/Series/WCF_Begin.aspx 服务和协定 服务协定使 ...
- JAVAWEB过滤器、监听器的作用及使用>从零开始学JAVA系列
目录 JAVAWEB过滤器.拦截器的作用及使用 过滤器Filter 什么是过滤器 为什么要使用过滤器(过滤器所能解决的问题) 配置一个过滤器完成编码的过滤 编写一个EncodingFilter(名称自 ...
- JSP的执行原理、JSP的内置对象、四大作用域解析、MVC模式理解>从零开始学JAVA系列
目录 JSP的执行原理.JSP的内置对象.四大作用域解析.MVC模式理解 JSP的执行原理 这里拿一个小例子来解析JSP是如何被访问到的 首先将该项目部署到tomcat,并且通过tomcat启动 通过 ...
- JAVAWEB - Servlet原理及其使用>从零开始学JAVA系列
目录 Servlet原理及其使用 什么是Servlet Servlet的使用 编写一个Servlet,使用继承HttpServlet的方式 配置web.xml 很简单的几个JSP文件 小提示,如果继承 ...
- JAVA数组的基础入门>从零开始学java系列
目录 JAVA数组的基础入门 什么是数组,什么情况下使用数组 数组的创建方式 获取数组的数据 数组的内存模型 为什么数组查询修改快,而增删慢? 查询快的原因 增删慢的原因 数组的两种遍历方式以及区别 ...
随机推荐
- 《InsideUE4》UObject(三)类型系统设定和结构
垃圾分类,从我做起! 引言 上篇我们谈到了为何设计一个Object系统要从类型系统开始做起,并探讨了C#的实现,以及C++中各种方案的对比,最后得到的结论是UE采用UHT的方式搜集并生成反射所需代码. ...
- Spring mvc 中有关 Shiro 1.2.3 配置问题
Spring 版本:3.2.x, 4.0.x [问题说明] 首先介绍下配置出错情况: (1)项目中,Spring3 and Spring4 的 applicationContext.xml aop ...
- Java中的继承与组合
本文主要说明Java中继承与组合的概念,以及它们之间的联系与区别.首先文章会给出一小段代码示例,用于展示到底什么是继承.然后演示如何通过“组合”来改进这种继承的设计机制.最后总结这两者的应用场景,即到 ...
- [转]python集合set
Python中集合set是基本数据类型的一种,它有可变集合(set)和不可变集合(frozenset)两种.创建集合set.集合set添加.集合删除.交集.并集.差集的操作都是非常实用的方法. 来源网 ...
- css行级块级区别总结摘录
一.块级元素:block element 每个块级元素默认占一行高度,一行内添加一个块级元素后无法一般无法添加其他元素(float浮动后除外).两个块级元素连续编辑时,会在页面自动换行显示.块级元素一 ...
- JS动态加载 js css
1.动态加载js function loadScript( url ){ var script = document.createElement( "script" ); scri ...
- 字符串处理——strpos()函数
strpos() 函数返回字符串在另一个字符串中第一次出现的位置. 大小写敏感 如果没有找到该字符串,则返回 false. strpos(string,find,start) string 必需:规 ...
- js获取ip方法
<script type="text/javascript" src="http://counter.sina.com.cn/ip/" charset=& ...
- Maven插件开发
Maven为我们提供了丰富的插件资源,使得开发调试过程中非常方便,可以满足大多数场景下的需求.当然有时候,我们也需要根据需求定制自己的插件.下面是在开发Maven插件时的一点备忘录,具体的开发流程请G ...
- CentOS 基础安装
1. 下载了 CentOS 的最小安装版本 与 VMware,基础安装流程参考百度经验:http://jingyan.baidu.com/article/eae0782787b4c01fec54853 ...