HDFS 常用的文件操作命令

hdfs dfs -text /pub/20151019/1/4/gwmvod/mediags.moretv.com.cn/*.bz2 | wc -l

 hdfs dfs -du -s -h /pub/20151019/1/4/gwmvod/mediags.moretv.com.cn 查看容量大小 

1.-cat 
使用方法:hadoop fs -cat URI 
说明:将路径指定的文件输出到屏幕 
示例: hadoop fs -cat hdfs://host1:port1/file 
hadoop fs -cat file:///file3

2.-copyFromLocal 
使用方法:hadoop fs -copyFromLocal <localsrc>URI 
说明: 将本地文件复制到 HDFS 中。

3.copyToLocal 
使用方法:hadoop fs -copyToLocal <localsrc>URI 
说明: 将一个文件从 HDFS 系统中复制到本地文件

4.-cp 
使用方法:hadoop fs -cp URI 
说明:将文件从源路径复制到目标路径。这个命令可以复制多个源路径,但是目标路径必须 
是一个目录 
示例: hadoop fs -cp /user/file /uesr/files 
Hadoop fs -cp /user/file1 /user/files /user/dir

5.-du 
使用方法:hadoop fs -du URI 
说明: 显示目录中所有文件大小,或者指定一个文件时,显示此文件大小 
示例: hadoop fs -du /user/dir1 
Hadoop fs -du hdfs://host:port/user/file

6.-dus 
使用方法:hadoop fs -dus <ars> 
说明: 显示目标文件大小

7.-expunge 
使用方法:hadoop fs -expunge 
说明: 用于清空回收站

8.-get 
使用方法:hadoop fs -get <locaodst> 
说明:复制文件到本地文件系统。 
示例: hadoop fs -get /user/file localfile 
Hadoop fs -get hdfs://host:port/file localfile

9.-ls 
使用方法:hadoop fs -ls <arg> 
说明:浏览本地文件,并按如下格式返回文件信息 
文件名<副本数> 文件大小 修改日期 权限 用户 ID/组 ID 
如果浏览的是一个木渎,则返回其子文件的一个列表,信息如下: 
目录名<dir> 修改日期 修改时间 权限 用户 ID/组 ID 
示例: hadoop fs -ls /user/file 
Hadoop fs -ls hdfs://host:port/user/dir

10.-lsr 
使用方法:hadoop fs -lsr 
说明: 递归第查阅文件内容

11.-mkdir 
使用方法:hadoop fs -mkdir<path> 
说明: 创建对应的文件目录,并直接创建相应的父目录 
示例: hadoop fs -mkdir /user/dir1/dir2/dir3/file 
Hadoop fs -mkdir hdfs://host:port/user/dir

12.-mv 
使用方法:hadoop fs -mv URI <dest> 
说明: 将源文件移动到目标路径,这目标路径可以有多个,不允许在不同文件系统移动。 
示例: hadoop fs -mv /user/file1 /user/file2 
Hadoop fs -mv hdfs://host:port/file1 hdfs://host:prot/file2

13.-put 
使用方法:hadoop fs -put<localsrc> <dst> 
说明: 从本地文件系统复制单个或多个源路径到目标文件系统。 
示例: hadoop fs -put localfile /user/file 
hadoop fs -put localfile hdfs://host:port/user/file

14.-rm 
使用方法: hadoop fs -rm URI 
说明:删除指定的文件,且要求非空的目录和文件。 
示例: hadoop fs -rm hdfs://host:port/file

15.-rmr 
使用方法: hadoop fs -rmr URI 
说明:递归地删除指定文件中的空目录。

16.-Setrep 
使用方法: hadoop fs -setrep [R] <path> 
说明: 改变一个副本复制份数 
示例: hadoop fs -setrep -w 3 -R /user/file

17.-Test 
使用方法:hadoop fs -test -[ezd] URI 
说明: 使用 e z d 对文件进行检查 
-e 检查文件是否存在,若存在返回值为 0; 
-z 检查文件是否为 0 字节,如果是则返回 0; 
-d 检查路径是否为目录,如果是则返回 1,否则返回 0

18.-text 
使用方法:hadoop fs -text <src> 
说明:将源文件输出为文本格式,运行的格式是 zip 以及 Text 类 
以上是 HDFS 中使用命令行对 HDFS 中文件进行操作,与一般操作命令类似,例如我们 
将某一个文件从本地的文件系统复制到 HDFS 中。可以通过执行以下命令进行操作: 
$ hadoop fs -copyFromLocal /user/localFile.txt sample.txt 
此部分代码通过调用命令 fs,指定执行脚本命令-copyFromLocal,将本地文 localFile.txt 
复制到运行在 localhost 上的 HDFS 文件系统中。

19. part-r-00000.snappy 这种文件能直接用类似 cat 的命令查看吗

hdfs dfs -text /tmp/output/part-r-00000.snappy | less

HDFS常用命令的更多相关文章

  1. [转]hadoop hdfs常用命令

    FROM : http://www.2cto.com/database/201303/198460.html hadoop hdfs常用命令   hadoop常用命令:  hadoop fs  查看H ...

  2. hadoop学习(三)HDFS常用命令以及java操作HDFS

    一.HDFS的常用命令 1.查看根目录下的信息:./hadoop dfs -ls 2.查看根目录下的in目录中的内容:./hadoop dfs -ls in或者./hadoop dfs -ls ./i ...

  3. hadoop学习笔记(四):hdfs常用命令

    一.hadoop fs 1.创建目录 [root@master hadoop-]# hadoop fs -mkdir /testdir1 [root@master hadoop-]# hadoop f ...

  4. hdfs 常用命令

    (2)bin/hdfs dfs -mkdir -p /home/雨渐渐 (3)scp /media/root/DCE28B65E28B432E/download/第2周/ChinaHadoop第二讲\ ...

  5. Hadoop HDFS常用命令

    1.查看hdfs文件目录 hadoop fs -ls / 2.上传文件 hadoop fs -put 文件路径 目标路径 在浏览器查看:namenodeIP:50070 3.下载文件 hadoop f ...

  6. HDFS 常用命令行:

    1. 查看各库的存储大小 hdfs dfs -du -h /user/hive/warehouse 2. 删除HDFS 文件 hdfs dfs -rmr 绝对路径名 例如:hdfs dfs -rmr ...

  7. HDFS shell命令行常见操作

    hadoop学习及实践笔记—— HDFS shell命令行常见操作 附:HDFS shell guide文档地址 http://hadoop.apache.org/docs/r2.5.2/hadoop ...

  8. hadoop2.5.2学习及实践笔记(五)—— HDFS shell命令行常见操作

    附:HDFS shell guide文档地址 http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/FileSy ...

  9. 【HDFS】相关概念及常用命令

    本文用于记录Hadoop中HDFS相关概念以及常用命令,以便日后查询. 概念之间无先后顺序,只是用于记录. 参考的Hadoop的版本是2.7.3 1. 角色 hadoop fs [hdfs dfs] ...

随机推荐

  1. 17+个ASP.NET MVC扩展点,含源码{转}

    1.自定义一个HttpModule,并将其中的方法添加到HttpApplication相应的事件中!即:创建一个实现了IHttpmodule接口的类,并将配置WebConfig.在自定义的HttpMo ...

  2. applicationContext.xml xxx-servlet.xml

    applicationContext.xml是随ContextLoaderListener的加载而执行的,而xxx-servlet.xml是随DispatcherServlet的加载而执行的,在web ...

  3. Java 延时常见的几种方法

    1. 用Thread就不会iu无法终止 new Thread(new Runnable() { public void run() { while (true) { test(); try { Thr ...

  4. Mac Air maven 环境配置

    mave 的配置 检出项目遇到问题: Could not calculate build plan: Failure to transfer org.apache.maven.plugins:mave ...

  5. Android调用天气预报的WebService简单例子

    下面例子改自网上例子:http://express.ruanko.com/ruanko-express_34/technologyexchange5.html 不过网上这个例子有些没有说明,有些情况不 ...

  6. 安装wps for linux无法启动

    我下载的是deb包,双击安装完之后,打开wps没有反应,重启了一下 计算机也不行. 改从命令行出现如下信息: /opt/kingsoft/wps-office/office6/wps: error w ...

  7. SSH开发实践part2:双向1-N连接配置

    1 OK,上一篇已经介绍了项目开发的前期准备工作,具体内容可以参考:http://www.cnblogs.com/souvenir/p/3783686.html 按照开发步骤,我们现在已经可以开始进行 ...

  8. (.iso)光盘镜像文件的打开与安装

    直接解压就可以打开,然后就可以安装.exe文件

  9. tcp抓包 Wireshark 使用

    fidder主要是针对http(s)协议进行抓包分析的,所以类似wireshark/tcpdump这种工作在tcp/ip层上的抓包工具不太一样,这种工具一般在chrome/firefox的开发者工具下 ...

  10. Jquery DataTables warning : Requested unknown from the data source for row 0

    昨天在做 Jquery DataTables 的时候,遇到的一个问题,我使用MVC,在tables上加入了一个actionlink的href.但是在运行起来的时候,报错: DataTables war ...