HDFS命令行操作

HDFS命令行操作

(以下是hadoop 1.x 版本的命令使用)

装好hadoop之前首先要进行一个格式化

hadoop namenode -format

运行之后,可以将文件夹都列出来

hadoop fs -ls /

例如打印user目录

hadoop fs -ls /user

如何将本地文件提交到hadoop的inpput目录下去

hadoop fs -put xxx /input

(注意当前所在的位置pwd)

如何将文件从hadoop上input文件目录下的xxx文件下载下来

hadoop fs -get input/xxx xxx

查看占用多少空间,使用多少命令

hadoop dfsadmin -report

(以下是hadoop 2.x 版本的HDFS命令行操作,大家可以对比一下不同)

  1. 同时上传多个文件到HDFS里面
hdfs dfs -appendToFile <localsrc> ... <dst>
  1. 查看文件内容
hdfs dfs -cat URI [URI ...]
  1. 修改文件所属组
hdfs dfs -chgrp [-R] GROUP URI [URI ...]
  1. 修改文件权限
hdfs dfs -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI ...]
  1. 修改文件所有者,文件所属组,其他用户的读、写、执行权限
hdfs dfs -chown [-R] [OWNER][:[GROUP]] URI [URI ]
  1. 复制文件到hdfs
hdfs dfs -copyFromLocal <localsrc> URI
  1. 复制文件到本地
hdfs dfs -copyToLocal [-ignorecrc] [-crc] URI <localdst>
  1. 统计文件及文件夹数目
hdfs dfs -count [-q] <paths>
  1. Hadoop HDFS 文件系统间的文件复制
 hdfs dfs -cp [-f] URI [URI ...] <dest>
  1. 统计目录下的文件及大小
 hdfs dfs -du [-s] [-h] URI [URI ...]
  1. 汇总目录下的文件总大小
hdfs dfs -dus <args>
  1. 清空回收站,文件被删除时,它首先会移到临时目录.Trash/中,当超过延迟时间之后,文件才会被永久删除
 hdfs dfs -expunge
  1. 下载文件到本地
hdfs dfs -get [-ignorecrc] [-crc] <src> <localdst>
  1. 查看ACL (访问权限组拥有者)
hdfs dfs -getfacl [-R] <path>
  1. 合并下载文件到本地
 hdfs dfs -getmerge <src> <localdst> [addnl]
  1. 查看目录
hdfs dfs -ls <args>
  1. 循环列出目录、子目录及文件信息
hdfs dfs -lsr <args>
  1. 创建空白文件夹
hdfs dfs -mkdir [-p] <paths>
  1. 剪切文件到hdfs
dfs -moveFromLocal <localsrc> <dst>
  1. 剪切文件到本地
hdfs dfs -moveToLocal [-crc] <src> <dst>
  1. 剪切hdfs文件
hdfs dfs -mv URI [URI ...] <dest>
  1. 上传文件
hdfs dfs -put <localsrc> ... <dst>
  1. 删除文件/空白文件夹
hdfs dfs -rm [-skipTrash] URI [URI ...]
  1. 递归删除 删除文件及文件夹下的所有文件
hdfs dfs -rmr [-skipTrash] URI [URI ...]
hdfs dfs -setfacl [-R] [-b|-k -m|-x <acl_spec> <path>]|[--set <acl_spec> <path>]

Sets Access Control Lists (ACLs) of files and directories.

Options:

-b: Remove all but the base ACL entries. The entries for user, group and others are retained for compatibility with permission bits.

-k: Remove the default ACL.

-R: Apply operations to all files and directories recursively.

-m: Modify ACL. New entries are added to the ACL, and existing entries are retained.

-x: Remove specified ACL entries. Other ACL entries are retained.

–set: Fully replace the ACL, discarding all existing entries. The acl_spec must include entries for user, group, and others for compatibility with permission bits.

acl_spec: Comma separated list of ACL entries.

path: File or directory to modify.

Examples:

hdfs dfs -setfacl -m user:hadoop:rw- /file
hdfs dfs -setfacl -x user:hadoop /file
hdfs dfs -setfacl -b /file
hdfs dfs -setfacl -k /dir
hdfs dfs -setfacl --set user::rw-,user:hadoop:rw-,group::r--,other::r-- /file
hdfs dfs -setfacl -R -m user:hadoop:r-x /dir
hdfs dfs -setfacl -m default:user:hadoop:r-x /dir

Exit Code:

Returns 0 on success and non-zero on error.

  1. 修改副本数
hdfs dfs -setrep [-R] [-w] <numReplicas> <path>
  1. 显示文件统计信息
hdfs dfs -stat URI [URI ...]
  1. 查看文件尾部信息
hdfs dfs -tail [-f] URI
hdfs dfs -test -[ezd] URI

对PATH进行如下类型的检查:

-e PATH是否存在,如果PATH存在,返回0,否则返回1

-z 文件是否为空,如果长度为0,返回0,否则返回1

-d 是否为目录,如果PATH为目录,返回0,否则返回1

  1. 查看文件内容
hdfs dfs -text <src>
  1. 创建长度为0的空文件
hdfs dfs -touchz URI [URI ...]

总而言之,hadoop使用命令跟linux的命令是很相似的。

hadoop笔记之hdfs shell操作的更多相关文章

  1. HDFS shell操作及HDFS Java API编程

    HDFS shell操作及HDFS Java API编程 1.熟悉Hadoop文件结构. 2.进行HDFS shell操作. 3.掌握通过Hadoop Java API对HDFS操作. 4.了解Had ...

  2. HBase学习笔记——配置及Shell操作

    1.HBase的配置 还是以前配置的集群,见:http://www.cnblogs.com/DarrenChan/p/6493373.html 我们约定:weekend03和weekend04放HMa ...

  3. hadoop学习二:hadoop基本架构与shell操作

    1.hadoop1.0与hadoop2.0的区别:

  4. hadoop笔记之hdfs

    1.HDFS设计基础与目标 1.HDFS设计基础与目标 (1)硬件错误是常态,因此需要冗余. (2)流式数据访问.即数据批量读取而非随机读写,Hadoop擅长做的是数据分析而不是事务处理. (3)大规 ...

  5. 大数据Hadoop——HDFS Shell操作

    一.查询目录下的文件 1.查询根目录下的文件 Hadoop fs -ls / 2.查询文件夹下的文件 Hadoop fs -ls /input 二.创建文件夹 hadoop fs -mkdir /文件 ...

  6. 对Hadoop分布式文件系统HDFS的操作实践

    原文地址:https://dblab.xmu.edu.cn/blog/290-2/ Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)是Hadoop核 ...

  7. Hadoop读书笔记(二)HDFS的shell操作

    Hadoop读书笔记(一)Hadoop介绍:http://blog.csdn.net/caicongyang/article/details/39898629 1.shell操作 1.1全部的HDFS ...

  8. 吴裕雄--天生自然HADOOP操作实验学习笔记:hdfs简单的shell命令

    实验目的 了解bin/hadoop脚本的原理 学会使用fs shell脚本进行基本操作 学习使用hadoop shell进行简单的统计计算 实验原理 1.hadoop的shell脚本 当hadoop集 ...

  9. HDFS的基本shell操作,hadoop fs操作命令

    (1)分布式文件系统 随着数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管 ...

随机推荐

  1. LinQ学习手册

    LinQ : Language Integrated Query(语言集成查询); 1.以统一方式操作各种数据源,减少数据访问的复杂性. 优点在于封装了SQL语句,只对对象进行操作(增删改查),代码量 ...

  2. VS2015 企业版不支持 JavaScript 语法高亮、智能提醒

    2015年7月,微软终于放出了 Visual Studio 2015 正式版,博主安装了 Visual Studio 2015 企业版之后,居然不支持 JavaScript 的语法高亮.智能提醒功能, ...

  3. appium自动化测试

    appium官网:http://appium.io/index.html?lang=zh Requirements Your environment needs to be setup for the ...

  4. hbase importtsv

    hadoop jar hbase-server-0.98.1-cdh5.1.3.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY,cf:imsi,cf:i ...

  5. centos yum 完全卸载依赖

    centos yum 完全卸载依赖    you install a package with yum install, say pdftk, it will pull in a lot of dep ...

  6. C++ vector 实现二维数组时, 在类的头文件中定义时遇到"应输入类型符"的问题?

    见下,当我在类的声明文件中定义二维vector时,提示我应输入类型说明符; 但是相同的格式定义,在类中将二维vector修改为在源文件中定义就可以顺利通过,并顺利执行打印 打印结果如下: 望大神来解惑 ...

  7. PHP中简单的图形处理

    PHP中简单的图形处理 计应134凌豪 1.加载GD库 GD库是一个开放的动态创建图像.源代码公开的函数库,可以从官方网站http://www.boutell.com/gd处下载.目前,GD库支持GI ...

  8. jupyter巨好玩-使用jupyter结合VScode写博客

    打开jupyter-ipython 其实人家就叫jupyter了,后面咱可能就少提ipython了. # 打开命令行,让我们输入 jupyter notebook 当然,这个前提是你已经安装了jupy ...

  9. Asp.net Mvc 中的模型绑定

    asp.net mvc中的模型绑定可以在提交http请求的时候,进行数据的映射. 1.没有模型绑定的时候 public ActionResult Example0() { ) { string id ...

  10. 算法分析-堆排序 HeapSort 优先级队列

    堆排序的是集合了插入排序的单数组操作,又有归并排序的时间复杂度,完美的结合了2者的优点. 堆的定义 n个元素的序列{k1,k2,…,kn}当且仅当满足下列关系之一时,称之为堆. 情形1:ki < ...