HDFS常用操作命令如下:

  • 查询目录
# 查看/目录下的目录和文件
hadoop fs -ls /
# 递归查看/目录下的目录和文件
hadoop fs -lsr /
  • 创建目录
# 新增目录/user/test,hdfs支持同时创建多级目录(如果父目录user不存在,会创建user和test两级目录)
hadoop fs -mkdir /user/test
  • 上传、下载文件
# 将1.txt文件上传到hdfs的/user/test目录下
hadoop fs -put 1.txt /user/test
# 将1.txt文件上传到hdfs的/user/test目录下,重新命名为2.txt
hadoop fs -put 1.txt /user/test/2.txt
# 将hdfs的/user/test/1.txt文件下载到本机当前目录下
hadoop fs -get /user/test/1.txt ./
# 将hdfs的/user/test/1.txt文件下载到本机当前目录下,并重新命名为2.txt
hadoop fs -get /user/test/1.txt ./2.txt
  • 删除
# 注意删除命令使用要慎重!!!
# 删除文件1.txt
hadoop fs -rm /user/test/1.txt
# 删除目录/user/test
hadoop fs -rm /user/test
  • 移动
# 将1.txt文件移动到/user/tmp目录下
hadoop fs -mv /user/test/1.txt /user/tmp
  • 复制
# cp命令适用于小规模数据拷贝,大规模数据,建议使用distcp命令
hadoop fs -cp /user/test/1.txt /user/tmp 将文件1.txt拷贝到/user/tmp目录下。
  • 大规模数据拷贝
hadoop distcp [-参数1,-参数2,...] 源目录 目标目录
常用参数主要有:
-skipcrccheck:忽略crc校验。数据拷贝时,默认会对拷贝前后的数据做crc校验。对于跨集群拷贝来说,不同集群间的文件块大小是不一样的,因此及时数据正确拷贝,其crc比对结果可能仍然有误。因此,对于使用distcp命令的用户,若数据为跨集群拷贝,那么请加此参数。
-i:忽略拷贝failed异常。该参数往往用在数据量比较大的(如几周)拷贝。拷贝过程中,往往会由于网络不稳定,不可避免的导致极少数节点数据拷贝出错。-i参数,可以忽略节点拷贝异常,从而不至于使得job无法进行。
-其它参数:distcp还有诸多其它参数,如带宽限制,副本设置等等。
  • 统计文件容量
#统计/user/test目录下每一子目录及文件的占用空间容量
hadoop fs -du -h /user/test
# 统计/user/test目录的占用空间容量
hadoop fs -du -s -h /user/test
  • 统计文件数
# 统计/user/test目录的信息,返回结果依次为:文件夹总数量,文件总数量,占用空间容量,目录
hadoop fs -count /user/test
# 统计/user/test目录的信息,返回结果自动单位换算
hadoop fs -count -h /user/test
  • 查看文件内容
# 查看文件内容-cat/-text
hadoop fs -cat /user/test/1.txt
hadoop fs -text /user/test/1.txt
  • 创建空文件
# 创建一个1.txt空文件
hadoop fs -touchz /user/test/1.txt
  • 配额查询
# 查询/user/test帐号的配额,返回结果依次为:节点数总配额,剩余节点数,空间总配额,剩余空间,已用目录数量,已用文件数量,已用空间容量
hadoop fs -count -q /user/test
  • 权限配置
# 设置1.txt的权限为777
hadoop -chmod 777 /user/test/1.txt
  • 用户设置
# 递归设置/user/test目录的用户和组用户为yuhaohao。
hadoop -chown -R yuhaohao:yuhaohao /user/test

HDFS常用命令操作的更多相关文章

  1. [转]hadoop hdfs常用命令

    FROM : http://www.2cto.com/database/201303/198460.html hadoop hdfs常用命令   hadoop常用命令:  hadoop fs  查看H ...

  2. Jedis对Redis的常用命令操作

    本篇主要总结一些Jedis对Redis的常用命令操作: 1.对key操作命令 2.对String操作命令 3.对List操作命令 4.对Set操作命令 5.对Hash操作命令 6.排序操作指令 一.项 ...

  3. Docker系列之常用命令操作手册

    目录 1.安装虚拟机 2.安装Docker 3.Docker镜像操作 4.Docker容器操作 Docker系列之常用命令操作手册 继上一篇博客Docker系列之原理简单介绍之后,本博客对常用的Doc ...

  4. K8s常用命令操作

    K8s常用命令操作 一.kubectl命令补全 1.master安装命令补全,并临时生效 yum install -y bash-completion source /usr/share/bash-c ...

  5. hadoop学习(三)HDFS常用命令以及java操作HDFS

    一.HDFS的常用命令 1.查看根目录下的信息:./hadoop dfs -ls 2.查看根目录下的in目录中的内容:./hadoop dfs -ls in或者./hadoop dfs -ls ./i ...

  6. HDFS常用命令

    HDFS 常用的文件操作命令 hdfs dfs -text /pub/20151019/1/4/gwmvod/mediags.moretv.com.cn/*.bz2 | wc -l  hdfs dfs ...

  7. [b0014] HDFS 常用JAVA 操作实战

    目的: 学习用java进行的常用hdfs操作 参考: [b0002] Hadoop HDFS cmd常用命令练手 环境: hadoop2.6.4 win7 下的eclipse环境调试已经配置好,参考前 ...

  8. HBase数据库增删改查常用命令操作

    最近测试用到了Hbase数据库,新建一个学生表,对表进行增删改查操作,把常用命令贴出来分享给大家~ 官方API:https://hbase.apache.org/book.html#quickstar ...

  9. hadoop学习笔记(四):hdfs常用命令

    一.hadoop fs 1.创建目录 [root@master hadoop-]# hadoop fs -mkdir /testdir1 [root@master hadoop-]# hadoop f ...

  10. selenium常用命令--操作页面元素及获取元素内容整理

    selenium常用命令之操作页面元素及获取元素内容的事件整理 例子:  /**id <input type="text" id="phone" name ...

随机推荐

  1. 当你在浏览器中输入 google.com 后按下回车发生了什么?

    按下"g"键 接下来的内容介绍了物理键盘和系统中断的工作原理,但是有一部分内容却没有涉及.当你按下"g"键,浏览器接收到这个消息之后,会触发自动完成机制.浏览器 ...

  2. 基于pandas的数据清洗 -- 缺失值(空值)的清洗

    博客地址:https://www.cnblogs.com/zylyehuo/ 开发环境 anaconda 集成环境:集成好了数据分析和机器学习中所需要的全部环境 安装目录不可以有中文和特殊符号 jup ...

  3. 使用df命令

    1.使用df命令,查看整体的磁盘使用情况 df命令是用来查看硬盘的挂载点,以及对应的硬盘容量信息.包括硬盘的总大小,已经使用的大小,剩余大小.以及使用的空间占有的百分比等. 最常用的命令格式就是: 1 ...

  4. WebGL 的简易入门教程

    目录 前言 第一节 绘制出了一个点 效果演示 逐行解释 向量类型 第二节 动态传递点数据 变量修饰符 完整代码 第三节 缓冲区和画线 类型化数组 绘制的方式 完整代码 第四节 彩色线段 精度修饰符 完 ...

  5. 【Linux】5.6 Shell打印输出指令

    Shell打印输出命令 1. echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似,都是用于字符串的输出.命令格式:echo string 您可以使用echo实现更复杂的输出 ...

  6. RAG, GraphRAG, LightRAG, and KAG

    KAG: A Better Alternative to RAG for Domain-Specific Knowledge Applications https://medium.com/@ahme ...

  7. 《数组》--DAY2--快慢指针法

    1.什么是双指针? 双指针,指的是在遍历对象的过程中,不是普通的使用单个指针进行访问,而是使用两个相同方向(快慢指针)或者相反方向(对撞指针)的指针进行扫描,从而达到相应的目的. 2.快慢指针 2.1 ...

  8. 基于MCP实现text2sql

    目的:基于MCP实现text2sql能力 参考:https://blog.csdn.net/hacker_Lees/article/details/146426392 服务器 选用开源的MySQL M ...

  9. JAVA基础之多线程四期--线程状态

    一.线程的状态 二.线程生命周期分析图 三. 阻塞状态:具有cpu执行权,更待cpu空闲 休眠状态:不具有cpu执行权,cpu空闲时,也不能使用执行权

  10. Java 中有哪些垃圾回收算法?

    Java 中的垃圾回收算法 Java 中的垃圾回收(Garbage Collection,GC)机制通过多种算法实现对堆内存的管理.以下是常见的垃圾回收算法: 1. 标记-清除算法(Mark-Swee ...