1, hdfs中两种连接方式

1), 网页

2), 客户端

文件的切块大小和存储的副本数量,都是由客户端决定!
所谓的由客户端决定,是通过配置参数来定的
hdfs的客户端会读以下两个参数,来决定切块大小、副本数量:
切块大小的参数: dfs.blocksize
副本数量的参数: dfs.replication
<property>
<name>dfs.blocksize</name>
<value>64m</value>
</property> <property>
<name>dfs.replication</name>
<value></value>
</property>

切块后的文件会在hdfs的目录中存在, 通过cat命令将replace拼接后, 文件恢复原始文件

即, hdfs只对文件进行啦按大小的简单切割

2, 常用的命令操作

1, 查看目录

hadoop fs -ls -R /目录      # -R 递归显示
hadoop fs -mkdir -p /hdfs目录。 -p 支持多级创建

2, 上传文件

Hadoop fs -put /本地目录。/hdfs 目录
hadoop fs -copyFromLocal /本地目录 /hdfs目录
hadoop fs -moveFormLocal /本地目录 /hdfs目录    会从本地目录中移除

3, 下载文件

hadoop fs -get /hdfs目录 /本地目录
hadoop fs -copyToLocal /hdfs目录 /本地目录
hadoop fs -moveToLocal /hdfs目录 /本地目录    会从hdfs中删除原文件

4, 移动hdfs中的文件, 改名

hadoop fs -mv /hdfs目录 /hdfs目录
hadoop fs -cp /hdfs文件1 /hdfs文件2 /hdfs目录
可复制一个, 也可复制多个, 当复制多个的时候, 目的地必须是目录

5, 删除文件或文件夹

Hadoop fs -rm -r /hdfs目录

6, 修改文件权限

hadoop fs -chgrp [-R] wenbronk /hdfs目录
hadoop fs -chown wenbronk:wenbronk /hdfs目录
hadoop fs -chmod /hdfs目录

7, 追加内容到已有的文件

hadoop fs -appenToFile /本地文件  /hdfs目录

hadoop fs -appendToFile ./zookeeper.out hdfs://node1:8020/data/test/yarn-site.xml

8, 显示文件内容

hadoop fs -cat /hdfs文件
hadoop fs -tail /hdfs 文件
hadoop fs -text /hdfs文件  # 以文本格式输出
hadoop fs -touchz /hdfs文件  # 创建一个空文件, 文件长度为0

9, 显示文件校验码

hadoop fs -checksum /data/test/zookeeper.out

10, 对文件进行统计大小, 配额, 等

hadoop fs -count -h hdfs://node1:8020/data/test/zookeeper.out

11, 统计目录大小, 文件大小等

hadoop fs -du -h /hdfs目录    # 统计目录大小
hadoop fs -df -h /hdfs 目录    # 查看剩余空间大小

剩余, 遇到在慢慢补充...

hdfs-03-hdfs客户端操作的更多相关文章

  1. HDFS的Java客户端操作代码(HDFS的查看、创建)

    1.HDFS的put上传文件操作的java代码: package Hdfs; import java.io.FileInputStream; import java.io.FileNotFoundEx ...

  2. HDFS的java客户端操作代码(Windows上面打jar包,提交至linux运行)

    1.通过java.net.URL实现屏幕显示demo1文件的内容 package Hdfs; import java.io.InputStream; import java.net.URL; impo ...

  3. HDFS的Java客户端操作代码(HDFS删除文件或目录)

    1.HDFS删除文件或目录 package Hdfs; import java.io.IOException; import java.net.URI; import org.apache.hadoo ...

  4. HDFS的Java客户端操作代码(查看HDFS下所有的文件存储位置信息)

    1.查看HDFS下所有的文件存储位置信息 package Hdfs; import java.net.URI; import org.apache.hadoop.conf.Configuration; ...

  5. HDFS的Java客户端操作代码(查看HDFS下所有的文件或目录)

    1.查看HDFS下所有的文件或目录 package Hdfs; import java.io.IOException; import java.net.URI; import org.apache.h ...

  6. HDFS的Java客户端操作代码(查看HDFS下的文件是否存在)

    1.查看HDFS目录下得文件是否存在 package Hdfs; import java.io.IOException; import java.net.URI; import org.apache. ...

  7. 03 HDFS的客户端操作

    服务器和客户端的概念 hdfs的客户端有多种形式 1.网页形式 2.命令行形式 3.客户端在哪里运行,没有约束,只要运行客户端的机器能够跟hdfs集群联网 参数配置 文件的切块大小和存储的副本数量,都 ...

  8. Hadoop HDFS的shell(命令行客户端)操作实例

    HDFS的shell(命令行客户端)操作实例 3.2 常用命令参数介绍 -help 功能:输出这个命令参数手册 -ls                  功能:显示目录信息 示例: hadoop fs ...

  9. Hadoop JAVA HDFS客户端操作

    JAVA HDFS客户端操作 通过API操作HDFS org.apache.logging.log4jlog4j-core2.8.2org.apache.hadoophadoop-common${ha ...

  10. 大数据学习——hdfs客户端操作

    package cn.itcast.hdfs; import org.apache.commons.io.IOUtils; import org.apache.hadoop.conf.Configur ...

随机推荐

  1. CentOS7中firewall防火墙详解和配置,.xml服务配置详解

    修改防火墙配置文件之前,需要对之前防火墙做好备份 重启防火墙后,需要确认防火墙状态和防火墙规则是否加载,若重启失败或规则加载失败,则所有请求都会被防火墙 1. firewall-cmd --state ...

  2. PAT 甲级 1002 A+B for Polynomials (25 分)

    1002 A+B for Polynomials (25 分) This time, you are supposed to find A+B where A and B are two polyno ...

  3. Java第五次实验

    Java第五次实验--网络编程与安全 任务一: 一.实验要求: 两人一组结对编程: 参考http://www.cnblogs.com/rocedu/p/6766748.html#SECDSA 结对实现 ...

  4. 【Selenium】【BugList4】执行pip报错:Fatal error in launcher: Unable to create process using '""D:\Program Files\Python36\python.exe"" "D:\Program Files\Python36\Scripts\pip.exe" '

    环境信息: python版本:V3.6.4 安装路径:D:\Program Files\python36 环境变量PATH:D:\Program Files\Python36;D:\Program F ...

  5. 连续子数组和的最大值plus

    package wodeshiyao; import java.io.BufferedWriter; import java.io.File; import java.io.FileInputStre ...

  6. ubuntu无法打开software-center

    ubuntu无法打开software-center BUG: 在ubuntu14.04LTS版本下,点击软件中心图标,过了一会软件未能启动,没有动静.用命令行启动报如下错误: perrin@Littl ...

  7. Unity3D之物理射线

    射线:从一个点往一个方向,发射一根无限长的射线,这根射线会与场景中带有 Collider 组件的物体发生碰撞. 射线的使用: public class Test { private void Star ...

  8. noip第23课资料

  9. 用 Docker 构建、运行、发布来一个 Spring Boot 应用

    本文演示了如何用 Docker 构建.运行.发布来一个 Spring Boot 应用. Docker 简介 Docker 是一个 Linux 容器管理工具包,具备“社交”方面,允许用户发布容器的 im ...

  10. faster-RCNN台标检测

    最近学习了faster-RCNN算法,收获不少,记此文为证.faster-RCNN是一个目标检测算法,它能够识别多个目标,对目标分类并标注位置,非常好用.它的输入样本是标注好的图片,输出是一个hdf5 ...