hadoop之文件管理基本操作

# 格式化hdfs

hadoop namenode -format

# 查看hadoop下的文件夹

hadoop fs -ls

# 创建hdfs文件夹

hadoop fs -mkdir /user/input

# 将本地文件file.txt 复制到新建文件夹,file->hdfs

hadoop fs -put /user/wangbin/input/ip_data.txt wangbin

# 从hadoop复制到hadoop

# 从wangbin复制到wangbin

hadoop fs -put ip_list.txt /user/hadoop

# 从本地复制到hdfs

hadoop fs -copyFromLocal ip_data.txt /user/hadoop

# 从hdfs复制到本地

hadoop fs -copyToLocal sample.txt sample.txt

# 查看文件内容

hadoop fs -cat /user/output/outfile

# 查看顺序文件的内容

hadoop fs -text input/numbers.seq |head

# 从hdfs获取文件到本地,hdfs->file

hadoop fs -get /user/output/ /home/hadoop_tp/

# 更改所有人

hadoop fs -chown -R wangbin:wangbin /user/wangbin

# 删除含有文件的文件夹

hadoop fs -rmr output

# 并行复制文件或文件夹，以MapReduce作业实现，-overwrite 覆盖目标文件，-update 仅更新发生变化的部分

hadoop distcp ip_data.txt ip_datav2.txt

# 打包project为jar包，上传文件

export HADOOP_CLASSPATH=mapReduceDemoV1.jar

# 将hdfs上output目录下的多个文件合并成一个文件output-merge，并存储到本地，hdfs->file

hadoop fs -getmerge output output-merge

# 确定input存在，且output不存在，执行jar包

hadoop MaxTemperature sample.txt output
# 将本地文件追加到hdfs，file->hdfs
hadoop fs -appendToFile 1.txt 2.txt hdfs://cdh5/tmp/lxw1234.txt
# 将hdfs文件追加到hdfs
hadoop fs -cat hdfs://cdh5/tmp/lxw1234/*.txt | hadoop fs -appendToFile - hdfs://cdh5/tmp/hdfs_largefile.txt

#查看hadoop所有命令

hadoop fs

#显示该目录中每个文件或目录的大小

hadoop fs -du /tmp/logs/shtermuser/-.txt

#类似于du，PATH为目录时，会显示该目录的总大小

hadoop fs –dus PATH

#循环列出目录、子目录及文件信息

hadoop fs –lsr

#从HDFS文件系统删除test.txt文件，rm命令也可以删除空目录

hadoop fs –rm /user/sunlightcs/test.txt

#修改HDFS系统中/user/sunlightcs目录所属群组，选项-R递归执行，跟linux命令一样

hadoop fs –chgrp [-R] /user/sunlightcs

#修改HDFS系统中/user/sunlightcs目录拥有者，选项-R递归执行

hadoop fs –chown [-R] /user/sunlightcs

#修改HDFS系统中/user/sunlightcs目录权限，MODE可以为相应权限的3位数或+/-{rwx}，选项-R递归执行

hadoop fs –chmod [-R] MODE /user/sunlightcs

#清空回收站，文件被删除时，它首先会移到临时目录.Trash/中，当超过延迟时间之后，文件才会被永久删除

hadoop fs –expunge 

对PATH进行如下类型的检查：

-e PATH是否存在，如果PATH存在，返回0，否则返回1

-z 文件是否为空，如果长度为0，返回0，否则返回1

-d 是否为目录，如果PATH为目录，返回0，否则返回1

hadoop fs –test –[ezd] PATH

echo $?获取返回值

#显示文件的内容，当文件为文本文件时，等同于cat，文件为压缩格式（gzip以及hadoop的二进制序列文件格式）时，会先解压缩

hadoop fs –text PATH 

查看某个[ls]命令的帮助文档

hadoop fs –help ls

#移动文件，源目录可以有多个，目标只能是一个

hadoop fs -mv src dst

#统计hdfs对应路径下的目录个数，文件个数，文件总计大小

hadoop fs -count <hdfs path>

#创建一个0字节的空文件

hadoop fs -touchz pathname

#计算目录、文件个数和字节数

#hadoop fs -count path

#将单个src或多个srcs从本地文件系统附加到目标文件系统。还从stdin读取输入并附加到目标文件系统。

hadoop fs -appendToFile localfile /user/hadoop/hadoopfile

hadoop fs -appendToFile localfile1 localfile2 /user/hadoop/hadoopfile

hadoop fs -appendToFile localfile hdfs://nn.example.com/hadoop/hadoopfile

#返回文件的校验信息

hadoop fs -checksum URI

#显示目录可用空间

hadoop fs -df path

#查找与指定表达式匹配的所有文件，并将选定的操作应用于它们。如果未指定路径，则默认为当前工作目录。

hadoop fs -find / -name test -print

＃显示文件和目录的访问控制列表（ACL）。如果目录具有默认ACL，则getfacl还会显示默认ACL。
hadoop fs -getfacl [-R] <path>
＃显示文件或目录的扩展属性名称和值（如果有）。
hadoop fs -getfattr [-R] -n name | -d [-e en] <path>

＃以指定格式打印<path>中文件/目录的统计信息。
hadoop fs -stat [格式] <路径> ...

＃将所有与指定文件模式匹配的文件截断为指定的长度。
hadoop fs -truncate [-w] <length> <paths>

hadoop之文件管理基本操作的更多相关文章

Hadoop文件的基本操作
Hadoop提供了大量的API对文件系统中的文件进行操作,主要包括: (1)读取文件 (2)写文件 (3)读取文件属性 (4)列出文件 (5)删除文件 1､读取文件以下示例中,将hdfs中的一个文件 ...
Hadoop文件的基本操作分类： A1_HADOOP 2014-12-05 11:36 392人阅读评论(0) 收藏
Hadoop提供了大量的API对文件系统中的文件进行操作,主要包括: (1)读取文件 (2)写文件 (3)读取文件属性 (4)列出文件 (5)删除文件 1､读取文件以下示例中,将hdfs中的一个文件 ...
hadoop之hbase基本操作
hbase shell 进入hbase命令行 list 显示HBASE表 status 系统上运行的服务器的细节和系统的状态 version 返回HBase系统使用的版本 table_help 引导如 ...
hadoop之hive基本操作
-- 清空表中的数据,保留表结构 truncate table tmp_userid; '); -- 搜索库或表支持正则表达式 show tables 'sa*'; show tables in ba ...
hadoop 之常用基本操作
HDFS 常用命令(hadoop fs.hadoop dfs.hdfs dfs): hadoop fs -ls 显示当前目录结构,-ls -R 递归显示目录结构 hadoop fs -mkdir 创建 ...
C#中文件管理的运用（Twelfth Day）
又到了总结的时间了,今天在云和学院学习了文件管理的一些运用及复习昨天学的里氏转换.今天我就总结下昨天遗留下的问题以及今天所学的知识. 昨天遗留的问题里氏转换(父类转子类) 例:在这里定义父类Peop ...
php文件基本操作与文件管理功能
文件的基本操作先来看一下PHP文件基础操作,请看强大注释 <body> <?php var_dump(filetype("./img/11.png")); // ...
【转帖】Hadoop — HDFS的概念、原理及基本操作
Hadoop — HDFS的概念.原理及基本操作 https://www.cnblogs.com/swordfall/p/8709025.html 分类: Hadoop undefined 1. HD ...
[转] Hadoop入门系列（一）Window环境下搭建hadoop和hdfs的基本操作
转自:https://blog.csdn.net/qq_32938169/article/details/80209083 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载 ...

随机推荐

C# 静态构造函数，静态变量执行顺序（升华版）
上篇是基本语法基础下的执行顺序,包括继承这个维度下的执行顺序,我们可以依照的规律顺下来,下面我们看下一些摸不到头脑的情况我们实验一个类中的方法去调用另一个非继承类的情况, 我们主要看下 ...
自己动手编写一个VS插件（五）
作者:朱金灿来源:http://blog.csdn.net/clever101 继续编写VisualStudio插件.这次我编写的插件叫DevAssist(意思是开发助手).在看了前面的文章之后你知 ...
Leetcode 238 Product of Array Except Self 递推
给出一个数组 nums[i](i = 0,1,...,n-1) 输出数组output[i]满足 output[i] = nums[0] * num[1] * num[2] *..*num[i-1] ...
"Redis客户端连接数一直降不下来"的有关问题解决 good
[线上问题] "Redis客户端连接数一直降不下来"的问题解决前段时间,上线了新的 Redis缓存(Cache)服务,准备替换掉 Memcached. 为什么要将 Memcach ...
spring boot mybatis XML文件读取properties配置信息
配置文件application.properties中相关配置信息可以在部署以后修改,引用配置信息可以在代码和mybatis的映射文件中 1.JAVA代码可以通过变量去读取 application. ...
crawler_正则表达式零宽断言
在使用正则表达式时,有时我们需要捕获的内容前后必须是特定内容,但又不捕获这些特定内容的时候,零宽断言就起到作用了. (?=exp):零宽度正预测先行断言,它断言自身出现的位置的后面能匹配表达式exp. ...
uboot通过使用U磁盘引导内核RT5350成功
今天,在下次尝试使用16G 的u菜.这让两个分区,A位于zimage.一家商店rootfs:在uboot加载分区zimage并成功推出! RT5350 # fatload usb 0:1 0x80c0 ...
boost库交叉编译（Linux生成ARM的库）
1. 环境: Linux系统:Ubuntu 14.04 编译工具:arm-fsl-linux-gnueabi-gcc 2.下载boost源码: 地址:https://sourceforge.net/p ...
Java之nio性能比较
结果:used time:53574684used time:1800077620used time:12563690可见MappedByteBuffer读写数据是最快的, 其次是FileChanne ...
abp项目从sql server迁移至mysql
官方资料:https://aspnetboilerplate.com/Pages/Documents/EF-MySql-Integration 实验发现,还差了两步整理一下,步骤如下: 1.引用My ...

hadoop之文件管理基本操作

hadoop之文件管理基本操作的更多相关文章

随机推荐

热门专题