HDFS基础1
一、HDFS入门

二、HDFS基本操作
1、shell命令行客户端
Hadoop提供了文件系统的shell命令行客户端,使用方法如下:
Hadoop fs <args>(参数哪一个文件系统和什么样的操作)
文件系统shell包括与Hadoop分布式文件系统(HDFS)以及Hadoop支持的其他文件系统(如本地FS, HFTP FS, S3 FS等)直接交互的各种类似shell的命令。所有FS shell命令都将路径URI作为参数
URI格式为scheme://suthority/path。
对于HDFS来说:scheme是hdfs;
对于本地FS来说:scheme是file
scheme和authority是可选的,如果未指定,则使用配置中指定的默认方案
对于HDFS,命令示例如下:
Hadoop fs -ls hdfs://namenode:host/parent/child
Hadoop fs -ls /parent/child fs.defaultFS中有配置
对于本地文件系统命令示例如下
Hadoop fs -ls file:///root
如果使用的文件系统是HDFS,则使用hdfs dfs也是可以的,此时
Hadoop fs <args> = hdfs dfs <args>
三、shell常用命令
1、-ls
功能:
显示文件、目录信息
使用:
hadoop fs -ls [-h](human给大小加上了单位) <args>
示例:
hadoop fs -ls /hello
hadoop fs -ls -h /hello

2、-mkdir
功能:
在hdfs上创建目录,-p表示会创建路径中的各级父目录。
使用:
hadoop fs -mkdir [-p] <paths>
示例:
hadoop fs -mkdir -p /hello/hello1/hello2

3、-put
功能:
将单个文件或多个文件从本地文件系统复制(上传)到目标文件系统
使用:
hadoop fs -put [-f] [-p] 本地文件目录 目标文件目录
-p:表示保留访问和修改时间,所有权和权限
-f:覆盖目的地(如果已经存在)
示例:
hadoop fs -put /root/install.log.syslog /

4、-get
功能:
将文件复制(下载)到本地文件系统
使用:
hadoop fs -get [ignorecrc] [-crc] [-p] [-f] 文件系统目录 本地文件保 存目录
-ignorecrc:跳过对下载文件的CRC检查
-crc:为下载的文件写CRC效验和
示例:
hadoop fs -get /install.log.syslog ./(当前目录)

5、-appendToFile
功能:
追加一个文件到已经存在的文件末尾
使用:
hadoop fs -appendToFile 本地文件目录 目标文件目录
示例:
hadoop fs -appendToFile 2.txt /1.txt
6、-cat
功能:
显示文件内容
使用:
hadoop fs -cat 文件目录
示例:
hadoop fs -cat /1.txt

7、-tail
功能:
查看文件的最后一千字内容
使用:
hadoop fs -tail [-f] 目录
示例:
hadoop fs -tail /hadoop/hadoopfile
8、-getmerge
功能:
合并下在多个文件
示例:
比如hdfs目录 /aaa下多个文件:log.1, log.12, log.3
Hadoop fs -getmerge /aaa/log.* ./log.sum
9、-setrep
功能:改变一个文件的副本系数。-R 选项用于递归改变目录下所有文件的副本系数
示例:hadoop fs -setrep -w 3(副本个数) [-R(一个文件不用写)] /user/hadoop/dir1
HDFS基础1的更多相关文章
- Hadoop学习笔记—2.不怕故障的海量存储:HDFS基础入门
一.HDFS出现的背景 随着社会的进步,需要处理数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是却不方便管理和维护—>因此,迫切需要一种系统来管理多 ...
- 每天收获一点点------Hadoop之HDFS基础入门
一.HDFS出现的背景 随着社会的进步,需要处理数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是却不方便管理和维护—>因此,迫切需要一种系统来管理多 ...
- HDFS基础配置
HADOOP-3.1.0-----HDFS基础配置 执行步骤:(1)配置集群(2)启动.测试集群增.删.查(3)执行wordcount案例 一.配置集群 1.在 hadoop-env.sh配置文件添加 ...
- HDFS基础
1. HDFS Shell基础 [root@master hadoop]# hadoop fsUsage: hadoop fs [generic options] [-appendToFile < ...
- Hadoop学习之路(六)HDFS基础
HDFS前言 HDFS:Hadoop Distributed File System ,Hadoop分布式文件系统,主要用来解决海量数据的存储问题 设计思想 1.分散均匀存储 dfs.blocksiz ...
- Hadoop系列-HDFS基础
基本原理 HDFS(Hadoop Distributed File System)是Hadoop的一个基础的分布式文件系统,这个分布式的概念主要体现在两个地方: 数据分块存储在多台主机 数据块采取冗余 ...
- Hadoop学习之路(二)HDFS基础
1.HDFS前言 HDFS:Hadoop Distributed File System,Hadoop分布式文件系统,主要用来解决海量数据的存储问题. 设计思想 分散均匀存储 dfs.blocksiz ...
- HDFS基础和java api操作
1. 概括 适合一次写入多次查询情况,不支持并发写情况 通过hadoop shell 上传的文件存放在DataNode的block中,通过linux shell只能看见block,看不见文件(HDFS ...
- hadoop - hdfs 基础操作
hdfs --help # 所有参数 hdfs dfs -help # 运行文件系统命令在Hadoop文件系统 hdfs dfs -ls /logs # 查看 hdfs dfs -ls /user/ ...
随机推荐
- [转]pycharm 2016.2注册码
在网上找了好多都不行,最后还是这个好使.在网上搜索了半天挨个试过来最终找到了License server的方法,由此分享给大家.这个也完全没有使用时间的限制~ 直接打开pycharm,选License ...
- STRANS一:简单的XML转换
心情不好,泥总把表妹微信给冰冰了,心塞... 1.简单的单层结构: <?sap.transform simple?> <tt:transform xmlns:tt="htt ...
- python--多线程多进程
一.进程 对于操作系统来说,一个任务就是一个进程(Process),比如打开一个浏览器就是启动一个浏览器进程,打开一个记事本就启动了一个记事本进程,打开两个记事本就启动了两个记事本进程.进程是很多资源 ...
- C#生成.tlb文件初认识
刚接手同事的代码,生成文件时,发现生成了一个对应的dll文件(应用程序中输出类型为类库),和一个对应的.tlb文件,但是报如下的错误: 那么.tlb文件是如何生成的呢? 选择项目->右键属性-& ...
- mysql <=> null 问题
SELECT * FROM cms_user WHERE age=NULL; Empty set (0.03 sec) 查询表中记录age值为null mysql> SELECT * FROM ...
- python数据结构与算法之问题求解
懂得计算机的童鞋应该都知道,一条计算机程序由数据结构跟算法两大部分组成.所以,其实不管你使用哪种计算机语言编写程序,最终这两部分才是一个程序设计的核心.所以,一个不懂得数据结构与算法的程序员不是一个好 ...
- lr12脚本参数化
1.注册.登录.获取商品列表lr脚本 Action() { lr_save_string("192.168.46.129:8080","IP"); ...
- Oracle中查看SQL语句的索引命中情况及CPU占用
第一种: 在PL/SQL中,在Explain plan Window中执行要优化的Sql语句.结果,如下图: Object name列中显示了命中的索引名,Cost列显示了CPU的使用率(%). 第二 ...
- day42-python消息队列一
消息队列”是在消息的传输过程中保存消息的容器.消息队列最经典的用法就是消费者和生成者之间通过消息管道来传递消息,消费者和生成者是不通的进程.生产者往管道中写消息,消费者从管道中读消息.操作系统提供了很 ...
- Applet
Applet简介: 可以翻译为小应用程序,Java Applet就是用Java语言编写的这样的一些小应用程序,它们可以直接嵌入到网页中,并能够产生特殊的效果.包含Applet的网页被称为Java-po ...