HDFS的命令行操作
1、namenode –format:格式化DFS 文件系统
2、secondaryNameNode: 运行DFS的 SecondaryNameNode 进程
hadoop secondarynamenode
[-checkpoint [force]]
//当 EditLog超过规定大小( 默认64MB)时,启动检查 secondarynamenode的checkpoint 过程;如果启用 force选项,则强制执行checkpoint过程。
[-geteditsize] //在终端上显示EditLog 文件的大小
3、namenode:运行 DFS的namenode 进程
hadoop namenode
[-format] //格式化namenode
[-update] //在Hadoop 升级后,应该使用这个命令启动 namenode
[-rollback] //使用namenode 回滚前一个版本
[-finalize] //删除文件系统的前一个状态,这会导致系统不能回滚到前一个状态
[-importCheckpoint] //复制和备份checkpoint 的状态到当前 checkpoint
4、 datanode:运行 DFS的datanode 进程。你可以使用如下命令将 Hadoop回滚到前一个版本。它的用法如下:
hadoop datanode [-rollback]
5、 dfsadmin:运行 DFS的管理客户端。在dfsadmin命令中可以执行一些类似 Windows中高级用户才能执行的命令,比如升级和回滚等。
hadoop dfsadmin [GENERIC_OPTIONS]
[-report] //在终端上显示文件系统的基本信息
[-safemote enter | leave | get | wait ] //Hadoop 的安全模式及相关维护;在安全模式中系统是只读的,数据块也不可以删除或复制
[-refreshNodes][-finalizeUpgrade] //重新读取hosts 和exclude文件,将新的被允许加入到集群中的datanode连入,同时断开与那些从集群出去的 datanode的连接
[-upgradeProgress status | details | force] //获得当前系统的升级状态和细节,或者强迫进行升级过程
[-metasave filename] //将namenode 的主要数据结构保存到指定目录下
[-setQuota <quota><dirname>…<dirname>] // 为每个目录设定配额
[-clrQuota <dirname>…<dirname>] // 清除这些目录的配额
[-setSpaceQuota <quota><dirname>…<dirname>] // 为每个目录设置配额空间
[-clrSpaceQuota <dirname>…<dirname>] // 清除这些目录的配额空间
[-help [cmd]] //显示命令的帮助信息
6、mradmin:运行 MapReduce的管理客户端
7、fsck:运行 HDFS的检测进程。fsck 在HDFS中被用来检查系统中的不一致情况,比如某文件只有目录,但数据块已经丢失或副本数目不足。与 Linux不同,这个命令只用于检测,不能进行修复。
hadoop fsck [GENERIC_OPTIONS] <path> [-move | -delete | -openforwrite ] [-files [-blocks [-locations | -racks ]]]
//<path> 检查的起始目录
//-move 移动受损文件到 /lost+found
//-delete 删除受损文件
//-openforwrite 在终端上显示为写打开的文件
//-files 在终端上显示正被检查的文件
//-blocks 在终端上显示块信息
//-location 在终端上显示每个块的位置
//-rack 显示 datanode的网络拓扑结构图
8、balancer:运行一个文件系统平衡进程。很多原因都会造成数据在集群内分布不均衡,一般来说,当集群中添加新的 datanode时,可以使用这个命令来进行负载均衡。其用法如下:
hadoop balancer
9、jobtracker:运行一个 jobtracker进程
10、pipes:运行一个 Pipes任务
11、tasktracker:运行一个 tasktracker进程
12、job:管理运行中的 MapReduce任务
13、queue:获得运行中的 MapReduce队列的信息
14、version:打印版本号
15、jar<jar>:运行一个 jar文件
16、daemonlog:读取 /设置守护进程的日志记录级别
17、distcp: distcp命令用于DistCp( 即Dist分布式, C盘拷贝) 分布式拷贝。用于在集群内部及集群之间拷贝数据。
18、archives: archives命令是Hadoop 定义的档案格式。 archives对应一个文件系统,它的扩展名是 .har,包含元数据和数据文件。
19、fs: fs可以说是HDFS 最常用的命令,这是一个高度类似 Linux文件系统的命令集。你可以使用这些命令查看HDFS上的目录结构文件、上传和下载文件、创建文件夹、复制文件等。
hadoop fs [genericOptions]
[-ls <path>] //显示目标路径中当前目录下的所有文件
[-lsr <path>] //递归显示目标路径下的所有目录及文件 (深度优先)
[-du <path>] //以字节为单位显示目录中所有文件的大小,或该文件的大小 (如果目标为文件)
[-dus <path>] //以字节为单位显示目标文件大小 (用于查看文件夹大小)
[-count[-q] <path>] //将目录的大小、包含文件 (包括文件) 个数的信息输出到屏幕 (标准stdout)
[-mv <src> <dst>] //把文件或目录移动到目标路径,这个命令允许同时移动多个文件,但是只允许移动到一个目标路径中,参数中的最后一个文件夹即为目标路径
[-cp <src> <dst>] //复制文件或目录到目标路径,这个命令允许同时复制多个文件,如果复制多个文件,目标路径必须是文件夹
[-rm [-skipTrash] <path>] //删除文件,这个命令不能删除文件夹
[-rmr [-skipTrash] <path>] //删除文件夹及其下的所有文件
[-expunge]
[-put <localsrc> ... <dst>] //从本地文件系统上传文件到 HDFS中
[-copyFromLocal <localsrc> ... <dst>] //与put 相同,在 0.18版中,只允许上传一个文件,但是在 0.20中,这两个命令已经完全一样了
[-moveFromLocal <localsrc> ... <dst>] //与put 相同,但是文件上传之后会从本地文件系统中移除
[-get [-ignoreCrc] [-crc] <src> <localdst>] //复制文件到本地文件系统。这个命令可以选择是否忽视校验和,忽视校验和下载主要用于挽救那些已经发生错误的文件
[-getmerge <src> <localdst> [addnl]] //对源目录中的所有文件进行排序并写入目标文件中,文件之间以换行符分隔
[-cat <src>] //在终端显示( 标准输出 stdout)文件中的内容,类似Linux系统中的 cat
[-text <src>]
[-copyToLocal [-ignoreCrc] [-crc] <src> <localdst>] //与get 相同
[-moveToLocal [-crc] <src> <localdst>] //这个命令在0.20 版本中没有完成
[-mkdir <path>] //创建文件夹
[-setrep [-R] [-w] <rep> <path/file>] //改变一个文件的副本个数。参数 -R可以递归地对该目录下的所有文件执行统一操作
[-touchz <path>] //类似Linux 中的touch,创建一个空文件
[-test -[ezd] <path>] //将源文件输出为文本格式并显示到终端上,通过这个命令可以查看TextRecordInputStream(SequenceFile等) 或zip文件
[-stat [format] <path>] //以指定格式返回路径的信息
[-tail [-f] <file>] //在终端上显示( 标注输出 stdout)文件的最后1kb 内容。-f选项的行为与 Linux中一致,会持续检测新添加到文件中的内容,这在查看日志文件时会显得非常方便
[-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...] //改变文件的权限,只有文件的所有者或是超级用户才能使用这个命令。 -R可以递归地改变文件夹内所有文件的权限
[-chown [-R] [OWNER][:[GROUP]] PATH...] //改变文件的拥有者,-R可以递归地改变文件夹内所有文件的拥有者。同样,这个命令只有超级用户才能使用
[-chgrp [-R] GROUP PATH...] //改变文件所属的组,-R可以递归地改变文件夹内所有文件所属的组,这个命令只有超级用户才能使用
[-help [cmd]] //这是命令的帮助信息
HDFS的命令行操作的更多相关文章
- HDFS分布式文件系统的常用命令行操作
一.HDFS的客户端种类 1.网页形式 =>用于测试 网址为你的namenode节点的ip+50070的端口号,如: 192.168.50.128:50070 2.命令行形式 =>用于测 ...
- HDFS shell命令行常见操作
hadoop学习及实践笔记—— HDFS shell命令行常见操作 附:HDFS shell guide文档地址 http://hadoop.apache.org/docs/r2.5.2/hadoop ...
- Hadoop系列006-HDFS概念及命令行操作
本人微信公众号,欢迎扫码关注! HDFS概念及命令行操作 一.HDFS概念 1.1 概念 HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件:其次,它是分布式的,由很多服务器联合起来实现其 ...
- kafka工作流程| 命令行操作
1. 概述 数据层:结构化数据+非结构化数据+日志信息(大部分为结构化) 传输层:flume(采集日志--->存储性框架(如HDFS.kafka.Hive.Hbase))+sqoop(关系型数 ...
- 命令行操作svn和git和git
前几天在写代码的时候电脑突然坏掉,老大交代的任务没完成,非常痛恨自己用svn或者git保存代码,相信很多程序员遇到过,硬盘坏掉,存在硬盘中的代码丢失,无法找回的问题,svn和git可谓程序员界的福音, ...
- mysql 命令行操作入门(详细讲解版)
之前分享过多次Mysql主题,今天继续分享mysql命令行入门 1. 那么多mysql客户端工具,为何要分享命令行操作? -快捷.简单.方便 -在没有客户端的情况下怎么办 -如果是mysql未开启 ...
- windows下使用TortoiseGit代替Git命令行操作
windows下使用TortoiseGit代替Git命令行操作 大家在使用svn的时候,都非常喜欢使用小乌龟,也就是TortoiseSVN:那么git也有小乌龟版本,即TortoiseGit. 1.安 ...
- linux快速入门 1.1命令行操作
http://lovesoo.org/linux-command-line-operation.html 1.1命令行操作 目录: <wp_nokeywordlink>Shell简介 &l ...
- MongoDB命令行操作
本文专门介绍MongoDB的命令行操作.其实,这些操作在MongoDB官网提供的Quick Reference上都有,但是英文的,为了方便,这里将其稍微整理下,方便查阅. 这里用来做测试的是远端(10 ...
随机推荐
- xamarin android——数据绑定到控件(四)
本文为通过自定义列表适配器定义ListView,以上文为基础,基于ListActivity. 定义列表项布局,包含一个图片显示,标题和描述 <LinearLayout xmlns:android ...
- 《Spring3.0就这么简单》
第一章 认识Spring 1.Spring提供的IOC容器,是Spring大杀器之一.容器将对象之间的依赖关系交给Spring进行控制,采用配制的方式对依赖关系进行描述,由Ioc容器负责依赖类之间的创 ...
- String inputStream file转化
String --> InputStreamByteArrayInputStream stream = new ByteArrayInputStream(str.getBytes()); Inp ...
- 纯CSS3代码实现简单的图片轮播
以4张图片为例:1.基本布局:将4张图片左浮动横向并排放入一个div容器内,图片设置统一尺寸,div宽度设置4个图片的总尺寸,然后放入相框容器div,相框设置1个图片的大小并设置溢出隐藏,以保证正确显 ...
- MySql 服务端与客户端下载地址
mysql官网的注册,要上传户口,才能下载. 在网上搜了个下载地址. mysql-5.6.8-rc http://mysql.stu.edu.tw/Downloads/MySQL-5.6/mysql- ...
- 实例讲解如何在Delphi中动态创建dxBarManager内容
一.dxBarManager中一些非常重要的概念: TCategorys:为了方便对dxBarManager中的项目进行归类而设计的一个属性,当然,只使用默认的名字为Default的Category也 ...
- Catalyst揭秘 Day2 Catalyst源码初探
Catalyst揭秘 Day2 Catalyst源码初探 这节课从源码角度来讲catalyst. 首先有一个观点要澄清,就是技术不是越底层就越是性能和效率更高.因为除了指令执行性能以外,更重要的是架构 ...
- ASP.NET MVC 开发中遇到的两个小问题
最近在做一个网站,用asp.net MVC4.0来开发,今天遇到了两个小问题,通过查找相关渠道解决了,在这里把这两个问题写出来,问题非常简单,不喜勿喷,mark之希望可以给遇到相同问题的初学者一点帮助 ...
- 域名转化到IP地址的实现
在linux中,有一些函数可以实现主机名和地址的转化,最常见的有gethostbyname().gethostbyaddr()等,它们都可以实现IPv4和IPv6的地址和主机名之间的转化.其中geth ...
- (转)PHP中的 抽象类(abstract class)和 接口(interface)
转自:http://blog.csdn.net/sunlylorn/article/details/6124319 一. 抽象类abstract class 1 .抽象类是指在 class 前加了 a ...