一、HDFS入门

二、HDFS基本操作

1、shell命令行客户端

Hadoop提供了文件系统的shell命令行客户端,使用方法如下:

Hadoop fs <args>(参数哪一个文件系统和什么样的操作)

文件系统shell包括与Hadoop分布式文件系统(HDFS)以及Hadoop支持的其他文件系统(如本地FS,  HFTP FS, S3 FS等)直接交互的各种类似shell的命令。所有FS shell命令都将路径URI作为参数

URI格式为scheme://suthority/path。

对于HDFS来说:scheme是hdfs;

对于本地FS来说:scheme是file

scheme和authority是可选的,如果未指定,则使用配置中指定的默认方案

对于HDFS,命令示例如下:

Hadoop fs -ls hdfs://namenode:host/parent/child

Hadoop fs -ls /parent/child    fs.defaultFS中有配置

对于本地文件系统命令示例如下

Hadoop fs -ls file:///root

如果使用的文件系统是HDFS,则使用hdfs dfs也是可以的,此时

Hadoop fs <args> = hdfs dfs <args>

三、shell常用命令

1、-ls

功能:

显示文件、目录信息

使用:

hadoop  fs  -ls  [-h](human给大小加上了单位)  <args>

示例:

hadoop  fs  -ls  /hello

hadoop  fs  -ls  -h  /hello

2、-mkdir

功能:

在hdfs上创建目录,-p表示会创建路径中的各级父目录。

使用:

hadoop fs -mkdir [-p] <paths>

示例:

hadoop fs -mkdir -p /hello/hello1/hello2

3、-put

功能:

将单个文件或多个文件从本地文件系统复制(上传)到目标文件系统

使用:

hadoop  fs  -put  [-f]  [-p] 本地文件目录 目标文件目录

-p:表示保留访问和修改时间,所有权和权限

-f:覆盖目的地(如果已经存在)

示例:

hadoop  fs  -put  /root/install.log.syslog  /

4、-get

功能:

将文件复制(下载)到本地文件系统

使用:

hadoop  fs  -get  [ignorecrc]  [-crc]  [-p]  [-f]  文件系统目录 本地文件保 存目录

-ignorecrc:跳过对下载文件的CRC检查

-crc:为下载的文件写CRC效验和

示例:

hadoop  fs -get  /install.log.syslog  ./(当前目录)

5、-appendToFile

功能:

追加一个文件到已经存在的文件末尾

使用:

hadoop  fs  -appendToFile  本地文件目录 目标文件目录

示例:

hadoop  fs  -appendToFile 2.txt  /1.txt

6、-cat

功能:

显示文件内容

使用:

hadoop  fs  -cat 文件目录

示例:

hadoop  fs  -cat  /1.txt

7、-tail

功能:

查看文件的最后一千字内容

使用:

hadoop fs -tail [-f] 目录

示例:

hadoop fs -tail /hadoop/hadoopfile

8、-getmerge

功能:

合并下在多个文件

示例:

比如hdfs目录 /aaa下多个文件:log.1, log.12, log.3

Hadoop fs -getmerge  /aaa/log.*  ./log.sum

9、-setrep

功能:改变一个文件的副本系数。-R 选项用于递归改变目录下所有文件的副本系数

示例:hadoop fs -setrep -w 3(副本个数) [-R(一个文件不用写)]  /user/hadoop/dir1

HDFS基础1的更多相关文章

  1. Hadoop学习笔记—2.不怕故障的海量存储:HDFS基础入门

    一.HDFS出现的背景 随着社会的进步,需要处理数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是却不方便管理和维护—>因此,迫切需要一种系统来管理多 ...

  2. 每天收获一点点------Hadoop之HDFS基础入门

    一.HDFS出现的背景 随着社会的进步,需要处理数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是却不方便管理和维护—>因此,迫切需要一种系统来管理多 ...

  3. HDFS基础配置

    HADOOP-3.1.0-----HDFS基础配置 执行步骤:(1)配置集群(2)启动.测试集群增.删.查(3)执行wordcount案例 一.配置集群 1.在 hadoop-env.sh配置文件添加 ...

  4. HDFS基础

    1. HDFS Shell基础 [root@master hadoop]# hadoop fsUsage: hadoop fs [generic options] [-appendToFile < ...

  5. Hadoop学习之路(六)HDFS基础

    HDFS前言 HDFS:Hadoop Distributed File System ,Hadoop分布式文件系统,主要用来解决海量数据的存储问题 设计思想 1.分散均匀存储 dfs.blocksiz ...

  6. Hadoop系列-HDFS基础

    基本原理 HDFS(Hadoop Distributed File System)是Hadoop的一个基础的分布式文件系统,这个分布式的概念主要体现在两个地方: 数据分块存储在多台主机 数据块采取冗余 ...

  7. Hadoop学习之路(二)HDFS基础

    1.HDFS前言 HDFS:Hadoop Distributed File System,Hadoop分布式文件系统,主要用来解决海量数据的存储问题. 设计思想 分散均匀存储 dfs.blocksiz ...

  8. HDFS基础和java api操作

    1. 概括 适合一次写入多次查询情况,不支持并发写情况 通过hadoop shell 上传的文件存放在DataNode的block中,通过linux shell只能看见block,看不见文件(HDFS ...

  9. hadoop - hdfs 基础操作

    hdfs --help # 所有参数 hdfs dfs -help # 运行文件系统命令在Hadoop文件系统 hdfs dfs -ls /logs # 查看 hdfs dfs -ls /user/ ...

随机推荐

  1. 2019/2/23Scala学习开始(Scala简介)

    Scala简介    Scala是一门多范式(multi-paradigm)的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性. Scala运行在Java虚拟机上,并兼容现有的Java程序 ...

  2. 2018 HDU多校第三场赛后补题

    2018 HDU多校第三场赛后补题 从易到难来写吧,其中题意有些直接摘了Claris的,数据范围是就不标了. 如果需要可以去hdu题库里找.题号是6319 - 6331. L. Visual Cube ...

  3. Safari 里的javascript 里不能用submit作为函数名

    Safari 里的javascript 里不能用submit作为函数名, 这样写的时候,怎么也运行不了JeasyUI的onSubmit的function, 改个名就可以了.而在chrome下面就没问题 ...

  4. react native练习

    import React, { Component } from 'react' import { Platform, StyleSheet, Text, View,Image ,FlatList} ...

  5. 常见排序算法JAVA实现

    1.冒泡排序,时间复杂度:最好:T(n) = O(n) ,情况:T(n) = O(n2) ,平均:T(n) = O(n2) public int[] bubbleSort(int[] nums) { ...

  6. 网络传输数据序列化工具Protostuff

    一直在物色比较好用的网络传输数据序列化工具,看了诸如marshalling,protobuff等,但是均有一个共同特点,使用起来异常繁杂,有没有比较好用同时性能又不会太差的组件呢?答案当然是有的,那就 ...

  7. zabbix3.4.7实操总结一

    一.zabbix_server的配置说明 #需要修改的内容为如下:[root@localhost ~]# cd /usr/local/zabbix/etc/[root@localhost etc]# ...

  8. 记一次腾讯云不能连接DNS服务器的问题排查过程

    由于腾讯云在使用过程中需要用到yum,在yum安装软件的时候报错不能连接到源的网站.当时经过排查发现域名没有解析.有可能是DNS服务器问题或者我的腾讯云DNS配置出现问题. 所以我查看了/etc/re ...

  9. 【基于微信小程序的社区电商平台】需求分析心得——小豆芽

    一.项目内容 基于微信小程序,做一个社区电商平台,抓住社区电商的特点,做出特色,与微信集成,实现商品的个性化发布,以及个性化营销. 个性化发布:用户可以在应用上直接发布自己的商品,通过搜索心愿单可以查 ...

  10. 记录linux配置

    只写成功过程:1.配置sshd: 首先开启安全组端口,选择合适端口(tcp),shell输入vi /etc/services ->ssh修改(21变更为合适端口) 接着shell输入vi /et ...