hdfs基本操作

-涂涂- 2024-10-22 21:39:30 原文

hdfs基本操作

1、查询命令

　　hadoop dfs -ls / 查询/目录下的所有文件和文件夹

　　hadoop dfs -ls -R 以递归的方式查询/目录下的所有文件

2、创建文件夹

　　hadoop dfs -mkdir /test 创建test文件夹

3、创建新的空文件

　　hadoop dfs -touchz /aa.txt 在/目录下创建一个空文件aa.txt

4、增加文件

　　hadoop dfs -put aa.txt /test 将当前目录下的aa.txt文件复制到/test目录下（把-put换成-copyFromLocal效果一样-moveFromLocal会移除本地文件）

5、查看文件内容

　　hadoop dfs -cat /test/aa.txt 查看/test目录下文件aa.txt的内容（将-cat 换成-text效果一样）

6、复制文件

　　hadoop dfs -copyToLocal /test/aa.txt . 将/test/aa.txt文件复制到当前目录（.是指当前目录，也可指定其他的目录）

7、删除文件或文件夹

　　hadoop dfs -rm -r /test/aa.txt 删除/test/aa.txt文件（/test/aa.txt可以替换成文件夹就是删除文件夹）

8、重命名文件

　　hadoop dfs -mv /aa.txt /bb.txt 将/aa.txt文件重命名为/bb.txt

9、将源目录中的所有文件排序合并到一个本地文件

　　hadoop dfs -getmerge / local-file 将/目录下的所有文件合并到本地文件local-file中

hdfsWeb查看文件

1、通过命令行：

　　hadoop dfs -ls /mydir/testdir

2、通过web界面

　　1）、概述：

　　　　在本地的浏览器输入namenode节点服务器的ip或域名+端口（例如：我namenode几点机器ip是10.9.1.101:9870），就可以看到hdfs集群的概述：

　　2）、查看文件：

　　　　点击导航栏的Utilities按钮，选择查看文件或者日志，选择查看文件之后，然后再输入栏输入文件的路径就可以查看文件了。

　　3）、查看数据节点信息：

　　　　点击导航栏的Datanodes按钮，然后出现以下页面：

　　　　此时假如点击查看具体的数据节点的时候会报错，因为你windows操作系统不能识别node101~node103，此时需要配置下widows的hosts文件，配置完了就好了。

　　　　hdfs的web操作就说这么多了，剩下的大家有兴趣可以去慢慢的看了

注：hadoop 为用户名如果你的名字不是这个就相应的修改下（如：hadoop dfs -cat /test/aa.txt ----> myname dfs -cat /test/aa.txt ）。

hdfs基本操作的更多相关文章

hdfs基本操作-python接口
安装hdfs包 pip install hdfs 查看hdfs目录 [root@hadoop hadoop]# hdfs dfs -ls -R / drwxr-xr-x - root supergro ...
HDFS基本操作的API
一.从hdfs下载文件到windows本地: package com.css.hdfs01; import java.io.IOException; import java.net.URI; impo ...
Hadoop（二）Hdfs基本操作
HDFS HDFS由大量服务器组成存储集群,将数据进行分片与副本,实现高容错. 而分片最小的单位就是块.默认块的大小是64M. HDFS Cli操作官网https://hadoop.apache.o ...
hdfs shell的基本操作以及hdfsWeb查看文件
在安装好hadoop集群并成功的启动了hdfs之后,我们就可以利用hdfs对文件进行操作了,一下是对文件的一些基本操作 hdfs基本操作 1.查询命令 hadoop dfs -ls / 查询/目录 ...
HDFS基本原理及数据存取实战
---------------------------------------------------------------------------------------------------- ...
HDFS详解
HDFS详解大纲 Hadoop HDFS 分布式文件系统DFS简介 HDFS的系统组成介绍 HDFS的组成部分详解副本存放策略及路由规则命令行接口 Java接口客户端与HDFS的数据流讲解目标 ...
HDFS基础1
一.HDFS入门二.HDFS基本操作 1.shell命令行客户端 Hadoop提供了文件系统的shell命令行客户端,使用方法如下: Hadoop fs <args>(参数哪一个文件系统 ...
HDFS的介绍
设计思想分而治之:将大文件.大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析: 在大数据系统中作用:为各类分布式运算框架(如:mapreduce,spark,te ...
Hadoop之HDFS（一）HDFS入门及基本Shell命令操作
1 ． HDFS 基本概念 1.1 HDFS 介绍 HDFS 是 Hadoop Distribute File System 的简称,意为:Hadoop 分布式文件系统.是 Hadoop 核心组件之 ...

随机推荐

$Django 路由层(有,无名分组、反向解析、总路由分发、名称空间、伪静态)
1 简单配置 -第一个参数是正则表达式(如果要精准匹配:'^publish/$') -第二个参数是视图函数(不要加括号) -url(r'^admin/', admin.site.urls), 注: ...
windows server 2008开启共享文件设置
之前设置过共享文件,将共享文件映射成磁盘,重新去设置另外服务器的时候,又到网络上找,特此记录设置网络共享需要开启的服务如下: 以下服务都相关,需要全部开启后才能保证共享正常:1,UPnP Devic ...
Mysql 递归获取多重数组数据
多重数据 $data ,获取顶级下的所有下级id $data array:3 [▼ 0 => array:7 [▼ "id" => 1 "created_at ...
如何将代码通过vs2017加载到GitHub
(1)登陆GitHub并注册账户,在用户中新建repository (2)建立后,会给出新建repository地址,将其复制 (3)用VS新建一个项目,勾选“新建Git存储库”或者打开一个已经创 ...
经典JS闭包面试题（来理解闭包）（转）
转载地址:http://www.cnblogs.com/xxcanghai/p/4991870.html 先看代码: function fun(n,o) { console.log(o) return ...
System.TypeInitializationException: The type initializer for 'Oracle.DataAccess.Client.OracleConnection' threw an exception. ---> Oracle.DataAccess.Client.OracleException: 提供程序与此版本的 Oracle 客户机不兼容”
.net应用程序通过Oracle.DataAccess.dll访问64位的Oracle服务器,在连接时出现以下异常:“System.TypeInitializationException: The t ...
Confluence 6 数据库表-系统信息（System information）
这些表格有存储数据相关的状态和 Confluence 站点的相关配置信息. confversion 被用来在升级系统的时候确定那个数据库的版本应该使用,这个表格只对数据库升级有影响. pluginda ...
vue install后出现的问题
出现这个问题你要先把node-sass移除后重新安装执行下面命令 npm remove node-sass --save-dev 然后安装 npm install node-sass@latest ...
plugin-barcodescanner 报错
https://github.com/phonegap/phonegap-plugin-barcodescanner/issues/418 ionic cordova platform rm andr ...
BrupSuite渗透测试笔记（十）
一.Brup Repeater通常结合Proxy(历史记录),Scanner(扫描记录).Target(站点地图)等,通过其他工具上的右键执行[Send to Repeater],之后跳转到Repea ...