Java实现对HDFS文件系统的基本操作

1.准备好jar包

2.创建一个类

1. 测试连接

    @Test   //测试是否连接成功

public void test() {

	//添加配置 ==> core-site.xml

	Configuration conf = new Configuration();

	//配置默认地址端口

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		//加载配置

		FileSystem fs = FileSystem.get(conf);

		//获取目标状态   注意：要用绝对路径，且路径都要用Path包起来

		FileStatus fst = fs.getFileStatus(new Path("/hello"));

		System.out.println(fst.isDirectory());  //是否是文件夹

		System.out.println(fst.isFile());  // 是否是文件

		System.out.println(fst.getLen());  // 获取长度

		System.out.println(fst.getPath()); // 获取路径

                    fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

2. 在文件系统下创建文件夹

    @Test   //hdfs文件系统中创建文件夹

public void mkdirsFile() {

	//添加配置 ==> core-site.xml

	Configuration conf = new Configuration();

	//配置默认地址端口

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		//加载配置

		FileSystem fs = FileSystem.get(conf);

		//创建文件夹   注意：要用绝对路径，且路径都要用Path包起来

		boolean mkdirs = fs.mkdirs(new Path("/other/test/jdk"));

		System.out.print(mkdirs);

                    fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

测试时，发现出错了，用户Administator在hadoop上执行写操作时被权限系统拒绝，百度（https://blog.csdn.net/xiaoshunzi111/article/details/52062640）发现，解决有三个办法：

1、在hdfs的配置文件中，将dfs.permissions修改为False

2、执行这样的操作 hadoop fs -chmod 777 /user/hadoop

3、在系统的环境变量里面添加HADOOP_USER_NAME=root（HDFS上的有权限的用户，具体看自己的情况），插入代码实现 System.setProperty("HADOOP_USER_NAME", "root");

前两个不太安全，我选用第三个，重启就可以。

3.递归查看文件夹

    @Test   //hdfs文件系统中遍历文件夹

public void ls() {

	Configuration conf = new Configuration();

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		FileSystem fs = FileSystem.get(conf);

		FileStatus[] fls = fs.listStatus(new Path("/"));

		for(FileStatus fst:fls) {

			judge(fs,fst);

		}

		fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

public void judge(FileSystem fs,FileStatus fst) {

	String name = fst.getPath().toString().split("hdfs://192.168.1.105:9000/")[1];

	if(fst.isDirectory()) {

		System.out.println("d: "+name);

		try {

			FileStatus[] fls = fs.listStatus(new Path("/"+name));

			for(FileStatus fst2:fls) {

				judge(fs,fst2);

			}

		} catch (IllegalArgumentException e) {

			e.printStackTrace();

		} catch (IOException e) {

			e.printStackTrace();

		}

	}else {

		System.out.println("f: "+name);

	}

}

4.上传

    @Test   //上传文件到hdfs文件系统    通过io流

public void rz() {

            System.setProperty("HADOOP_USER_NAME", "root");

	Configuration conf = new Configuration();

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		FileSystem fs = FileSystem.get(conf);

		//输出流

		FSDataOutputStream create = fs.create(new Path("/other/hadoop-2.7.7.tar.gz"));

		//输入流

		FileInputStream fis = new FileInputStream(new File("F:\\Linux\\hadoop-2.7.7.tar.gz"));

		int len = 0;

		//定义一个byte类型的数组,数组的大小表示每次从文件中读取出来的数据量

                    byte[] b = new  byte[1024];

                    //循环读取数据，如果fis.read没有读到就数据返回-1

                    while((len = fis.read(b))!=-1) {

        	            //输入到输出

                        create.write(b, 0, len);

                    }

                    fis.close();

                    create.close();

		fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

@Test   //上传文件到hdfs文件系统    通过核心类FileSystem提供的方法

public void rz1() {

            System.setProperty("HADOOP_USER_NAME", "root");

	Configuration conf = new Configuration();

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		FileSystem fs = FileSystem.get(conf);

                    //前为需要上传的文件地址，后为hdfs存放地址

		fs.copyFromLocalFile(new Path("F:\\Linux\\hadoop-2.7.7.tar.gz"), new Path("/other/hadoop-2.7.7.tar.gz"));

		fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

5.下载

    @Test   //下载到本地    通过io流

public void sz() {

	Configuration conf = new Configuration();

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		FileSystem fs = FileSystem.get(conf);

		FSDataInputStream create = fs.open(new Path("/other/hadoop-2.7.7.tar.gz"));

		FileOutputStream fis = new FileOutputStream(new File("F:\\hadoop-2.7.7.tar.gz"));

		int len = 0;

                    byte[] b = new  byte[1024];

                    while((len = create.read(b))!=-1) {

                        fis.write(b, 0, len);

                    }

                    fis.close();

                    create.close();

	        fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

@Test   //下载到本地    通过核心类FileSystem提供的方法

public void sz1() {

	Configuration conf = new Configuration();

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		FileSystem fs = FileSystem.get(conf);

                    //前为hdfs中的文件，后为存放地址

		fs.copyToLocalFile(new Path("/other/hadoop-2.7.7.tar.gz"),new Path("F:\\hadoop-2.7.7.tar.gz"));

		fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

6.重命名

    @Test   //重命名

public void rename() {

	System.setProperty("HADOOP_USER_NAME", "root");

	Configuration conf = new Configuration();

	conf.set("fs.defaultFS", "hdfs://192.168.1.105:9000");

	try {

		FileSystem fs = FileSystem.get(conf);

		//前为原名，后为修改名

		boolean rename = fs.rename(new Path("hello"), new Path("hello01"));

		System.out.println(rename);

		fs.close();

	} catch (IOException e) {

		e.printStackTrace();

	}

}

HDFS文件系统基操--Java实现的更多相关文章

hadoop学习（三）HDFS常用命令以及java操作HDFS
一.HDFS的常用命令 1.查看根目录下的信息:./hadoop dfs -ls 2.查看根目录下的in目录中的内容:./hadoop dfs -ls in或者./hadoop dfs -ls ./i ...
hadoop系列二：HDFS文件系统的命令及JAVA客户端API
转载请在页首明显处注明作者与出处一:说明此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等. 当前使用的hadoop版本为2.6 ...
使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
HDFS的java接口——简化HDFS文件系统操作
今天闲来无事,于是把HDFS的基本操作用java写出简化程序出来给大家一些小小帮助! package com.quanttech; import org.apache.hadoop.conf.Conf ...
大数据学习笔记之Hadoop（二）：HDFS文件系统
文章目录一 HDFS概念 1.1 概念 1.2 组成 1.3 HDFS 文件块大小二 HFDS命令行操作三 HDFS客户端操作 3.1 eclipse环境准备 3.1.1 jar包准备 3.2 ...
搭建maven开发环境测试Hadoop组件HDFS文件系统的一些命令
1.PC已经安装Eclipse Software,测试平台windows10及Centos6.8虚拟机 2.新建maven project 3.打开pom.xml,maven工程项目的pom文件加载以 ...
HDFS文件系统基本文件命令、编程读写HDFS
基本文件命令: 格式为:hadoop fs -cmd <args> cmd的命名通常与unix对应的命令名相同.例如,文件列表命令: hadoop fs -ls 1.添加目录和文件 HDF ...
HDFS文件系统的JAVA-API操作(一)
使用java.net.URL访问HDFS文件系统 HDFS的API使用说明: 1.如果要访问HDFS,HDFS客户端必须有一份HDFS的配置文件也就是hdfs-site.xml,从而读取Nameno ...
hdfs shell命令及java客户端编写
一. hdfs shell命令可以通过hadoop fs 查看所有的shell命令及其用法. 传文件到hdfs: hadoop fs -put /home/koushengrui/Downloads ...

随机推荐

mysql在当前服务器复制数据库
mysqldump newwq -u root -proot --add-drop-table | mysql jxg -u root -proot
Oralce获取32位随机数
SELECT SYS_GUID() from dual;
谷歌眼镜、亚马逊音箱，5G时代隐私或将面临更大颠覆
别看现在的智能手机.平板电脑.可穿戴设备.智能家居等那么火爆,但离开网络它们其实什么也不是.当然,智能终端设备的迭进也是与网络制式不断向前演变相辅相成的,二者算是互相成就.不过也由此衍生出很多问题,尤 ...
统计学方法（PCA、ICA、RCA、LCA）
---------------------------------------------------------------------------------------------------- ...
OpenCV 输入输出XML和YAML文件
#include <opencv2/core/core.hpp> #include <iostream> #include <string> using names ...
史无前例的KDD 2014大会记
2014大会记" title="史无前例的KDD 2014大会记"> 作者:蒋朦微软亚洲研究院实习生创造多项纪录的KDD 2014 ACM SIGKDD 国际会 ...
awk使用和详解
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...
cesium入门示例-3dTiles加载
数据转换工具采用cesiumlab1.5.17版本,转换后的3dTiles加载显示比较简单,通过Cesium.Cesium3DTileset接口指定url即可,3dTiles文件可与js前端代码放置一 ...
吴裕雄--天生自然 oracle学习笔记：oracle理论学习详解及各种简单操作例子
1. 数据库的发展过程层次模型 -->网状模型 -->关系模型 -->对象关系模型 2. 关于数据库的概念 DB:数据库(存储信息的仓库) DBMS:数据库管理系统(用于管理数据库 ...
AI能帮我们造出一个无肉的世界吗？
AI听起来很遥远,其实已经渗透到我们的日常工作和生活中.在不远的未来,互联网.大数据.硬件的发展和软件的优化,乃至全社会的参与,人工智能将真正从实验室走进生活,它将成为改变我们生活的一部分.我们吃的肉 ...

HDFS文件系统基操--Java实现