Hadoop Java API操作HDFS文件系统（Mac）

1、下载Hadoop的压缩包 tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/

2、关联jar包

　　在eclipse中新建项目中，建lib文件夹，把要用的jar包拷贝进来，jar包在解压好的 hadoop-2.9.1/share/hadoop中

　　我们这里不拷贝，选择关联你所存放在电脑上的路径

　　在项目上右键选择 Bulid Path > Add Libraries > User Library > ok > new > 命名 > ok > Add External JARs > 选择jar包

　　然后会看到项目下多了个包

3、开始写代码

package bigdata.hdfs;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.net.URI;

import java.util.Iterator;

import java.util.Map.Entry;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.BlockLocation;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.LocatedFileStatus;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.RemoteIterator;

import org.junit.Before;

import org.junit.Test;

/* 客户端操作hdfs时，需要一个用户身份，

 * 默认情况下，hdfs客户端会从jvm中获取一个参数来作为自己的用户身份：-DHADOOP_USER_NAME=hadoop,

 * 解决方法方法有两种：

 * 1、设置外部参数；

 * 2、在代码中写明，用get方法时，选择三个参数的，将用户名传进去；

 */

public class HdfsClientDemo {

	FileSystem fs = null;

	@Before

	public void init() throws Exception {

		Configuration conf = new Configuration();

		//这里要识别master的话，需要修改本机hosts文件

		conf.set("fs.defaultFS", "hdfs://master:9000");

		//拿到一个文件操作系统的客户端实例对象

		fs = FileSystem.get(new URI("hdfs://master:9000"), conf, "wang");

	}

	// 上传

	@Test

	public void testUpload() throws Exception {

		fs.copyFromLocalFile(new Path("/Users/wang/Desktop/upload.jpg"),new Path("/upload_copy.jpg"));

		fs.close();

	}

	//下载

	@Test

	public void testDownload() throws Exception {

		fs.copyToLocalFile(new Path("/upload_copy.jpg"), new Path("/Users/wang/Desktop/download.jpg"));

		fs.close();

	}

	@Test

	public void testUpload2() throws Exception {

		//以流的方式上传

		FSDataOutputStream outputStream = fs.create(new Path("/liu.txt"));

		FileInputStream inputStream = new FileInputStream("/Users/wang/Desktop/");

		org.apache.commons.io.IOUtils.copy(inputStream, outputStream);

	}

	@Test

	public void testDownload2() throws Exception {

		//以流的方式下载

		FSDataInputStream InputStream= fs.open(new Path("/a.txt"));

		//指定读取文件的指针的起始位置

		InputStream.seek(12);

		FileOutputStream OutputStream = new FileOutputStream("/Users/wang/Desktop/a.txt");

		org.apache.commons.io.IOUtils.copy(InputStream, OutputStream);

	}

	//打印参数

	@Test

	public void testConf() {

		Configuration conf = new Configuration();

		Iterator<Entry<String, String>> it = conf.iterator();

		while(it.hasNext()) {

			Entry<String, String> en = it.next();

			System.out.println(en.getKey()+':'+en.getValue());

		}

	}

	@Test

	public void testLs() throws Exception{

		//递归列出所有文件，返回一个迭代器对象

		RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);

		while (listFiles.hasNext()) {

			LocatedFileStatus fileStatus = listFiles.next();

			System.out.println("blocksize:"+fileStatus.getBlockSize());

			System.out.println("owner:"+fileStatus.getOwner());

			System.out.println("Replication:"+fileStatus.getReplication());

			System.out.println("Permission:"+fileStatus.getPermission());

			System.out.println("Name:"+fileStatus.getPath().getName());

			BlockLocation[] blockLocations = fileStatus.getBlockLocations();

			for(BlockLocation b:blockLocations) {

				System.out.println("块起始偏移量"+b.getOffset());

				System.out.println("块长度"+b.getLength());

				String[] hosts = b.getHosts();

				//块所在的datanode节点

				for(String host:hosts) {

					System.out.println("datanode:"+host);

				}

			}

			System.out.println("--------------------");

		}

	}

	@Test

	public void testLs2() throws Exception {

		//只列出一个层级

		FileStatus[] listStatus = fs.listStatus(new Path("/"));

		for(FileStatus file:listStatus) {

			System.out.print("name:"+file.getPath().getName()+",");

			System.out.println((file.isFile()?"file":"directory"));

		}

	}

}

Hadoop Java API操作HDFS文件系统（Mac）的更多相关文章

使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
使用Java Api 操作HDFS
如题我就是一个标题党就是使用JavaApi操作HDFS,使用的是MAVEN,操作的环境是Linux 首先要配置好Maven环境,我使用的是已经有的仓库,如果你下载的jar包速度慢,可以改变Ma ...
hadoop学习笔记（五）：java api 操作hdfs
HDFS的Java访问接口 1)org.apache.hadoop.fs.FileSystem 是一个通用的文件系统API,提供了不同文件系统的统一访问方式. 2)org.apache.hadoop. ...
Hadoop Java API 操作 hdfs--1
Hadoop文件系统是一个抽象的概念,hdfs仅仅是Hadoop文件系统的其中之一. 就hdfs而言,访问该文件系统有两种方式:(1)利用hdfs自带的命令行方式,此方法类似linux下面的shell ...
使用java api操作HDFS文件
实现的代码如下: import java.io.IOException; import java.net.URI; import java.net.URISyntaxException; import ...
Hadoop之HDFS（三）HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
HDFS 05 - HDFS 常用的 Java API 操作
目录 0 - 配置 Hadoop 环境(Windows系统) 1 - 导入 Maven 依赖 2 - 常用类介绍 3 - 常见 API 操作 3.1 获取文件系统(重要) 3.2 创建目录.写入文件 ...
JAVA API 实现hdfs文件操作
java api 实现hdfs 文件操作会出现错误提示: Permission denied: user=hp, access=WRITE, inode="/":hdfs:supe ...
大数据-09-Intellij idea 开发java程序操作HDFS
主要摘自 http://dblab.xmu.edu.cn/blog/290-2/ 简介本指南介绍Hadoop分布式文件系统HDFS,并详细指引读者对HDFS文件系统的操作实践.Hadoop分布式文件 ...

随机推荐

java基础(二):java内部类
内部类像寄生虫一样生存在其他类[外部类]的内部.定义在类的内部的类叫内部类,它缩小了可见性.根据内部类定义结构的不同,可以把内部类分为成员内部类和局部内部类.成员内部类定义的地方和外部类的成员变量和 ...
zabbix监测图形界面显示方框乱码解决方法
思路如下:用Windows下中文字体进行替换,修改配置文件即可详细步骤如下: 1.在Windows的控制面板里的字体中,选择一种中文字体,将该字体文件复制到桌面.例如,我选择了宋体常规字体,复制到 ...
原生JS实现选中的radio变为未选中
需求如下,radio已经选中,再点击,取消选中状态. 效果如链接:演示地址直接上代码: <!DOCTYPE html> <html> <head> <met ...
解决Tomcat的IllegalArgumentException: Control character in cookie value or attribute错误
接口中带有中文,tomcat8 17-Apr-2019 13:21:23.734 严重 [http-nio-8082-exec-2] org.apache.coyote.http11.Abstract ...
httpd2.4.6配置文件解释说明
本文httpd版本为:2.4.6 ServerRoot 先来看一下httpd.conf配置文件中的ServerRoot默认定义: # cat /etc/httpd/conf/httpd.conf |e ...
APS技术中的多目标规划问题
在进行APS(高级计划与排程)系统开发时,绝大多数情况下是需要考虑多目标的.但面对多目标问题进行规划求解时,我们往往极容易因处理方法不当,而影响输出结果,令结果与用户期望产生较大差别.事实上很多时候用 ...
猜测的rpc负载均衡原理，基于dubbo的架构
集群层(Cluster):封装多个提供者的路由及负载均衡,并桥接注册中心,以Invoker为中心,扩展接口为Cluster.Directory.Router和LoadBalance.将多个服务提供方组 ...
windows2012 IIS部署GeoTrust证书踩过的坑。视频测试可用 IIS 证书导入
证书导入方式 https://wenku.baidu.com/view/3504f29a55270722192ef78a.html https://www.cnblogs.com/jackrebel/ ...
MySQL单机单实例安装脚本（转载）
说明:使用mysql generic tar.gz包快速安装mysql 三个文件installation_of_single_mysql.sh.template_install-my.cnf.mysq ...
js obj对象转formdata格式代码
import isArray from "lodash/isArray" export function objToFormData(config) { //对象转formdata ...

Hadoop Java API操作HDFS文件系统（Mac）

Hadoop Java API操作HDFS文件系统（Mac）的更多相关文章

随机推荐

热门专题