[HDFS_4] HDFS 的 Java 应用开发

0. 说明

　　在 IDEA下进行 HDFS 的 Java 应用开发

　　通过编写代码实现对 HDFS 的增删改查操作

1. 流程

　　1.1 在项目下新建 Moudle

　　略

　　1.2 为 Moudle 添加 Maven 框架支持

　　略

　　1.3 添加 Maven 依赖

    <dependencies>

        <!-- Hadoop Client依赖 -->

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-client</artifactId>

            <version>2.7.3</version>

        </dependency>

        <!-- 单元测试依赖 -->

        <dependency>

            <groupId>junit</groupId>

            <artifactId>junit</artifactId>

            <version>4.12</version>

        </dependency>

    </dependencies>

　　1.4 将 Hadoop/etc/ha 目录下的 [core-site.xml] [hdfs-site.xml] [log4j.properties] 存入 resources 中

2. 代码编写

package hadoop.hdfs;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.*;

import org.apache.hadoop.io.IOUtils;

import org.junit.Test;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

/**

 * IDEA 下测试 HDFS 的增删改查

 */

public class TestHDFS {

    // 1. 测试读取

    @Test

    public void testRead() throws IOException {

        // 初始化配置文件

        Configuration conf = new Configuration();

        // 初始化文件系统

        FileSystem fs = FileSystem.get(conf);

        // 初始化路径

        Path p = new Path("/a.txt");

        // 通过文件系统获取输入流

        // FSDataInputStream 是 inputStream 的装饰流，可以通过普通流方式操纵 fis

        FSDataInputStream fis = fs.open(p);

        int len = 0;

        byte[] buf = new byte[1024];

        while ((len = fis.read(buf)) != -1) {

            System.out.println(new String(buf, 0, len));

        }

        fis.close();

    }

    // 2. 测试读取并通过 IOUtils 拷贝文件到本地

    @Test

    public void testRead2() throws Exception {

        // 初始化配置文件

        Configuration conf = new Configuration();

        // 初始化文件系统

        FileSystem fs = FileSystem.get(conf);

        // 初始化路径

        Path p = new Path("/a.txt");

        // 通过文件系统获取输入流

        // FSDataInputStream 是 inputStream 的装饰流，可以通过普通流方式操纵 fis

        FSDataInputStream fis = fs.open(p);

        FileOutputStream fos = new FileOutputStream("D:/1.txt");

        // 通过 IOUtils 拷贝文件

        IOUtils.copyBytes(fis, fos, 1024);

        fis.close();

        fos.close();

        System.out.println("ok");

    }

    // 3. 测试写文件,将本地文件写入到 HDFS 中

    @Test

    public void testwrite() throws IOException {

        // 设置系统用户名

        System.setProperty("HADOOP_USER_NAME", "centos");

        // 初始化配置文件

        Configuration conf = new Configuration();

        // 初始化文件系统

        FileSystem fs = FileSystem.get(conf);

        // 获得输入流

        FileInputStream fis = new FileInputStream("E:/p_data/test/customers.txt");

        // 初始化路径

        Path pout = new Path("/b.txt");

        // 通过文件系统获取输出流

        // FSDataOutputStream 是 outputStream 的装饰流，可以通过普通流方式操纵 fos

        FSDataOutputStream fos = fs.create(pout);

        // 通过 IOUtils 拷贝文件

        IOUtils.copyBytes(fis, fos, 1024);

        fis.close();

        fos.close();

        System.out.println("ok");

    }

    // 创建文件夹

    @Test

    public void testMkdir() throws IOException {

        // 设置系统用户名

        System.setProperty("HADOOP_USER_NAME", "centos");

        // 初始化配置文件

        Configuration conf = new Configuration();

        // 初始化文件系统

        FileSystem fs = FileSystem.get(conf);

        boolean b = fs.mkdirs(new Path("/aaa"));

        System.out.println(b);

    }

    // 删除文件夹

    @Test

    public void testDelete() throws IOException {

        // 设置系统用户名

        System.setProperty("HADOOP_USER_NAME", "centos");

        // 初始化配置文件

        Configuration conf = new Configuration();

        // 初始化文件系统

        FileSystem fs = FileSystem.get(conf);

        boolean b = fs.delete(new Path("/aaa"),true);

        System.out.println(b);

    }

    // 文件末尾追加文件

    @Test

    public void testAppend() throws IOException {

        // 设置系统用户名

        System.setProperty("HADOOP_USER_NAME", "centos");

        // 初始化配置文件

        Configuration conf = new Configuration();

        // 初始化文件系统

        FileSystem fs = FileSystem.get(conf);

        // 通过文件系统获取输出流

        // FSDataOutputStream 是 outputStream 的装饰流，可以通过普通流方式操纵 fos

        FSDataOutputStream fos = fs.append(new Path("/a.txt"));

        // 通过文件系统获取输入流

        // FSDataInputStream 是 inputStream 的装饰流，可以通过普通流方式操纵 fis

        FileInputStream fis = new FileInputStream("E:/p_data/add.txt");

        // 通过 IOUtils 拷贝文件

        IOUtils.copyBytes(fis,fos,1024);

        fis.close();

        fos.close();

    }

    // 通过递归列出指定文件夹下的文件或文件夹信息

    public static void testList(String path) {

        try {

            // 初始化配置文件

            Configuration conf = new Configuration();

            // 初始化文件系统

            FileSystem fs = FileSystem.get(conf);

            FileStatus[] statuses = fs.listStatus(new Path(path));

            for (FileStatus status : statuses) {

                if (status.isDirectory()) {

                    path = status.getPath().toString();

                    System.out.println(path);

                    testList(path);

                } else {

                    System.out.println(status.getPath().toString());

                }

            }

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

    public static void main(String[] args) {

        testList("/");

    }

}

[HDFS_4] HDFS 的 Java 应用开发的更多相关文章

2 weekend110的HDFS的JAVA客户端编写 + filesystem设计思想总结
HDFS的JAVA客户端编写现在,我们来玩玩,在linux系统里,玩eclipse 或者, 即,更改图标,成功这个,别慌.重新换个版本就好,有错误出错是好事. http://www.eclips ...
HDFS的Java客户端编写
总结: 之前在教材上看hdfs的Java客户端编写,只有关键代码,呵呵…….闲话不说,上正文. 1. Hadoop 的Java客户端编写建议在linux系统上开发 2. 可以使用eclipse,ide ...
spark之java程序开发
spark之java程序开发 1.Spark中的Java开发的缘由: Spark自身是使用Scala程序开发的,Scala语言是同时具备函数式编程和指令式编程的一种混血语言,而Spark源码是基于Sc ...
一次失败的尝试hdfs的java客户端编写（在linux下使用eclipse）
一次失败的尝试hdfs的java客户端编写(在linux下使用eclipse) 给centOS安装图形界面 GNOME桌面环境 https://blog.csdn.net/wh211212/artic ...
Hadoop之HDFS（三）HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
day03-hdfs的客户端操作\hdfs的java客户端编程
5.hdfs的客户端操作客户端的理解 hdfs的客户端有多种形式: 1.网页形式 2.命令行形式 3.客户端在哪里运行,没有约束,只要运行客户端的机器能够跟hdfs集群联网文件的切块大小和存储的副 ...
hadoop学习(五)----HDFS的java操作
前面我们基本学习了HDFS的原理,hadoop环境的搭建,下面开始正式的实践,语言以java为主.这一节来看一下HDFS的java操作. 1 环境准备上一篇说了windows下搭建hadoop环境, ...
Hadoop（五）：HDFS的JAVA API基本操作
HDFS的JAVA API操作 HDFS在生产应用中主要是客户端的开发,其核心步骤是从HDFS提供的api中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件. 主 ...
5款强大的Java Web开发工具
1.WebBuilder这是一款开源的可视化Web应用开发和运行平台.基于浏览器的集成开发环境,采用可视化的设计模式,支持控件的拖拽操作,能轻松完成前后台应用开发:高效.稳定和可扩展的特点,适合复杂企 ...

随机推荐

(转)Python中操作mysql的pymysql模块详解
原文:https://www.cnblogs.com/wt11/p/6141225.html https://shockerli.net/post/python3-pymysql/----Python ...
vue脚手架构
我们是用Eclipse开发的,所以用vue开始时,要进行代理,不然访问不到服务器,所以就需要配置一下 dev context 里面写的是代理的接口,就是以这些接口开头的,如果没有就往里写一下,pro ...
jquery 回车键实现表单提交
JQery http://jquery.cuishifeng.cn/keydown.html 键盘事件参考:1.keydown()keydown事件会在键盘按下时触发.2.keyup()keyup事件 ...
Consul内部分享ppt
Consul 是一个支持多数据中心,分布式,高可用的服务发现和配置共享系统.由 HashiCorp 公司使用 Go 语言开发,基于Raft协议.部署起来非常容易,只需要极少的可执行程序和配置文件,具有 ...
XOR+base64加密
1.xor运算 1^0=1 0^0=0 1^1=0 23^32=55 55^32=23 23对32进行异或两次运算结果为23 2.XOR加密设key=[]byte{1,2,3,4,5,6},src= ...
Lucene 7.2.1 自定义TokenFilter
1.自定义TokenFilter import org.apache.lucene.analysis.TokenFilter; import org.apache.lucene.analysis.To ...
进程间通信IPC-管道
管道是UNIX系统IPC的最古老的形式,所有的UNIX系统都提供此通讯机制.管道有以下两种局限性: 1, 历史上,它们是半双工的(即数据只能在一个方向上流动).现在某些系统提供了全双工管道,但是为了最 ...
第6章 Selenium2-Java 自动化测试模型
6.1 自动化测试模型介绍 6.1.1 线性测试 :其实就是单纯地来模拟用户完整的操作场景. 优势就是每一个脚本都是完整且独立的: 缺陷测试用例的开发与维护成本很高. 6.1.2 模块化驱动 ...
如何用TexturePacker打包素材
如何用TexturePacker打包素材 TexturePacker是一个非常好用的图片素材打包工具,它能帮助你减少游戏的图片内存使用. 官方下载地址:http://www.codeandweb.co ...
SSM框架、Druid连接池实现多数据源配置（已上线使用）
总体大概流程: 1.配置数据源.账密(账密一致,文章不多阐述) driverClassName = com.mysql.jdbc.Driver validationQuery = SELECT 1 ...

[HDFS_4] HDFS 的 Java 应用开发

0. 说明

1. 流程

1.1 在项目下新建 Moudle

1.2 为 Moudle 添加 Maven 框架支持

1.3 添加 Maven 依赖

1.4 将 Hadoop/etc/ha 目录下的 [core-site.xml] [hdfs-site.xml] [log4j.properties] 存入 resources 中

2. 代码编写

[HDFS_4] HDFS 的 Java 应用开发的更多相关文章

随机推荐

热门专题

　　1.1 在项目下新建 Moudle

　　1.2 为 Moudle 添加 Maven 框架支持

　　1.3 添加 Maven 依赖

　　1.4 将 Hadoop/etc/ha 目录下的 [core-site.xml] [hdfs-site.xml] [log4j.properties] 存入 resources 中