【Hadoop】HDFS客户端开发示例

1、原理、步骤

2、HDFS客户端示例代码

package com.ares.hadoop.hdfs;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.net.URISyntaxException;

import org.apache.commons.io.IOUtils;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.LocatedFileStatus;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.RemoteIterator;

import org.apache.log4j.Logger;

import org.junit.After;

import org.junit.Before;

import org.junit.Test;

public class HDFSTest {

    private static final Logger LOGGER = Logger.getLogger(HDFSTest.class);

    private FileSystem fs = null;

    @Before

    public void setUp() throws IOException, URISyntaxException, InterruptedException {

        Configuration conf = new Configuration();

//        conf.set("fs.defaultFS", "hdfs://HADOOP-NODE1:9000");

//        URI uri = new URI("hdfs://HADOOP-NODE1:9000");

//        this.fs = FileSystem.get(uri, conf, "HADOOP");

        this.fs = FileSystem.get(conf);

    }

    @After

    public void tearDown() throws IOException {

        // TODO Auto-generated method stub

        this.fs.close();

    }

    @Test

    public void testGET() throws IOException {

        // TODO Auto-generated method stub

        LOGGER.debug("HDFSTest: GET FILE TEST");

        Path path = new Path("hdfs://HADOOP-NODE1:9000/jdk-7u60-linux-x64.tar.gz");

        FSDataInputStream fsDataInputStream = this.fs.open(path);

        FileOutputStream fileOutputStream = new FileOutputStream("./testdata/get-test-jdk.tar.gz");

        IOUtils.copy(fsDataInputStream, fileOutputStream);

    }

    @Test

    public void testPUT() throws IOException {

        // TODO Auto-generated method stub

        LOGGER.debug("HDFSTest: PUT FILE TEST");

        Path path = new Path("hdfs://HADOOP-NODE1:9000/put-test-jdk.tar.gz");

        FSDataOutputStream fsDataOutputStream = this.fs.create(path);

        FileInputStream fileInputStream = new FileInputStream("./testdata/test-jdk.tar.gz");

        IOUtils.copy(fileInputStream, fsDataOutputStream);

    }

    @Test

    public void testGET_NEW() throws IOException {

        // TODO Auto-generated method stub

        LOGGER.debug("HDFSTest: GET_NEW FILE TEST");

        Path src = new Path("hdfs://HADOOP-NODE1:9000/jdk-7u60-linux-x64.tar.gz");

        Path dst = new Path("./testdata/get-test-new-jdk.tar.gz");

        this.fs.copyToLocalFile(src, dst);

    }

    @Test

    public void testPUT_NEW() throws IOException {

        // TODO Auto-generated method stub

        LOGGER.debug("HDFSTest: PUT_NEW FILE TEST");

        Path src = new Path("./testdata/test-jdk.tar.gz");

        Path dst = new Path("hdfs://HADOOP-NODE1:9000/put-test-new-jdk.tar.gz");

        this.fs.copyFromLocalFile(src , dst);

    }

    @Test

    public void testMKDIR() throws IOException {

        // TODO Auto-generated method stub

        LOGGER.debug("HDFSTest: MKDIR TEST");

        Path f = new Path("/mkdir-test/testa/testb");

        this.fs.mkdirs(f);

    }

    @Test

    public void testRM() throws IOException {

        // TODO Auto-generated method stub

        LOGGER.debug("HDFSTest: RM TEST");

        Path f = new Path("/mkdir-test");

        this.fs.delete(f, true);

    }

    @Test

    public void testLIST() throws IOException {

        // TODO Auto-generated method stub

        LOGGER.debug("HDFSTest: LIST TEST");

        Path f = new Path("/");

        //LIST FILES

        RemoteIterator<LocatedFileStatus> files = this.fs.listFiles(f, true);

        while (files.hasNext()) {

            LocatedFileStatus file = files.next();

            LOGGER.debug(file.getPath());

            LOGGER.debug(file.getPath().getName());

        }

        //LIST DIRS

        FileStatus[] files2 = this.fs.listStatus(f);

//        for (int i = 0; i < files2.length; i++) {

//            LOGGER.debug(files2[i].getPath().getName());

//        }

        for (FileStatus fileStatus : files2) {

            LOGGER.debug(fileStatus.getPath().getName());

            LOGGER.debug(fileStatus.isDirectory());

        }

    }

}

【Hadoop】HDFS客户端开发示例的更多相关文章

java 调用webservice (asmx) 客户端开发示例
这是本人第一次写博客,其实就是自己做个笔记,写的很粗糙,也希望能给跟我遇到同样问题的你一点帮助. 因为最近有个项目要调用webservice接口,之前接触的都是Java开发服务端和客户端的接口,开发前 ...
hadoop学习day2开发笔记
1.将hdfs客户端开发所需的jar导入工程(jar包可在hadoop安装包中找到common/hdfs) 2.写代码要对hdfs中的文件进行操作,代码中首先需要获得一个hdfs的客户端对象 Con ...
Hadoop HDFS的shell(命令行客户端)操作实例
HDFS的shell(命令行客户端)操作实例 3.2 常用命令参数介绍 -help 功能:输出这个命令参数手册 -ls 功能:显示目录信息示例: hadoop fs ...
使用HDFS客户端java api读取hadoop集群上的信息
本文介绍使用hdfs java api的配置方法. 1.先解决依赖,pom <dependency> <groupId>org.apache.hadoop</groupI ...
Hadoop JAVA HDFS客户端操作
JAVA HDFS客户端操作通过API操作HDFS org.apache.logging.log4jlog4j-core2.8.2org.apache.hadoophadoop-common${ha ...
Hadoop之HDFS客户端操作
1. HDFS 客户端环境准备 1.1 windows 平台搭建 hadoop 2.8.5 2. 创建Maven工程 # pom.xml <dependencies> <depend ...
Hadoop HDFS分布式文件系统设计要点与架构
Hadoop HDFS分布式文件系统设计要点与架构 Hadoop简介:一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群 ...
【转】Hadoop HDFS分布式环境搭建
原文地址 http://blog.sina.com.cn/s/blog_7060fb5a0101cson.html Hadoop HDFS分布式环境搭建最近选择给大家介绍Hadoop HDFS系统 ...
Hadoop HDFS分布式文件系统设计要点与架构(转摘)
Hadoop简介:一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储.Hadoop实现了一个分布式文件系统(Ha ...

随机推荐

Oracle exp
--导出表exp userid=hr/oracle123 tables=employees direct=y file=/u01/employees.dmp log=/u01/employees.lo ...
（七）MySQL数据操作DQL:多表查询2
(1)准备环境 1)创建员工表 mysql> create table company.employee6( -> emp_id int auto_increment primary ke ...
（二）openvpn客户端配置
1)下载和安装openvpn客户端下载连接:https://build.openvpn.net/downloads/releases/ 注意:这里下载连接使用国内的网已被强,我通过FQ下载链接:h ...
linux：/lib/libc.so.6: version `glibc_2.7′ not found【没有解决】采用新方法达到目的
1 下载glibc wget http://ftp.gnu.org/pub/gnu/glibc/glibc-2.7.tar.gz 2. tar zxf glibc-2.7.tar.gz 3. cd g ...
2017 ACM-ICPC 亚洲区（青岛赛区）网络赛 1009
#include<cmath> #include<set> #include<list> #include<deque> #include<map ...
[Python Debug]Kernel Crash While Running Neural Network with Keras|Jupyter Notebook运行Keras服务器宕机原因及解决方法
最近做Machine Learning作业,要在Jupyter Notebook上用Keras搭建Neural Network.结果连最简单的一层神经网络都运行不了,更奇怪的是我先用iris数据集跑了 ...
暴力【p4092】[HEOI2016/TJOI2016]树
Description 在2016年,佳媛姐姐刚刚学习了树,非常开心.现在他想解决这样一个问题:给定一颗有根树(根为1),有以下两种操作: 标记操作:对某个结点打上标记(在最开始,只有结点1有标记,其 ...
谜题22：URL的愚弄
本谜题利用了Java编程语言中一个很少被人了解的特性.请考虑下面的程序将会做些什么? public class BrowserTest { public static void main(String ...
(转)python之并行任务的技巧
Python的并发处理能力臭名昭著.先撇开线程以及GIL方面的问题不说,我觉得多线程问题的根源不在技术上而在于理念.大部分关于Pyhon线程和多进程的资料虽然都很不错,但却过于细节.这些资料讲的都是虎 ...
bzoj4543[POI2014]Hotel
题目链接 bzoj4543 [POI2014]Hotel 题解这不是裸地点分嘛 ,我真傻,真的 n^2 这不是是sb题,~滑稽 ~ 枚举点转换为无根树,暴力子树中点的深度计数转移令a b c d ...

【Hadoop】HDFS客户端开发示例

【Hadoop】HDFS客户端开发示例的更多相关文章

随机推荐

热门专题