HDFS的Java客户端编写

总结：之前在教材上看hdfs的Java客户端编写，只有关键代码，呵呵……。闲话不说，上正文。

1. Hadoop 的Java客户端编写建议在linux系统上开发

2. 可以使用eclipse,idea 等IDE工具，目前比较流行的是idea

3. 新建项目之后需要添加很多jar包，win，linux下添加jar方式略有不同

　　 4. 使用代码会出现文件格式不认识，权限等问题。

具体：

1.首先测试从hdfs中下载文件:

下载文件的代码:(将hdfs://localhost:9000/jdk-7u65-linux-i586.tar.gz文件下载到本地/opt/download/doload.tgz)

package cn.qlq.hdfs;

import java.io.FileOutputStream;

import java.io.IOException;

import org.apache.commons.compress.utils.IOUtils;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class HdfsUtil {

    public static void main(String a[]) throws IOException {

        //to upload a file

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(conf);

        Path path = new Path("hdfs://localhost:9000/jdk-7u65-linux-i586.tar.gz");

        FSDataInputStream input = fs.open(path);

        FileOutputStream output = new FileOutputStream("/opt/download/doload.tgz");

        IOUtils.copy(input, output);

    }

}

直接运行报错:

　　原因是程序不认识 hdfs://localhost:9000/jdk-7u65-linux-i586.tar.gz 这样的目录

log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory).

log4j:WARN Please initialize the log4j system properly.

log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.

Exception in thread "main" java.lang.IllegalArgumentException: Wrong FS: hdfs://localhost:9000/jdk-7u65-linux-i586.tar.gz, expected: file:///

    at org.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:643)

    at org.apache.hadoop.fs.RawLocalFileSystem.pathToFile(RawLocalFileSystem.java:79)

    at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:506)

    at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:724)

    at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:501)

    at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:397)

    at org.apache.hadoop.fs.ChecksumFileSystem$ChecksumFSInputChecker.<init>(ChecksumFileSystem.java:137)

    at org.apache.hadoop.fs.ChecksumFileSystem.open(ChecksumFileSystem.java:339)

    at org.apache.hadoop.fs.FileSystem.open(FileSystem.java:764)

    at cn.qlq.hdfs.HdfsUtil.main(HdfsUtil.java:21)

解决办法:

第一种:　将hadoop安装目录下的etc目录中的core-site.xml拷贝到eclipse的src目录下。这样就不会报错

运行结果:

[root@localhost download]# ll

total 140224

-rw-r--r--. 1 root root 143588167 Apr 20 05:55 doload.tgz

[root@localhost download]# pwd

/opt/download

[root@localhost download]# ll

total 140224

-rw-r--r--. 1 root root 143588167 Apr 20 05:55 doload.tgz

第二种:直接在程序中修改

　　我们先查看hdfs-site.xml中的内容:

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/opt/hadoop/hadoop-2.4.1/data/</value>

</property>

</configuration>

代码改为:

    public static void main(String a[]) throws IOException {

        //to upload a filed

        Configuration conf = new Configuration();

        //set hdfs root dir

        conf.set("fs.defaultFS", "hdfs://localhost:9000");

        FileSystem fs = FileSystem.get(conf);

        Path path = new Path("hdfs://localhost:9000/jdk-7u65-linux-i586.tar.gz");

        FSDataInputStream input = fs.open(path);

        FileOutputStream output = new FileOutputStream("/opt/download/doload.tgz");

        IOUtils.copy(input, output);

    }

2.下面代码演示了hdfs的基本操作:

package cn.qlq.hdfs;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.net.URI;

import java.net.URISyntaxException;

import org.apache.commons.compress.utils.IOUtils;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.LocatedFileStatus;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.RemoteIterator;

import org.junit.Before;

import org.junit.Test;

public class HdfsUtil {

    private FileSystem fs = null;

    @Before

    public void befor() throws IOException, InterruptedException, URISyntaxException{

        //读取classpath下的xxx-site.xml 配置文件，并解析其内容，封装到conf对象中

        Configuration conf = new Configuration();

        //也可以在代码中对conf中的配置信息进行手动设置，会覆盖掉配置文件中的读取的值

        conf.set("fs.defaultFS", "hdfs://localhost:9000/");

        //根据配置信息，去获取一个具体文件系统的客户端操作实例对象

        fs = FileSystem.get(new URI("hdfs://localhost:9000/"),conf,"root");

    }

    /**

     * 上传文件，比较底层的写法

     *

     * @throws Exception

     */

    @Test

    public void upload() throws Exception {

        Path dst = new Path("hdfs://localhost:9000/aa/qingshu.txt");

        FSDataOutputStream os = fs.create(dst);

        FileInputStream is = new FileInputStream("/opt/download/haha.txt");

        IOUtils.copy(is, os);

    }

    /**

     * 上传文件，封装好的写法

     * @throws Exception

     * @throws IOException

     */

    @Test

    public void upload2() throws Exception, IOException{

        fs.copyFromLocalFile(new Path("/opt/download/haha.txt"), new Path("hdfs://localhost:9000/aa/qingshu2.txt"));

    }

    /**

     * download file

     * @throws IOException

     */

    @Test

    public  void download() throws IOException {

        Path path = new Path("hdfs://localhost:9000/jdk-7u65-linux-i586.tar.gz");

        FSDataInputStream input = fs.open(path);

        FileOutputStream output = new FileOutputStream("/opt/download/doload.tgz");

        IOUtils.copy(input, output);

    }

    /**

     * 下载文件

     * @throws Exception

     * @throws IllegalArgumentException

     */

    @Test

    public void download2() throws Exception {

        fs.copyToLocalFile(new Path("hdfs://localhost:9000/aa/qingshu2.txt"), new Path("/opt/download/haha2.txt"));

    }

    /**

     * 查看文件信息

     * @throws IOException

     * @throws IllegalArgumentException

     * @throws FileNotFoundException

     *

     */

    @Test

    public void listFiles() throws FileNotFoundException, IllegalArgumentException, IOException {

        // listFiles列出的是文件信息，而且提供递归遍历

        RemoteIterator<LocatedFileStatus> files = fs.listFiles(new Path("/"), true);

        while(files.hasNext()){

            LocatedFileStatus file = files.next();

            Path filePath = file.getPath();

            String fileName = filePath.getName();

            System.out.println(fileName);

        }

        System.out.println("---------------------------------");

        //listStatus 可以列出文件和文件夹的信息，但是不提供自带的递归遍历

        FileStatus[] listStatus = fs.listStatus(new Path("/"));

        for(FileStatus status: listStatus){

            String name = status.getPath().getName();

            System.out.println(name + (status.isDirectory()?" is dir":" is file"));

        }

    }

    /**

     * 创建文件夹

     * @throws Exception

     * @throws IllegalArgumentException

     */

    @Test

    public void mkdir() throws IllegalArgumentException, Exception {

        fs.mkdirs(new Path("/aaa/bbb/ccc"));

    }

    /**

     * 删除文件或文件夹

     * @throws IOException

     * @throws IllegalArgumentException

     */

    @Test

    public void rm() throws IllegalArgumentException, IOException {

        fs.delete(new Path("/aa"), true);

    }

}

HDFS的Java客户端编写的更多相关文章

2 weekend110的HDFS的JAVA客户端编写 + filesystem设计思想总结
HDFS的JAVA客户端编写现在,我们来玩玩,在linux系统里,玩eclipse 或者, 即,更改图标,成功这个,别慌.重新换个版本就好,有错误出错是好事. http://www.eclips ...
一次失败的尝试hdfs的java客户端编写（在linux下使用eclipse）
一次失败的尝试hdfs的java客户端编写(在linux下使用eclipse) 给centOS安装图形界面 GNOME桌面环境 https://blog.csdn.net/wh211212/artic ...
【Hadoop】HDFS的java客户端编写
项目使用了Maven Project 快速进行HDFS 客户端程序测试客户端操作系统:win10 64位 JDK: 1.7.0_79 开发工具 :Eclipse Luna pom.xml < ...
一脸懵逼学习hadoop之HDFS的java客户端编写
1:eclipse创建一个项目,然后导入对应的jar包: 鼠标右击项目,点击properties或者alt+enter快捷键--->java build path--->libraries ...
day03-hdfs的客户端操作\hdfs的java客户端编程
5.hdfs的客户端操作客户端的理解 hdfs的客户端有多种形式: 1.网页形式 2.命令行形式 3.客户端在哪里运行,没有约束,只要运行客户端的机器能够跟hdfs集群联网文件的切块大小和存储的副 ...
hdfs shell命令及java客户端编写
一. hdfs shell命令可以通过hadoop fs 查看所有的shell命令及其用法. 传文件到hdfs: hadoop fs -put /home/koushengrui/Downloads ...
HDFS的Java客户端操作代码(HDFS的查看、创建)
1.HDFS的put上传文件操作的java代码: package Hdfs; import java.io.FileInputStream; import java.io.FileNotFoundEx ...
HDFS的java客户端操作代码(Windows上面打jar包，提交至linux运行)
1.通过java.net.URL实现屏幕显示demo1文件的内容 package Hdfs; import java.io.InputStream; import java.net.URL; impo ...
HDFS的Java客户端操作代码(HDFS删除文件或目录)
1.HDFS删除文件或目录 package Hdfs; import java.io.IOException; import java.net.URI; import org.apache.hadoo ...

随机推荐

Redis自学笔记:4.4进阶-消息通知
4.4消息通知 4.4.1任务队列传递任务的队列.与任务队列进行交互的实体有两类,一类是生产者,一类是消费者. 生产者将需要处理的任务放入任务队列中,二消费者不断从任务队列中读入任务信息并执行. ...
[R] R语言for循环机制
在做数据分段截取的时候,发现for循环的表现和其他语言不太一样. 上代码: :) { i = i + print(i) } 结果: [] [] [] [] 即作为循环计次的i, 并不会因为在循环体中的 ...
2017-11-4—LTspice
LTspice这个软件基本上上手就能用,没什么好说的. ADI的一些器件下载的spice文件可能是.cir的需要使用cadence的pspice软件打开后另存为.dir文件使用.(比如ad4096) ...
潭州课堂25班：Ph201805201 tornado 项目第五课增加用户系统-用户中心（课堂笔记）
tornado 相关说明在 users 表中创建记录,做测试在项目根目录下创建 test.py # -*- coding: utf-8 -*- # 斌彬电脑 # @Time : 2019/2/27 ...
svn提交按钮灰选
1.当我新建了一个文件或者文件夹,要提交的时候出现ok按钮灰选,提交不了. 解决方法:提交信息多写一些字儿就可以了,挥着回车换行也行 2.报错:you need to upgrade the work ...
HTML5_canvas_pen.translate()_
.save() 和 .restore() 除了会保存之前的样式,还会保存之前的坐标轴 pen.translate(x, y); 将画布的坐标轴原点(0, 0) 从画布的左上角,移动到 (x, y) ...
[LeetCode] Binary Trees With Factors 带因子的二叉树
Given an array of unique integers, each integer is strictly greater than 1. We make a binary tree us ...
[LeetCode] Swap Adjacent in LR String 交换LR字符串中的相邻项
In a string composed of 'L', 'R', and 'X' characters, like "RXXLRXRXL", a move consists of ...
viewport的故事（一）
部分翻译自原文 https://www.quirksmode.org/mobile/viewports.html 概念:设备像素和CSS像素设备像素可以通过 screen.width/he ...
swust oj 972
统计利用先序遍历创建的二叉树的宽度 1000(ms) 10000(kb) 2938 / 6810 利用先序递归遍历算法创建二叉树并计算该二叉树的宽度.先序递归遍历建立二叉树的方法为:按照先序递归遍历的 ...

HDFS的Java客户端编写

1.首先测试从hdfs中下载文件:

2.下面代码演示了hdfs的基本操作:

HDFS的Java客户端编写的更多相关文章

随机推荐

热门专题