【HDFS API编程】从本地拷贝文件，从本地拷贝大文件，拷贝HDFS文件到本地

接着之前继续API操作的学习

CopyFromLocalFile: 顾名思义，从本地文件拷贝

/**

 * 使用Java API操作HDFS文件系统

 * 关键点:

 * 1)create Configuration

 * 2)get FileSystem

 * 3)...It's your HDFS API operation.

 */

public class HDFSApp {

    public static final String HDFS_PATH = "hdfs://hadoop000:8020";

    FileSystem fileSystem = null;

    Configuration configuration = null;

    @Before

    public void setUp() throws Exception{

        System.out.println("setUp-----------");

        configuration = new Configuration();

        configuration.set("dfs.replication","1");

        /*

         * 构造一个访问制定HDFS系统的客户端对象

         * 第一个参数：HDFS的URI

         * 第二个参数：客户端制定的配置参数

         * 第三个参数：客户端的身份，说白了就是用户名

         */

        fileSystem = FileSystem.get(new URI(HDFS_PATH),configuration,"hadoop");

    }

    /*

     * 拷贝本地文件到HDFS文件系统

     */

    @Test

    public void copyFromLocalFile() throws Exception{

        Path src = new Path("/home/hadoop/t.txt");

        Path dst = new Path("/hdfsapi/test/");

        fileSystem.copyFromLocalFile(src,dst);

    }

　　@After

    public void tearDown(){

        configuration = null;

        fileSystem = null;

        System.out.println("----------tearDown------");

    }

}

方法怎么用？还是那句 哪里不会Ctrl点哪里。

点进CopyFromLocalFile方法源码得知方法需要两个参数：本地文件的Path，和目标文件的Path，无返回值。

我们运行该测试类后进入终端使用-ls查看/hdfsapi/test目录下包含了刚刚copy进来的t.txt文件，测试成功。

[hadoop@hadoop000 ~]$ hadoop fs -ls /hdfsapi/test

Found 3 items

-rw-r--r--   3 hadoop supergroup         14 2019-04-19 16:31 /hdfsapi/test/a.txt

-rw-r--r--   1 hadoop supergroup         28 2019-04-19 16:50 /hdfsapi/test/c.txt

-rw-r--r--   1 hadoop supergroup       2732 2019-04-20 19:51 /hdfsapi/test/t.txt

如果我们需要从本地拷贝一个大文件，文件越大需要等待的时间自然越长，这么漫长的等待且毫无显示严重影响用户体验。

所以在上传大文件的时候可以添加上传进度条，在fileSystem下有个create方法带有进度条的功能：

/**

   * Create an FSDataOutputStream at the indicated Path with write-progress

   * reporting.

   * Files are overwritten by default.

   * @param f the file to create

   * @param progress to report progress

*在具有写入进度的指定路径上创建fsdataoutputstream。

*默认情况下会覆盖文件。

*@参数 f 要创建的文件

*@参数 progress 报告进度

*/

  public FSDataOutputStream create(Path f, Progressable progress)

      throws IOException {

    return create(f, true,

                  getConf().getInt("io.file.buffer.size", 4096),

                  getDefaultReplication(f),

                  getDefaultBlockSize(f), progress);

  }

运行测试类，能看到打印显示，虽然全是点看起来比较抽象，但是比什么都没有到怀疑死机还是要好点儿。

setUp-----------

log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory).

log4j:WARN Please initialize the log4j system properly.

log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................----------tearDown------

Process finished with exit code 0

........................

我们打开终端-ls查看，上传成功。

[hadoop@hadoop000 software]$ hadoop fs -ls /hdfsapi/test

Found 4 items

-rw-r--r--   3 hadoop supergroup         14 2019-04-19 16:31 /hdfsapi/test/a.txt

-rw-r--r--   1 hadoop supergroup         28 2019-04-19 16:50 /hdfsapi/test/c.txt

-rw-r--r--   1 hadoop supergroup  181367942 2019-04-20 20:10 /hdfsapi/test/jdk.zip

-rw-r--r--   1 hadoop supergroup       2732 2019-04-20 19:51 /hdfsapi/test/t.txt

能上传那就自然会问：怎么下载？直接上代码，和上面类似就不多介绍了。

    /**

     * 拷贝HDFS文件到本地：下载

     * @throws Exception

     */

    @Test

    public void copyToLocalFile() throws Exception{

        Path src = new Path("/hdfsapi/test/t.txt");

        Path dst = new Path("/home/hadoop/app");

        fileSystem.copyToLocalFile(src,dst);

    }

【HDFS API编程】从本地拷贝文件，从本地拷贝大文件，拷贝HDFS文件到本地的更多相关文章

【HDFS API编程】查看HDFS文件内容、创建文件并写入内容、更改文件名
首先,重点重复重复再重复: /** * 使用Java API操作HDFS文件系统 * 关键点: * 1)创建 Configuration * 2)获取 FileSystem * 3)...剩下的就是 ...
【HDFS API编程】第一个应用程序的开发-创建文件夹
/** * 使用Java API操作HDFS文件系统 * 关键点: * 1)创建 Configuration * 2)获取 FileSystem * 3)...剩下的就是 HDFS API的操作了*/ ...
【HDFS API编程】查看目标文件夹下的所有文件、递归查看目标文件夹下的所有文件
使用hadoop命令:hadoop fs -ls /hdfsapi/test 我们能够查看HDFS文件系统/hdfsapi/test目录下的所有文件信息那么使用代码怎么写呢?直接先上代码:(这之后 ...
【HDFS API编程】jUnit封装-改写创建文件夹
首先:什么是jUnit 回顾: https://www.cnblogs.com/Liuyt-61/p/10374732.html 上一节我们知道: /** * 使用Java API操作HDFS文件系 ...
HDFS API编程
3.1常用类 3.1.1Configuration Hadoop配置文件的管理类,该类的对象封装了客户端或者服务器的配置(配置集群时,所有的xml文件根节点都是configuration ...
【HDFS API编程】开发环境搭建
使用HDFS API的方式来操作HDFS文件系统 IDEA Java 使用Maven来管理项目先打开IDEA,New Project 创建GAV然后next 默认使用的有idea内置的Maven,可 ...
【HDFS API编程】查看文件块信息
现在我们把文件都存在HDFS文件系统之上,现在有一个jdk.zip文件存储在上面,我们想知道这个文件在哪些节点之上?切成了几个块?每个块的大小是怎么样?先上测试类代码: /** * 查看文件块信息 * ...
【HDFS API编程】删除文件
所有操作都是以fileSystem为入口进行,我们使用fileSystem下的delete方法进行删除文件操作,删除的时候必须慎重. 直接上代码: /** * 删除文件 * @throws Excep ...
【HDFS API编程】图解客户端写文件到HDFS的流程

随机推荐

我的代码-date
# coding: utf-8 # In[24]: import timeimport datetimelocaltime = time.asctime( time.localtime(time.ti ...
LeetCode 104. Maximum Depth of Binary Tree C++ 解题报告
104. Maximum Depth of Binary Tree -- Easy 方法使用递归 /** * Definition for a binary tree node. * struct ...
node搭建简易的websocket服务
http协议单向请求,只能客户端向服务器发送消息,然而websocket一旦双方建立连接就可以双方通信,更加深层次的用法是websocket可以做基础,然后不同的客户端可以通过websocket连接可 ...
python，验证码生成
<pre>import string import random from PIL import Image from PIL import ImageDraw from PIL impo ...
git 之路
1. 不要把配置文件放到你的 Git 代码仓库 https://www.oschina.net/translate/dont-include-configs-in-your-git-repos 2. ...
MySQL Hardware--CentOS 6查看CPU信息
查看CPU信息 cpu_model=`cat /proc/cpuinfo |grep "model name"|awk -F ':' '{print $2}' |uniq` cpu ...
使用命令查看 Laravel 的版本
进入项目根目录文件夹后,进入命令行,输入命令: php artisan --version 或者输入: php artisan 会出现 artisan 的帮助文档,最上面就是 laravel 的版本号
chrome浏览器onunload方法无法执行window.location.href
记录用户不正常退出,如关闭浏览器的时候,执行onunload方法,跳回后台记录用户已经退出的信息,在ie上可以正常跳转,但在Firefox和chrome上却无法跳转. 测试后发现以下方法可以实现,支持 ...
LOJ 2550 「JSOI2018」机器人——找规律+DP
题目:https://loj.ac/problem/2550 只会写20分的搜索…… #include<cstdio> #include<cstring> #include&l ...
libvirt启动报错Failed to start Virtualization daemon
libvirt启动报错Failed to start Virtualization daemon 1.启动libvirt的具体报错如下 [root@localhost IOS]# service li ...

【HDFS API编程】从本地拷贝文件，从本地拷贝大文件，拷贝HDFS文件到本地

【HDFS API编程】从本地拷贝文件，从本地拷贝大文件，拷贝HDFS文件到本地的更多相关文章

随机推荐

热门专题