HDFS基本操作的API

一、从hdfs下载文件到windows本地：

package com.css.hdfs01;

import java.io.IOException;

import java.net.URI;

import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

/**

 * 从hdfs下载文件到windows本地

 *

 * 注意：

 * 1.需要配置hadoop环境变量

 * 2.需要编译好的winutils包

 */

public class HdfsClientDemo02 {

    public static void main(String[] args) throws IOException, InterruptedException, URISyntaxException {

        // 1.加载配置

        Configuration conf = new Configuration();

        // 2.设置副本数

        conf.set("dfs.replication", "2");

        // 3.设置块大小

        conf.set("dfs.blocksize", "64m");

        // 4.构造客户端

        FileSystem fs = FileSystem.get(new URI("hdfs://192.168.146.132:9000"), conf, "root");

        // 5.hdfs数据下载到windows本地

        fs.copyToLocalFile(new Path("/hdfs-site.xml"), new Path("c:/"));

        // 6.关闭资源

        fs.close();

    }

}

二、hdfs常用的API：

package com.css.hdfs02;

import java.io.IOException;

import java.net.URI;

import java.net.URISyntaxException;

import java.util.Arrays;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.LocatedFileStatus;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.RemoteIterator;

import org.junit.Before;

import org.junit.Test;

/**

 * hdfs常用的API

 */

public class HdfsClientTest {

    FileSystem fs =null;

    @Before

    public  void init() throws IOException, InterruptedException, URISyntaxException {

        // 1.加载配置

        Configuration conf = new Configuration();

        // 2.设置副本数

        conf.set("dfs.replication", "2");

        // 3.设置块大小

        conf.set("dfs.blocksize", "64m");

        // 4.构造客户端

        fs = FileSystem.get(new URI("hdfs://192.168.146.132:9000/"), conf, "root");

    }

    /**

     * 在hdfs中创建文件夹

     * hdfs dfs -mkdir /文件夹名

     */

    @Test

    public void hdfsMkdir() throws IllegalArgumentException, IOException{

        // 1.调用创建文件夹方法

        fs.mkdirs(new Path("/hello"));

        // 2.关闭资源

        fs.close();

    }

    /**

     * 在hdfs中 移动/修改文件

     * hdfs dfs -mv /hdfs路径 /hdfs路径

     * hdfs dfs -cp /hdfs路径 /hdfs路径

     */

    @Test

    public void hdfsRename() throws IllegalArgumentException, IOException{

        // 1.调用移动修改文件方法

        fs.rename(new Path("/aa.txt"), new Path("/hello/aa.txt"));

        // 2.关闭资源

        fs.close();

    }

    /**

     * 在hdfs中 删除文件/文件夹

     * hdfs dfs -rm /文件名

     * hdfs dfs -rm -r /文件夹名

     */

    @Test

    public void hdfsRm() throws IllegalArgumentException, IOException{

        // 1.调用删除文件方法

        // 下面的一个参数的方法已弃用

        // fs.delete(new Path("/aaaa.txt"));

        // 参数1：要删除的路径  参数2：是否递归删除

        fs.delete(new Path("/aaa111.txt"), true);

        // 2.关闭资源

        fs.close();

    }

    /**

     * 查询hdfs下指定的目录信息

     */

    @Test

    public void hdfsLs() throws IllegalArgumentException, IOException{

        // 1.调用方法，返回远程迭代器

        RemoteIterator<LocatedFileStatus> iter = fs.listFiles(new Path("/"), true);

        // 2.取迭代器数据

        while (iter.hasNext()) {

            // 拿数据

            LocatedFileStatus status = iter.next();

            System.out.println("文件的路径为：" + status.getPath());

            System.out.println("块大小为：" + status.getBlockSize());

            System.out.println("文件长度为：" + status.getLen());

            System.out.println("副本数量为：" + status.getReplication());

            System.out.println("块信息为：" + Arrays.toString(status.getBlockLocations()));

            System.out.println("===============================");

        }

        // 3.关闭资源

        fs.close();

    }

    /**

     * 判断文件还是文件夹

     */

    @Test

    public void hdfsFile() throws IllegalArgumentException, IOException{

        // 1.展示状态信息

        FileStatus[] listStatus = fs.listStatus(new Path("/"));

        // 2.遍历所有文件

        for(FileStatus ls:listStatus){

            if (ls.isFile()) {

                // 文件

                System.out.println("文件-----f-----" + ls.getPath().getName());

            }else {

                // 文件夹

                System.out.println("文件夹-----d-----" + ls.getPath().getName());

            }

        }

    }

}

三、hdfs读写文件：

package com.css.hdfs03;

import java.io.BufferedReader;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.net.URI;

import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.junit.Before;

import org.junit.Test;

/**

 * hdfs读写文件

 */

public class ReadData {

    FileSystem fs =null;

    @Before

    public  void init() throws IOException, InterruptedException, URISyntaxException {

        // 1.加载配置

        Configuration conf = new Configuration();

        // 2.构造客户端

        fs = FileSystem.get(new URI("hdfs://192.168.146.132:9000/"), conf, "root");

    }

    /**

     * 读数据方式一

     */

    @Test

    public void testReadData1() throws IllegalArgumentException, IOException{

        // 1.拿到流

        FSDataInputStream in = fs.open(new Path("/a.txt"));

        byte[] buf = new byte[1024];

        in.read(buf);

        System.out.println(new String(buf));

        // 2.关闭资源

        in.close();

        fs.close();

    }

    /**

     * 读数据方式二

     */

    @Test

    public void testReadData2() throws IllegalArgumentException, IOException{

        // 1.拿到流

        FSDataInputStream in = fs.open(new Path("/hdfs-site.xml"));

        // 2.缓冲流

        BufferedReader br = new BufferedReader(new InputStreamReader(in, "UTF-8"));

        // 3.按行读取

        String line = null;

        // 4.读数据

        while ((line = br.readLine()) != null) {

            System.out.println(line);

        }

        // 5.关闭资源

        br.close();

        in.close();

        fs.close();

    }

    /**

     * 读取hdfs中指定偏移量

     */

    @Test

    public void testRandomRead() throws IllegalArgumentException, IOException{

        // 1.拿到流

        FSDataInputStream in = fs.open(new Path("/hdfs-site.xml"));

        // 2.移动文件读取指针到指定位置

        in.seek(14);

        byte[] b = new byte[5];

        // 3.从指针位置开始读取数组b的长度个字节

        in.read(b);

        System.out.println(new String(b));

        // 4.关闭资源

        in.close();

    }

    /**

     * 在hdfs中写数据方式一

     */

    @Test

    public void testWriteData() throws IllegalArgumentException, IOException{

        // 1.输出流

        FSDataOutputStream out = fs.create(new Path("/windows.txt"), false);

        // 2.输入流

        FileInputStream in = new FileInputStream("C:\\Users\\Administrator\\Desktop\\1012.txt");

        byte[] buf = new byte[1024];

        int read = 0;

        while ((read = in.read(buf)) != -1) {

            out.write(buf, 0, read);

        }

        // 3.关闭资源

        in.close();

        out.close();

        fs.close();

    }

    /**

     * 在hdfs中写数据方式二

     */

    @Test

    public void testWriteData1() throws IllegalArgumentException, IOException{

        // 1.创建输出流

        FSDataOutputStream out = fs.create(new Path("/love"));

        // 2.写数据

        out.write("Areyouokmylove".getBytes());

        // 3.关闭资源

        IOUtils.closeStream(out);

        fs.close();

    }

}

HDFS基本操作的API的更多相关文章

Hadoop（五）：HDFS的JAVA API基本操作
HDFS的JAVA API操作 HDFS在生产应用中主要是客户端的开发,其核心步骤是从HDFS提供的api中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件. 主 ...
HDFS中JAVA API的使用
HDFS中JAVA API的使用 HDFS是一个分布式文件系统,既然是文件系统,就可以对其文件进行操作,比如说新建文件.删除文件.读取文件内容等操作.下面记录一下使用JAVA API对HDFS中的 ...
HDFS的java api操作
hdfs在生产应用中主要是针对客户端的开发,从hdfs提供的api中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件. 搭建开发环境方式一(windows环境下 ...
hdfs基本操作
hdfs基本操作 1.查询命令 hadoop dfs -ls / 查询/目录下的所有文件和文件夹 hadoop dfs -ls -R 以递归的方式查询/目录下的所有文件 2.创建文件夹 hadoo ...
HDFS的Java API
HDFS Java API 可以用于任何Java程序与HDFS交互,该API使我们能够从其他Java程序中利用到存储在HDFS中的数据,也能够使用其他非Hadoop的计算框架处理该数据为了以编程方式 ...
Hadoop（四）HDFS的高级API操作
一 HDFS客户端环境准备 1.1 jar包准备 1)解压hadoop-2.7.6.tar.gz到非中文目录 2)进入share文件夹,查找所有jar包,并把jar包拷贝到_lib文件夹下 3)在全部 ...
Hadoop之HDFS（三）HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
[转]HDFS中JAVA API的使用
HDFS是一个分布式文件系统,既然是文件系统,就可以对其文件进行操作,比如说新建文件.删除文件.读取文件内容等操作.下面记录一下使用JAVA API对HDFS中的文件进行操作的过程. 对分HDFS中的 ...
Sample: Write And Read data from HDFS with java API
HDFS: hadoop distributed file system 它抽象了整个集群的存储资源,可以存放大文件. 文件采用分块存储复制的设计.块的默认大小是64M. 流式数据访问,一次写入(现支 ...

随机推荐

lua工具库penlight--08额外的库（二）
执行一系列的参数类型说明符也可以是' ('MIN '..' MAX)' 的形式. local lapp = require 'pl.lapp' local args = lapp [[ Setti ...
一些lua代码
1.把k--v表转化为数组表,只支持2级 2.取中值 3.字符串按每行最多n像素分割,并返回每行最大宽度,可以用"\n"手动换行
am335x 无屏实现开关机程序
因测试需要加入开机次数记录,所以记录一下7816开关机是怎么做的原理很简单,开机时判断一个记录文件是否存在,如果存在,运行一段代码,将记录开机次数文件的值读出来+1 代码如下: #include & ...
beaglebone black ubuntu display x11 server的配置
Change default resolution on BeagleBone modesetting vs fbdev digiteltlc May 7th, 2014, 03:28 PM Hi ...
Linux开机启动文件rc.local无法执行怎么办？
rc.local是Linux系统中的一个重要的开机启动文件,每次开机都要执行这个文件.但是有一些用户的Linux系统无法执行这个文件,并导致了一系列的问题.遇到这个问题我们应该怎么办呢? 在Linux ...
boost 互斥体和锁
1.共享资源是一个自动锁住的房间,互斥体是钥匙,进入房间必须取钥匙,离开房间应该还钥匙.这就对应着互斥体的lock(取钥匙)和unlock(还钥匙). 2.考虑下面的场景:还钥匙的时候出现异常,会发生 ...
在MVC设计模式中，JavaBean的作用是。(选择1项)
A.Controller B.Model C.业务数据的封装 D.View 解答:B
如果没有指定Cookie的时效，那么默认的时效是。(选择1项)
如果没有指定Cookie的时效,那么默认的时效是.(选择1项) A．一天 B. 永不过期 C．会话级别 D.一分钟解答:C 这是API的原文:By default, -1 indicating th ...
清除信号量队列导致zabbix自动关闭
前几天在海外UCloud机器上部署了一套zabbix proxy和zabbix agentd,可是第二天一大早就收到邮件说zabbix_proxy挂掉了,上去查一下发现两台机器中的一台的proxy和a ...
hrbustoj 1305:多边形（计算几何，极角排序练习）
多边形 Time Limit: 1000 MS Memory Limit: 65536 K Total Submit: 113(42 users) Total Accepted: 51(3 ...

HDFS基本操作的API

HDFS基本操作的API的更多相关文章

随机推荐

热门专题