HDFS API基本操作

对HDFS API基本操作都是通过 org.apache.hadoop.fs.FileSystem类进行的，以下是一些常见的操作：

package HdfsAPI;

import java.io.BufferedInputStream;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import java.net.URI;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.BlockLocation;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.junit.Test;

import junit.framework.TestCase;

public class HDFSAPI extends TestCase{

    public static String hdfsUrl = "hdfs://master:8020";

    //创建文件夹

    @Test

    public void testHDFSmkdir() throws IOException{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(hdfsUrl),conf);

        Path path = new Path("/liguodong/hdfs");

        fs.mkdirs(path);

    }

    //创建文件

    @Test

    public void testHDFSmkFile() throws IOException{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(hdfsUrl),conf);

        Path path = new Path("/liguodong/hdfs/liguodong.txt");

        FSDataOutputStream fdos = fs.create(path);

        fdos.write("hello hadoop".getBytes());

    }

    //重命名

    @Test

    public void testHDFSRenameFile() throws IOException{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(hdfsUrl),conf);

        Path path = new Path("/liguodong/hdfs/liguodong.txt");

        Path Renamepath = new Path("/liguodong/hdfs/love.txt");

        System.out.println(fs.rename(path, Renamepath));

    }

    //上传一个本地文件

    @Test

    public void testHDFSPutLocalFile1() throws IOException{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(hdfsUrl),conf);

        //因为在windows上面调试，所以选择的是windows的文件夹，

        //假设在Linxu，须要Linux文件夹。

        Path srcpath = new Path("g:/liguodong.txt");

        Path destpath = new Path("/liguodong/hdfs");

        fs.copyFromLocalFile(srcpath, destpath);

    }

    @Test

    public void testHDFSPutLocalFile2() throws IOException{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(hdfsUrl),conf);

        //因为在windows上面调试，所以选择的是windows的文件夹，

        //假设在Linxu，须要Linux文件夹。

        String srcpath ="g:/oncemore.txt";

        Path destpath = new Path("/liguodong/hdfs/kkk.txt");

        InputStream is = new BufferedInputStream(

                new FileInputStream(new File(srcpath)));

        FSDataOutputStream fdos = fs.create(destpath);

        IOUtils.copyBytes(is, fdos, 4094);

    }

    //查看某个文件夹以下的全部文件

    @Test

    public void testHDFSListFiles() throws IOException{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(hdfsUrl),conf);

        Path path = new Path("/liguodong/hdfs");

        FileStatus[] files = fs.listStatus(path);

        for (FileStatus file : files) {

            System.out.println(file.getPath().toString());

        }

    }

    //查看某个文件的数据块信息

    @Test

    public void testHDFSGetBlockInfo() throws IOException{

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(hdfsUrl),conf);

        Path path = new Path("/liguodong/hdfs/kkk.txt");

        FileStatus filestatus = fs.getFileStatus(path);

        BlockLocation[] blkLoc = fs.getFileBlockLocations

                (filestatus, 0, filestatus.getLen());

        for (BlockLocation loc : blkLoc) {

            for (int i = 0; i < loc.getHosts().length; i++) {

                //获取数据块在哪些主机上

                System.out.println(loc.getHosts()[i]);//获取文件块的主机名

                //因为这个文件仅仅有一个块。所以输出结果为:slave2、slave1、slave5

            }

        }

    }

}

HDFS API基本操作的更多相关文章

hadoop: hdfs API示例
利用hdfs的api,可以实现向hdfs的文件.目录读写,利用这一套API可以设计一个简易的山寨版云盘,见下图: 为了方便操作,将常用的文件读写操作封装了一个工具类: import org.apach ...
【HDFS API编程】从本地拷贝文件，从本地拷贝大文件，拷贝HDFS文件到本地
接着之前继续API操作的学习 CopyFromLocalFile: 顾名思义,从本地文件拷贝 /** * 使用Java API操作HDFS文件系统 * 关键点: * 1)create Configur ...
【HDFS API编程】查看HDFS文件内容、创建文件并写入内容、更改文件名
首先,重点重复重复再重复: /** * 使用Java API操作HDFS文件系统 * 关键点: * 1)创建 Configuration * 2)获取 FileSystem * 3)...剩下的就是 ...
【HDFS API编程】jUnit封装-改写创建文件夹
首先:什么是jUnit 回顾: https://www.cnblogs.com/Liuyt-61/p/10374732.html 上一节我们知道: /** * 使用Java API操作HDFS文件系 ...
【HDFS API编程】第一个应用程序的开发-创建文件夹
/** * 使用Java API操作HDFS文件系统 * 关键点: * 1)创建 Configuration * 2)获取 FileSystem * 3)...剩下的就是 HDFS API的操作了*/ ...
【HDFS API编程】开发环境搭建
使用HDFS API的方式来操作HDFS文件系统 IDEA Java 使用Maven来管理项目先打开IDEA,New Project 创建GAV然后next 默认使用的有idea内置的Maven,可 ...
Hadoop学习之路（十）HDFS API的使用
HDFS API的高级编程 HDFS的API就两个:FileSystem 和Configuration 1.文件的上传和下载 package com.ghgj.hdfs.api; import org ...
[转] Hadoop入门系列（一）Window环境下搭建hadoop和hdfs的基本操作
转自:https://blog.csdn.net/qq_32938169/article/details/80209083 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载 ...
Hadoop（五）：HDFS的JAVA API基本操作
HDFS的JAVA API操作 HDFS在生产应用中主要是客户端的开发,其核心步骤是从HDFS提供的api中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件. 主 ...

随机推荐

PC端网站跳转手机端网站
<SCRIPT LANGUAGE="JavaScript"> function mobile_device_detect(url) { var thisOS=navig ...
cin关闭同步[转]
很多人会说cin的速度比scanf慢很多, 其实不然. cin慢的原因主要在于默认cin与stdin总是保持同步, 这一步是消耗时间大户. 只需要加上ios::sync_with_stdio(fals ...
强大的PHP一句话后门
强悍的PHP一句话后门这类后门让网站.服务器管理员很是头疼,经常要换着方法进行各种检测,而很多新出现的编写技术,用普通的检测方法是没法发现并处理的. 今天我们细数一些有意思的PHP一句话木马. 1 ...
简易web-slide
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
百度NLP二面-电话面
实验室项目:1.实验室方向 2.用两分钟介绍自己的项目,创新点在哪里个人项目: 1.自己实现的贝叶斯分类器,目的,怎么做的 2.怎么计算各个分类的先验.(因为我使用的训练预料是每个分类10篇 ...
【58沈剑架构系列】lvs为何不能完全替代DNS轮询
上一篇文章“一分钟了解负载均衡的一切”引起了不少同学的关注,评论中大家争论的比较多的一个技术点是接入层负载均衡技术,部分同学持这样的观点: 1)nginx前端加入lvs和keepalived可以替代“ ...
Loadrunner脚本开发规范
Loadrunner脚本开发规范目录 1.一般约定... 3 2.代码注释约定... 4 3.格式化代码... 5 1.一般约定 1.1具体脚本规则,必须在具体代码中加注释,以便脚本开发人员阅读和理 ...
Knockout介绍
Knockout.js是什么? Knockout是一款很优秀的JavaScript库,它可以帮助你仅使用一个清晰整洁的底层数据模型(data model)即可创建一个富文本且具有良好的显示和编辑功能的 ...
Spark 源码解析 : DAGScheduler中的DAG划分与提交
一.Spark 运行架构 Spark 运行架构如下图: 各个RDD之间存在着依赖关系,这些依赖关系形成有向无环图DAG,DAGScheduler对这些依赖关系形成的DAG,进行Stage划分,划分的规 ...
java.io.writer API 以及源码解读
声明我看的是java7的API文档. 如下图所示,java.io.writer 继承了java.lang.Object,实现的接口有Closeable, Flushable, Appendable, ...

HDFS API基本操作

HDFS API基本操作的更多相关文章

随机推荐

热门专题