java 简单操作HDFS

创建java 项目

package com.yw.hadoop273;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.*;

import org.apache.hadoop.io.IOUtils;

import org.junit.Test;

import java.io.ByteArrayOutputStream;

import java.io.InputStream;

import java.net.URL;

import java.net.URLConnection;

/**

 * 完成hdfs操作

 * @Auther: YW

 * @Date: 2019/9/11 21:51

 * @Description:

 */

public class TestHdfs {

    /**

     * 读取hdfs文件

     */

    @Test

    public void readFile() throws Exception{

        //注册url流处理器工厂(hdfs)

        URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());

        URL url = new URL("hdfs://http://192.168.248.129:8020/usr/local/hadoop/core-site.xml");

        URLConnection conn = url.openConnection();

        InputStream is = conn.getInputStream();

        byte[] buf = new byte[is.available()];

        is.read(buf);

        is.close();

        String str = new String(buf);

        System.out.println(str);

    }

    /**

     * 通过hadoop API访问文件

     */

    @Test

    public void readFileByAPI() throws Exception{

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://192.168.248.129:8020/");

        FileSystem fs = FileSystem.get(conf) ;

        Path p = new Path("/usr/local/hadoop/core-site.xml");

        FSDataInputStream fis = fs.open(p);

        byte[] buf = new byte[1024];

        int len = -1 ;

        ByteArrayOutputStream baos = new ByteArrayOutputStream();

        while((len = fis.read(buf)) != -1){

            baos.write(buf, 0, len);

        }

        fis.close();

        baos.close();

        System.out.println(new String(baos.toByteArray()));

    }

    /**

     * 通过hadoop API访问文件

     */

    @Test

    public void readFileByAPI2() throws Exception{

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://192.168.248.129:8020/");

        FileSystem fs = FileSystem.get(conf) ;

        ByteArrayOutputStream baos = new ByteArrayOutputStream();

        Path p = new Path("/usr/local/hadoop/core-site.xml");

        FSDataInputStream fis = fs.open(p);

        IOUtils.copyBytes(fis, baos, 1024);

        System.out.println(new String(baos.toByteArray()));

    }

    /**

     * mkdir 创建目录

     */

    @Test

    public void mkdir() throws Exception{

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://192.168.248.129:8020/");

        FileSystem fs = FileSystem.get(conf) ;

        fs.mkdirs(new Path("/usr/local/hadoop/myhadoop"));

    }

    /**

     * putFile 写文件

     */

    @Test

    public void putFile() throws Exception{

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://192.168.248.129:8020/");

        FileSystem fs = FileSystem.get(conf) ;

        FSDataOutputStream out = fs.create(new Path("/usr/local/hadoop/myhadoop/a.txt"));

        out.write("helloworld".getBytes());

        out.close();

    }

    /**

     * removeFile 删除目录 （注意权限）

     */

    @Test

    public void removeFile() throws Exception{

        Configuration conf = new Configuration();

        conf.set("fs.defaultFS", "hdfs://192.168.248.129:8020/");

        FileSystem fs = FileSystem.get(conf) ;

        Path p = new Path("/usr/local/hadoop/myhadoop");

        fs.delete(p, true);

    }

}

注意权限的修改

　　hdfs dfs -chmod 777 /usr/local/hadoop/


读到的内容


创建目录文件

完成。。

java 简单操作HDFS的更多相关文章

Java 简单操作hdfs API
注:图片如果损坏,点击文章链接:https://www.toutiao.com/i6632047118376780295/ 启动Hadoop出现问题:datanode的clusterID 和 name ...
使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
Java代码操作HDFS测试类
1.Java代码操作HDFS需要用到Jar包和Java类 Jar包: hadoop-common-2.6.0.jar和hadoop-hdfs-2.6.0.jar Java类: java.net.URL ...
大数据之路week07--day01（HDFS学习，Java代码操作HDFS，将HDFS文件内容存入到Mysql）
一.HDFS概述数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统 ...
Hadoop Java API操作HDFS文件系统（Mac）
1.下载Hadoop的压缩包 tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/ 2.关联jar包在 ...
使用Java Api 操作HDFS
如题我就是一个标题党就是使用JavaApi操作HDFS,使用的是MAVEN,操作的环境是Linux 首先要配置好Maven环境,我使用的是已经有的仓库,如果你下载的jar包速度慢,可以改变Ma ...
大数据-09-Intellij idea 开发java程序操作HDFS
主要摘自 http://dblab.xmu.edu.cn/blog/290-2/ 简介本指南介绍Hadoop分布式文件系统HDFS,并详细指引读者对HDFS文件系统的操作实践.Hadoop分布式文件 ...
Java代码操作HDFS(在/user/root/下面創建目錄)
1.创建HDFS目录并打成jar包 package Hdfs; import java.io.IOException; import java.net.URI; import org.apache.h ...
hadoop 》》 django 简单操作hdfs 语句
>> from django.shortcuts import render # Create your views here. from hdfs.client import Clien ...

随机推荐

应急响应系列之OA被入侵挖矿分析报告
一基本情况 1.1 简要此事件是去年应急处置时完成的报告,距今有半年时间了.一直存在电脑里,最近准备完善应急响应中遇到的各类安全事件,这篇文章作为这一系列的开端. 对于 Linux 安全检查,个 ...
《Linux设备驱动程序》编译LDD3的scull驱动问题总结***
由于Linux内核版本更新的原因,LDD3(v2.6.10)提供的源码无法直接使用,下面是本人编译scull源码时出现的一些问题及解决方法.编译环境:Ubuntu 10.04 LTS(kernel v ...
Django微信小程序后台开发教程
本文链接:https://blog.csdn.net/qq_43467898/article/details/83187698Django微信小程序后台开发教程1 申请小程序,创建hello worl ...
python 设计模式之组合模式Composite Pattern
#引入一文件夹对我们来说很熟悉,文件夹里面可以包含文件夹,也可以包含文件. 那么文件夹是个容器,文件夹里面的文件夹也是个容器,文件夹里面的文件是对象. 这是一个树形结构咱们生活工作中常用的一种结构 ...
小D课堂 - 零基础入门SpringBoot2.X到实战_第9节 SpringBoot2.x整合Redis实战_39、SpringBoot2.x整合redis实战讲解
笔记 3.SpringBoot2.x整合redis实战讲解简介:使用springboot-starter整合reids实战 1.官网:https://docs.spring.io/spring-bo ...
Python脚本实现Linux/MAC中Xmind Zen去水印等其他功能的过程（V0.1）
说明本脚本仅作为学习使用,请勿用于任何商业用途.本文为原创,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接和本声明.功能简介去除软件右上角激活按钮去除导出时激活弹窗去除导出PDF文 ...
MyBatis原理总结(前期准备)
1.不同框架解决不用问题,框架封装了很多细节,开发者可以使用简单的方式实现功能. 2.三层架构: 1.表现层 2.业务层 3.持久层都有相应的处理框架. 3.持久层的技术解决方案: JDBC技 ...
【Mac】解决macos安装升级时报错安装所选更新时发生错误的问题
1 系统更新macjave 更新一直失败: 2 解决方法为:重新启动Mac,并按住Command+R进入恢复模式,找到Terminal后输入csrutil disable,然后重启Mac,再次下载并 ...
Glide图片加载过程(简)
iceIC 关注 2018.10.25 20:53* 字数 906 阅读 529评论 0喜欢 1 调研版本为4.7.1为了更加简单的理解,会将函数代码简化,详细代码请自行照源码对比 Glide用法 G ...
[ jenkins ] git+jenkins+maven + ansible 部署java程序
1. 工具介绍 git:版本控制,一般都是托管到代码仓库的.如 github.coding.gitlab (本文以 coding 为例) jenkins:持续集成工具之一,也是最常用的工具,主要工作就 ...

java 简单操作HDFS

java 简单操作HDFS的更多相关文章

随机推荐

热门专题