使用Java Api 操作HDFS

如题我就是一个标题党就是使用JavaApi操作HDFS，使用的是MAVEN，操作的环境是Linux

首先要配置好Maven环境，我使用的是已经有的仓库，如果你下载的jar包速度慢，可以改变Maven 下载jar包的镜像站改为阿里云。

贴一下 pom.xml

使用到的jar包

<dependencies>

        <dependency>

            <groupId>junit</groupId>

            <artifactId>junit</artifactId>

            <version>4.10</version>

        </dependency>

        <!-- hadoop Client -->

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-client</artifactId>

            <version>${hadoop.version}</version>

        </dependency>

</dependencies>

然后就是操作HDFS的代码

package com.zuoyan.hadoop.hdfs;

import java.io.File;

import java.io.FileInputStream;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

/**

 * use java api operate hdfs

 *

 * @author beifeng

 *

 */

public class HdfsApp {

    // get FileSystem

    public static FileSystem getFileSystem() throws Exception {

        Configuration conf = new Configuration();

        FileSystem fileSystem = FileSystem.get(conf);

        return fileSystem;

    }

    public static void read(String fileName) throws Exception {

        FileSystem fileSystem = getFileSystem();

        // read Path

        Path readPath = new Path(fileName);

        FSDataInputStream inStream = fileSystem.open(readPath);

        try {

            IOUtils.copyBytes(inStream, System.out, 4096, false);

        } catch (Exception e) {

            // TODO: handle exception

            e.printStackTrace();

        } finally {

            // if Exception close Stream

            IOUtils.closeStream(inStream);

        }

    }

    public static void main(String[] args) throws Exception{

            //String fileName = "/user/beifeng/mapreduce/wordcount/input/wc.input";

            //read(fileName);

            FileSystem fileSystem = getFileSystem();

            //write path

            String putFileName = "/user/beifeng/put-wc.input";

            Path writePath = new Path(putFileName);

            FSDataOutputStream outputStream = fileSystem.create(writePath);

            FileInputStream inputStream = new FileInputStream(

                    new File("/opt/modules/hadoop-2.5.0/wc.input"));

            try {

                IOUtils.copyBytes(inputStream, outputStream, 4096,false);

            } catch (Exception e) {

                // TODO: handle exception

                inputStream.close();

                outputStream.close();

            }

    }

}

思路可以使用Java操作hdfs的api 制作一个基于HDFS的云盘，可以对文件进行上传、删除、移动目录、查看目录，但是不可以对文件的内容进行修改！

使用Java Api 操作HDFS的更多相关文章

使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
Hadoop Java API操作HDFS文件系统（Mac）
1.下载Hadoop的压缩包 tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/ 2.关联jar包在 ...
hadoop学习笔记（五）：java api 操作hdfs
HDFS的Java访问接口 1)org.apache.hadoop.fs.FileSystem 是一个通用的文件系统API,提供了不同文件系统的统一访问方式. 2)org.apache.hadoop. ...
使用java api操作HDFS文件
实现的代码如下: import java.io.IOException; import java.net.URI; import java.net.URISyntaxException; import ...
Hadoop之HDFS（三）HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
HDFS 05 - HDFS 常用的 Java API 操作
目录 0 - 配置 Hadoop 环境(Windows系统) 1 - 导入 Maven 依赖 2 - 常用类介绍 3 - 常见 API 操作 3.1 获取文件系统(重要) 3.2 创建目录.写入文件 ...
JAVA API 实现hdfs文件操作
java api 实现hdfs 文件操作会出现错误提示: Permission denied: user=hp, access=WRITE, inode="/":hdfs:supe ...
大数据-09-Intellij idea 开发java程序操作HDFS
主要摘自 http://dblab.xmu.edu.cn/blog/290-2/ 简介本指南介绍Hadoop分布式文件系统HDFS,并详细指引读者对HDFS文件系统的操作实践.Hadoop分布式文件 ...
Hadoop_07_HDFS的Java API 操作
通过Java API来访问HDFS 1.Windows上配置环境变量解压Hadoop,然后把Hadoop的根目录配置到HADOOP_HOME环境变量里面然后把HADOOP_HOME/lib和HAD ...

随机推荐

jQuery选择器--:selected和:checked
:selected 概述匹配所有选中的option元素 <!DOCTYPE html> <html> <head> <meta charset=" ...
samba共享目录无法访问的一般解决方案，非用户登录和读写权限问题
配smb,被第四点坑了很久,特此转载. 由于这5点都是比较普通的情况,不涉及用户登录和读写权限问题 1)关闭防火墙: #sevice iptables stop 2)修改 /etc/samba/smb ...
【2017-03-13】Tsql 数学函数、字符串函数、转换函数、时间日期函数
一.数学函数(针对值类型操作) 1.ceiling():取上限只要小数点后有数字大于0,整数位自动进1 2.floor():取下限将小数点位舍去,不管小数点位大小 3.round(四舍五入的值,保 ...
OpenCV-3.3.0测试
安装包目录下/samples/cpp里是各种例程其中example_cmake里CMakeLists.txt已写好,直接cmake,make就可以,example.cpp是一个调用笔记本摄像头并显示 ...
使用Python中的config配置
Python中有ConfigParser类,可以很方便的从配置文件中读取数据(如DB的配置,路径的配置),所以可以自己写一个函数,实现读取config配置. config文件的写法比较简单,[sect ...
转：wcf大文件传输解决之道（1）
首先声明,文章思路源于MSDN中徐长龙老师的课程整理,加上自己的一些心得体会,先总结如下: 在应对与大文件传输的情况下,因为wcf默认采用的是缓存加载对象,也就是说将文件包一次性接受至缓存中,然后生成 ...
python sqlite3 数据库操作
python sqlite3 数据库操作 SQLite3是python的内置模块,是一款非常小巧的嵌入式开源数据库软件. 1. 导入Python SQLite数据库模块 import sqlite3 ...
注意！list和array是不同的
python中的list是python的内置数据类型,list中的数据类型不必相同的,而array的中的数据类型必须全部相同. numpy中封装的array有很强大的功能,里面存放的都是相同的数据类 ...
java之异常统一处理
spring-mvc.xml  <aop:aspectj-autoproxy/> <beans:bean id="controllerA ...
人人网（cookie登录）
有时候,我们在爬取一些网页之前必需要登录该网站,比如说我想爬取我的人人网主页内容. 1.打开:www.renren.com 2.输入用户名和密码,登录网站18679030315 3.个人首页,如下图: ...

使用Java Api 操作HDFS

使用Java Api 操作HDFS的更多相关文章

随机推荐

热门专题