HDFS文件读写操作（基础基础超基础）

环境

OS: Ubuntu 16.04 64-Bit
JDK: 1.7.0_80 64-Bit
Hadoop: 2.6.5

原理

《权威指南》有两张图，下次po上来好好聊一下

实测

读操作

创建在hadoop目录下myclass（放.java和.class文件）和input目录
在input目录下建立quangle.txt文件，并写入内容
将本地文件上传到hdfs的相应文件夹（笔者此处为/class4）中：

hadoop fs -copyFromLocal quangle.txt /class4/quangle.txt
配置hadoop-env.sh文件，添加HADOOP_CLASSPATH变量指向myclass
在myclass中建立FileSystemCat.java代码文件：
编译代码

javac -classpath ../share/hadoop/common/hadoop-common-2.6.5.jar FileSystemCat.java
由编译代码读HDFS文件

hadoop FileSystemCat /class4/quangle.txt

import java.io.InputStream;

import java.net.URI;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.*;

import org.apache.hadoop.io.IOUtils;

public class FileSystemCat {

    public static void main(String[] args) throws Exception {

        String uri = args[0];

        Configuration conf = new Configuration();

        FileSystem fs = FileSystem.get(URI.create(uri), conf);

        InputStream in = null;

        try {

            in = fs.open(new Path(uri));

            IOUtils.copyBytes(in, System.out, 4096, false);

        } finally {

            IOUtils.closeStream(in);

        }

    }

}

写操作

本地文件读入HDFS中

步骤几乎与写操作一致，主要看如何调用API

import java.io.File;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.OutputStream;

import java.net.URI;

// 以下调用到API均在hadoop-common-2.6.5.jar中

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.apache.hadoop.util.Progressable;

public class LocalFile2Hdfs {

  public static void main(String[] args) throws Exception {

    String local = args[0];	// 源文件地址

    String uri = args[1];	// 目标文件位置参数

    FileInputStream in = null;

    OutputStream out = null;

    Configuration conf = new Configuration();

    try {

      // 获取读入文件数据

      in = new FileInputStream(new File(local));

      // 获取目标文件信息

      FileSystem fs = FileSystem.get(URI.create(uri), conf);

      out = fs.create(new Path(uri), new Progressable() {

        // 显示进度，每次将64KB数据包写入datanode后打印一次

        public void progress() {

          System.out.println("*");

        }

      });

      in.skip(100);

      byte[] buffer = new byte[20];

      // 读去字符到buffer，再写入Path中

      int bytesRead = in.read(buffer);

      if(bytesRead >= 0) {

        out.write(buffer, 0, bytesRead);

      }

    } finally {

      IOUtils.closeStream(in);

      IOUtils.closeStream(out);

    }

  }

}

从HDFS上读文件并写入本地

代码如下：

import java.io.File;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.OutputStream;

import java.net.URI;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

public class Hdfs2LocalFile {

    public static void main(String[] args) throws Exception {

        String uri = args[0];

        String local = args[1];

        FSDataInputStream in = null;

        OutputStream out = null;

        Configuration conf = new Configuration();

        try {

            FileSystem fs = FileSystem.get(URI.create(uri), conf);

            in = fs.open(new Path(uri));

            out = new FileOutputStream(local);

            byte[] buffer = new byte[20];

            in.skip(100);

            int bytesRead = in.read(buffer);

            if (bytesRead >= 0) {

                out.write(buffer, 0, bytesRead);

            }

        } finally {

            IOUtils.closeStream(in);

            IOUtils.closeStream(out);

        }

    }

}

HDFS文件读写操作（基础基础超基础）的更多相关文章

java文件读写操作类
借鉴了项目以前的文件写入功能,实现了对文件读写操作的封装仅仅需要在读写方法传入路径即可(可以是绝对或相对路径) 以后使用时,可以在此基础上改进,比如: 写操作: 1,对java GUI中文本框中的内 ...
HDFS 文件读写过程
HDFS 文件读写过程 HDFS 文件读取剖析客户端通过调用FileSystem对象的open()来读取希望打开的文件.对于HDFS来说,这个对象是分布式文件系统的一个实例. Distributed ...
c语言文件读写操作总结
C语言文件读写操作总结 C语言文件操作一.标准文件的读写 1.文件的打开 fopen() 文件的打开操作表示将给用户指定的文件在内存分配一个FILE结构区,并将该结构的指针返回给用户程序,以后用户程 ...
[转]Android - 文件读写操作总结
转自:http://blog.csdn.net/ztp800201/article/details/7322110 Android - 文件读写操作总结分类: Android2012-03-05 ...
PHP文件读写操作之文件写入代码
在PHP网站开发中,存储数据通常有两种方式,一种以文本文件方式存储,比如txt文件,一种是以数据库方式存储,比如Mysql,相对于数据库存储,文件存储并没有什么优势,但是文件读写操作在基本的PHP开发 ...
Hadoop HDFS文件常用操作及注意事项
Hadoop HDFS文件常用操作及注意事项 1.Copy a file from the local file system to HDFS The srcFile variable needs t ...
Java 字节流实现文件读写操作（InputStream-OutputStream）
Java 字节流实现文件读写操作(InputStream-OutputStream) 备注:字节流比字符流底层,但是效率底下. 字符流地址:http://pengyan5945.iteye.com/b ...
Java 字符流实现文件读写操作（FileReader-FileWriter）
Java 字符流实现文件读写操作(FileReader-FileWriter) 备注:字符流效率高,但是没有字节流底层字节流地址:http://pengyan5945.iteye.com/blog/ ...
python(三)一个文件读写操作的小程序
我们要实现一个文件读写操作的小程序首先我们有一个文件我们要以"============"为界限,每一个角色分割成一个独立的txt文件,按照分割线走的话是分成 xiaoNa_1. ...

随机推荐

网络游戏开发-服务器（01）Asp.Net Core中的websocket，并封装一个简单的中间件
先拉开MSDN的文档,大致读一遍 (https://docs.microsoft.com/zh-cn/aspnet/core/fundamentals/websockets) WebSocket 是一 ...
java接口----继承（实现）方法
文中"实现"一词特指接口的继承. 一个类实现多个接口时,不能出现同名的默认方法. 一个类既要实现接口又要继承抽象类,先继承后实现. 一个抽象类可以继承多个接口(implements ...
题目1023：EXCEL排序
//都是泪啊,搞了半天,竟然是成绩的数据类型搞成了string,输出测试用例的次数竟然搞成了排序的类别...细节决定成败!!! 题目描述: Excel可以对一组纪录按任意指定列排序.现请你编写程序实现 ...
NYOJ一种排序
//最重要的收获就是懂得了,还可以调用库函数直接对结构体进行排序sort(const void *,const void *,cmp) /* bool cmp(rect c,rect d) { if( ...
codeforces 286E Ladies' Shop
题目大意:n个小于等于m的数,现在你需要在[1,m]中选择若干个数,使得选出的数能组成的所有数正好与n个数相同,给出最少要选多少个数. 题目分析: 结论一:选择的若干个数一定在n个数中. 证明:否则的 ...
CentOS 7主机名的弯弯绕绕
在CentOS 6中,修改主机名方式很简单,临时修改主机名使用hostname命令,永久修改主机名直接写进文件/etc/sysconfig/network中即可. 但在CentOS 7中,主机名就没那 ...
兄弟连教育分享：用CSS实现鼠标悬停提示的方法
兄弟连教育分享:用CSS实现鼠标悬停提示的方法本文,兄弟连HTML5培训,分享了纯CSS实现鼠标悬停提示的方法.给大家供大家参考.具体分析如下: 这是一款比较漂亮的鼠标悬停提示效果,用纯CSS代码实 ...
Vue之九数据劫持实现MVVM的数据双向绑定
vue是通过数据劫持的方式来做数据绑定的,其中最核心的方法便是通过Object.defineProperty()来实现对属性的劫持,达到监听数据变动的目的. 如果不熟悉defineProperty,猛 ...
canvas线条的属性
一.线条的帽子lineCap 取值:butt(默认值),round圆头,square方头 var canvas=document.getElementById("canvas"); ...
C语言中数据类型的取值范围
C语言中数据类型的取值范围如下:char -128 ~ +127 (1 Byte)short -32767 ~ + 32768 (2 Bytes)unsigned short 0 ~ 65536 (2 ...

HDFS文件读写操作（基础基础超基础）

环境

原理

实测

读操作

写操作

本地文件读入HDFS中

从HDFS上读文件并写入本地

HDFS文件读写操作（基础基础超基础）的更多相关文章

随机推荐

热门专题