Hadoop基础-通过IO流操作HDFS

　　　　　　　　　　　　　　　　　　Hadoop基础-通过IO流操作HDFS

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正杰

一.上传文件

 /*

 @author :yinzhengjie

 Blog:http://www.cnblogs.com/yinzhengjie/tag/Hadoop%E7%94%9F%E6%80%81%E5%9C%88/

 EMAIL:y1053419035@qq.com

 */

 package hdfs.yinzhengjie.org.cn;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.*;

 import org.apache.hadoop.io.IOUtils;

 import java.io.File;

 import java.io.FileInputStream;

 import java.net.URI;

 public class HdfsClient {

     public static void main(String[] args) throws Exception {

         putFileToHDFS();

     }

     public static void putFileToHDFS() throws Exception{

         //配合Hadoop的环境变量，如果没有配置可能会抛异常：“ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path”，还有一件事就是你的HADOOP_HOME的bin目录下必须得有winutils.exe

          System.setProperty("hadoop.home.dir", "D:\\yinzhengjie\\softwares\\hadoop-2.7.3");

          //创建配置信息对象

         Configuration conf = new Configuration();

         //获取文件系统，需要传入hdfs的链接地址，conf对象，以及操作的用户名

        FileSystem fs = FileSystem.get(new URI("hdfs://node105.yinzhengjie.org.cn:8020"),conf,"hdfs");

         //创建输入流

         FileInputStream inStream = new FileInputStream(new File("D:\\yinzhengjie\\data\\yinzhengjie.txt"));

         //获取输出路径

         String putFileName = "hdfs://node105.yinzhengjie.org.cn:8020/user/yinzhengjie/2018-11-04.txt";

         Path writePath = new Path(putFileName);

         //创建输出流

         FSDataOutputStream outStream = fs.create(writePath);

         //流对接

         try{

             IOUtils.copyBytes(inStream, outStream, 4096, false);

         }catch(Exception e){

             e.printStackTrace();

         }finally{

             //关闭流，释放资源

             IOUtils.closeStream(inStream);

             IOUtils.closeStream(outStream);

         }

     }

 }

二.下载文件

 /*

 @author :yinzhengjie

 Blog:http://www.cnblogs.com/yinzhengjie/tag/Hadoop%E7%94%9F%E6%80%81%E5%9C%88/

 EMAIL:y1053419035@qq.com

 */

 package hdfs.yinzhengjie.org.cn;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.FSDataInputStream;

 import org.apache.hadoop.fs.FileSystem;

 import org.apache.hadoop.fs.Path;

 import org.apache.hadoop.io.IOUtils;

 import java.io.File;

 import java.io.FileOutputStream;

 import java.net.URI;

 public class HdfsClient {

     public static void main(String[] args) throws Exception {

         getFileToHDFS();

     }

     public static void getFileToHDFS() throws Exception{

         //配合Hadoop的环境变量，如果没有配置可能会抛异常：“ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path”，还有一件事就是你的HADOOP_HOME的bin目录下必须得有winutils.exe

          System.setProperty("hadoop.home.dir", "D:\\yinzhengjie\\softwares\\hadoop-2.7.3");

          //创建配置信息对象

         Configuration conf = new Configuration();

         //获取文件系统，需要传入hdfs的链接地址，conf对象，以及操作的用户名

        FileSystem fs = FileSystem.get(new URI("hdfs://node105.yinzhengjie.org.cn:8020"),conf,"hdfs");

         //获取读取文件路径

         String filename = "hdfs://node105.yinzhengjie.org.cn:8020/user/yinzhengjie/2018-11-04.txt";

         //创建读取path

         Path readPath = new Path(filename);

         //创建建输入流

         FSDataInputStream inStream = fs.open(readPath);

         //创建输出流,指定本地路径

         FileOutputStream fos = new FileOutputStream(new File("D:\\yinzhengjie\\data\\output.txt"));

         try{

             //流对接输出到控制台

 //            IOUtils.copyBytes(inStream, System.out, 4096, false);

             //流对考输出到本地磁盘

             IOUtils.copyBytes(inStream,fos, conf);

         }catch(Exception e){

             e.printStackTrace();

         }finally{

             //释放资源

             IOUtils.closeStream(inStream);

             IOUtils.closeStream(fos);

             fos.close();

         }

     }

 }

三.定位读取文件

 /*

 @author :yinzhengjie

 Blog:http://www.cnblogs.com/yinzhengjie/tag/Hadoop%E7%94%9F%E6%80%81%E5%9C%88/

 EMAIL:y1053419035@qq.com

 */

 package hdfs.yinzhengjie.org.cn;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.FSDataInputStream;

 import org.apache.hadoop.fs.FileSystem;

 import org.apache.hadoop.fs.Path;

 import org.apache.hadoop.io.IOUtils;

 import java.io.FileOutputStream;

 import java.net.URI;

 public class HdfsClient {

     public static void main(String[] args) throws Exception {

         readFileSeek1();

         readFileSeek2();

     }

     //读取第一个块大小，128M

     public static void readFileSeek1() throws Exception{

         //配合Hadoop的环境变量，如果没有配置可能会抛异常：“ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path”，还有一件事就是你的HADOOP_HOME的bin目录下必须得有winutils.exe

          System.setProperty("hadoop.home.dir", "D:\\yinzhengjie\\softwares\\hadoop-2.7.3");

          //创建配置信息对象

         Configuration conf = new Configuration();

         //获取文件系统，需要传入hdfs的链接地址，conf对象，以及操作的用户名

        FileSystem fs = FileSystem.get(new URI("hdfs://node105.yinzhengjie.org.cn:8020"),conf,"hdfs");

         //获取输入流路径

         Path path = new Path("hdfs://node105.yinzhengjie.org.cn:8020//yinzhengjie/cloudera-manager.tar.gz");

         //打开输入流

         FSDataInputStream fis = fs.open(path);

         //创建输出流

         FileOutputStream fos = new FileOutputStream("D:\\yinzhengjie\\data\\cloudera-manager-1.tar.gz");

         //定义缓冲区大小是1024

         byte[] buf = new byte[1024];

         //读取一个128M的文件

         for (int i = 0; i < 128 * 1024; i++) {

             //将数据从输入流读出然后在写入输出流。

             fis.read(buf);

             fos.write(buf);

         }

         //关闭流

         IOUtils.closeStream(fis);

         IOUtils.closeStream(fos);

     }

     //将128M后续的大小都读取出来

     public static void readFileSeek2() throws Exception{

         //配合Hadoop的环境变量，如果没有配置可能会抛异常：“ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path”，还有一件事就是你的HADOOP_HOME的bin目录下必须得有winutils.exe

         System.setProperty("hadoop.home.dir", "D:\\yinzhengjie\\softwares\\hadoop-2.7.3");

         //创建配置信息对象

         Configuration conf = new Configuration();

         //获取文件系统，需要传入hdfs的链接地址，conf对象，以及操作的用户名

         FileSystem fs = FileSystem.get(new URI("hdfs://node105.yinzhengjie.org.cn:8020"),conf,"hdfs");

         //获取输入流路径

         Path path = new Path("hdfs://node105.yinzhengjie.org.cn:8020//yinzhengjie/cloudera-manager.tar.gz");

         //打开输入流

         FSDataInputStream fis = fs.open(path);

         //创建输出流

         FileOutputStream fos = new FileOutputStream("D:\\yinzhengjie\\data\\cloudera-manager-2.tar.gz");

         //定位偏移量（第二块的首位,1024*1024就是1M，也就是说他的起始位置是从128M开始的！）

         fis.seek(1024 * 1024 * 128);

         //流对接

         IOUtils.copyBytes(fis, fos, 1024);

         //关闭资源

         IOUtils.closeStream(fis);

         IOUtils.closeStream(fos);

     }

 }

 /**

  *    将数据写入到本地后，可以使用cmd窗口进入到“D:\yinzhengjie\data”目录中，并执行：D:\yinzhengjie\data>type cloudera-manager-2.tar.gz >> cloudera-manager-1.tar.gz

  * 之后你可以拿到完整的数据，也可以解压该文件的详细信息。

  */

Hadoop基础-通过IO流操作HDFS的更多相关文章

io 流操作hdfs
hdfs 文件上传本地 --------> 文件系统对象 --------> hdfs 文件系统输入流 ...
Hadoop基础-MapReduce的Join操作
Hadoop基础-MapReduce的Join操作作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.连接操作Map端Join(适合处理小表+大表的情况) no001 no002 ...
java基础之IO流（二）之字符流
java基础之IO流(二)之字符流字符流,顾名思义,它是以字符为数据处理单元的流对象,那么字符流和字节流之间的关系又是如何呢? 字符流可以理解为是字节流+字符编码集额一种封装与抽象,专门设计用来读写 ...
java基础之IO流（一）字节流
java基础之IO流(一)之字节流 IO流体系太大,涉及到的各种流对象,我觉得很有必要总结一下. 那什么是IO流,IO代表Input.Output,而流就是原始数据源与目标媒介的数据传输的一种抽象.典 ...
Java IO流操作汇总： inputStream 和 outputStream【转】
我们在进行Android java 开发的时候,经常会遇到各种IO流操作.IO流操作一般分为两类:字符流和字节流.以“Reader”结尾都是字符流,操作的都是字符型的数据:以“Stream”结尾的都是 ...
IO流----操作文件的9种方法代码实现
IO流----操作文件的9种方法代码实现: 1:使用字节流读写数据: 四种方式: method1: 每次读写一个字节,边读边写: /* * 复制文本文件. * * 数据源:从哪里来 ...
Java基础之IO流整理
Java基础之IO流 Java IO流使用装饰器设计模式,因此如果不能理清其中的关系的话很容易把各种流搞混,此文将简单的几个流进行梳理,后序遇见新的流会继续更新(本文下方还附有xmind文件链接) 抽 ...
python IO流操作
python IO流操作学习完本篇,你将会独立完成实现操作系统中文件及文件目录的拷贝功能. 将目标图片拷贝到指定的目录中实现一个自动阅卷程序, Right.txt保存正确答案,xx(学生姓名). ...
Hadoop学习(2)-java客户端操作hdfs及secondarynode作用
首先要在windows下解压一个windows版本的hadoop 然后在配置他的环境变量,同时要把hadoop的share目录下的hadoop下的相关jar包拷贝到esclipe 然后Build Pa ...

随机推荐

Cent OS安装使用ffmpeg（完整版）
Cent OS安装使用ffmpeg centos作为主流后台linux 系统,ffmpeg作为视频流解析的主力,尤其是ffmpeg配合opencv使用,则是视觉操作的基础版本: ffmpeg3.1 ...
Go中的Init函数
init函数会在main函数执行之前进行执行.init用在设置包.初始化变量或者其他要在程序运行前优先完成的引导工作. 举例:在进行数据库注册驱动的时候. 这里有init函数 package post ...
mysql-tar包搭建过程
第一: wget https://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.22-linux-glibc2.12-x86_64.tar.gz tar z ...
linux缺失gcc的安装方法
linux安装gcc操作 1.查看linux是否有gcc文件这个是没有挂载的 2. 使用df,查看系统光盘的挂载位置 3.卸载分区 umount /dev/sr0 4.将redhat系统光盘重新载入 ...
BZOJ4356Ceoi2014 Wall——堆优化dijkstra+最短路树
题目描述给出一个N*M的网格图,有一些方格里面存在城市,其中首都位于网格图的左上角.你可以沿着网络的边界走,要求你走的路线是一个环并且所有城市都要被你走出来的环圈起来,即想从方格图的外面走到任意一个 ...
visual studio 显示引用关系作者更改项
visual studio 2017中,每个类或者方法顶部会显示此方法的引用关系或者作者更改项:这个功能极大了提高了我们代码的定位效率:不过有时候却发现每一行代码都有,会增加我们屏幕显示内容,有时候看 ...
luogu P2680 运输计划 (二分答案+树上差分）
题目背景公元 20442044 年,人类进入了宇宙纪元. 题目描述公元20442044 年,人类进入了宇宙纪元. L 国有 nn 个星球,还有 n-1n−1 条双向航道,每条航道建立在两个星球之间 ...
MT【292】任意存在求最值
已知向量$\textbf{a},\textbf{b}$满足:$|\textbf{a}|=|\textbf{b}|=1,\textbf{a}\cdot\textbf{b}=\dfrac{1}{2},\t ...
css- @media @font-face 的理解
在我的博客园定制的css中有2个之前没有遇到的csss属性@font-face @media @media 在css文件中的使用如下 ` @media screen and (max-width: 1 ...
BZOJ4669抢夺(费用流+二分答案)
题目描述大战将至, 美国决定实行计划经济.美国西部总共有 N 个城市,编号为 0 ∼ N − 1,以及 M 条道路,道路是单向的.其中城市 0 是一个大城市,里面住着 K 个人,而城市 N − ...

Hadoop基础-通过IO流操作HDFS

Hadoop基础-通过IO流操作HDFS的更多相关文章

随机推荐

热门专题