hadoop中常用的hdfs代码操作

一：向HDFS中上传任意文本文件，如果指定的文件在HDFS中已经存在，由用户指定是追加到原有文件末尾还是覆盖原有的文件：

 package hadoopTest;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.*;

 import java.io.*;

 public class HDFSApi {

      /**

      * 判断路径是否存在

      */

     public static boolean test(Configuration conf, String path) throws IOException {

         FileSystem fs = FileSystem.get(conf);

         return fs.exists(new Path(path));

     }

     /**

      * 复制文件到指定路径

      * 若路径已存在，则进行覆盖

      */

     public static void copyFromLocalFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException {

         FileSystem fs = FileSystem.get(conf);

         Path localPath = new Path(localFilePath);

         Path remotePath = new Path(remoteFilePath);

         /* fs.copyFromLocalFile 第一个参数表示是否删除源文件，第二个参数表示是否覆盖 */

         fs.copyFromLocalFile(false, true, localPath, remotePath);

         fs.close();

     }

     /**

      * 追加文件内容

      */

     public static void appendToFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException {

         FileSystem fs = FileSystem.get(conf);

         Path remotePath = new Path(remoteFilePath);

         /* 创建一个文件读入流 */

         FileInputStream in = new FileInputStream(localFilePath);

         /* 创建一个文件输出流，输出的内容将追加到文件末尾 */

         FSDataOutputStream out = fs.append(remotePath);

         /* 读写文件内容 */

         byte[] data = new byte[1024];

         int read = -1;

         while ( (read = in.read(data)) > 0 ) {

             out.write(data, 0, read);

         }

         out.close();

         in.close();

         fs.close();

     }

     /**

      * 主函数

      */

     public static void main(String[] args) {

         Configuration conf = new Configuration();

     conf.set("fs.default.name","hdfs://localhost:9000");

         String localFilePath = "/home/flyuz/text.txt";    // 本地路径

         String remoteFilePath = "/text.txt";    // HDFS路径

         String choice = "append";    // 若文件存在则追加到文件末尾

 //        String choice = "overwrite";    // 若文件存在则覆盖

         try {

             /* 判断文件是否存在 */

             Boolean fileExists = false;

             if (HDFSApi.test(conf, remoteFilePath)) {

                 fileExists = true;

                 System.out.println(remoteFilePath + " 已存在.");

             } else {

                 System.out.println(remoteFilePath + " 不存在.");

             }

             /* 进行处理 */

             if ( !fileExists) { // 文件不存在，则上传

                 HDFSApi.copyFromLocalFile(conf, localFilePath, remoteFilePath);

                 System.out.println(localFilePath + " 已上传至 " + remoteFilePath);

             } else if ( choice.equals("overwrite") ) {    // 选择覆盖

                 HDFSApi.copyFromLocalFile(conf, localFilePath, remoteFilePath);

                 System.out.println(localFilePath + " 已覆盖 " + remoteFilePath);

             } else if ( choice.equals("append") ) {   // 选择追加

                 HDFSApi.appendToFile(conf, localFilePath, remoteFilePath);

                 System.out.println(localFilePath + " 已追加至 " + remoteFilePath);

             }

         } catch (Exception e) {

             e.printStackTrace();

         }

     }

 }

追加或覆盖

二：从HDFS中下载指定文件，如果本地文件与要下载的文件名称相同，则自动对下载的文件重命名；

 package hadoopTest;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.*;

 import java.io.*;

 public class HDFSApi {

     /**

      * 下载文件到本地 判断本地路径是否已存在，若已存在，则自动进行重命名

      */

     public static void copyToLocal(Configuration conf, String remoteFilePath, String localFilePath) throws IOException {

         FileSystem fs = FileSystem.get(conf);

         Path remotePath = new Path(remoteFilePath);

         File f = new File(localFilePath);

         /* 如果文件名存在，自动重命名(在文件名后面加上 _0, _1 ...) */

         if (f.exists()) {

             System.out.println(localFilePath + " 已存在.");

             Integer i = 0;

             while (true) {

                 f = new File(localFilePath + "_" + i.toString());

                 if (!f.exists()) {

                     localFilePath = localFilePath + "_" + i.toString();

                     break;

                 }

             }

             System.out.println("将重新命名为: " + localFilePath);

         }

         // 下载文件到本地

         Path localPath = new Path(localFilePath);

         fs.copyToLocalFile(remotePath, localPath);

         fs.close();

     }

     /**

      * 主函数

      */

     public static void main(String[] args) {

         Configuration conf = new Configuration();

         conf.set("fs.default.name", "hdfs://localhost:9000");

         String localFilePath = "/home/flyuz/text.txt"; // 本地路径

         String remoteFilePath = "/text.txt"; // HDFS路径

         try {

             HDFSApi.copyToLocal(conf, remoteFilePath, localFilePath);

             System.out.println("下载完成");

         } catch (Exception e) {

             e.printStackTrace();

         }

     }

 }

下载文件

三：将HDFS中指定文件的内容输出到终端中；

 package hadoopTest;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.*;

 import java.io.*;

 public class HDFSApi {

     /**

      * 读取文件内容

      */

     public static void cat(Configuration conf, String remoteFilePath) throws IOException {

         FileSystem fs = FileSystem.get(conf);

         Path remotePath = new Path(remoteFilePath);

         FSDataInputStream in = fs.open(remotePath);

         BufferedReader d = new BufferedReader(new InputStreamReader(in));

         String line = null;

         while ((line = d.readLine()) != null) {

             System.out.println(line);

         }

         d.close();

         in.close();

         fs.close();

     }

     /**

      * 主函数

      */

     public static void main(String[] args) {

         Configuration conf = new Configuration();

         conf.set("fs.default.name", "hdfs://localhost:9000");

         String remoteFilePath = "/text.txt"; // HDFS路径

         try {

             System.out.println("读取文件: " + remoteFilePath);

             HDFSApi.cat(conf, remoteFilePath);

             System.out.println("\n读取完成");

         } catch (Exception e) {

             e.printStackTrace();

         }

     }

 }

输出到终端

四：显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息；

 package hadoopTest;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.*;

 import java.io.*;

 import java.text.SimpleDateFormat;

 public class HDFSApi {

     /**

      * 显示指定文件的信息

      */

     public static void ls(Configuration conf, String remoteFilePath) throws IOException {

         FileSystem fs = FileSystem.get(conf);

         Path remotePath = new Path(remoteFilePath);

         FileStatus[] fileStatuses = fs.listStatus(remotePath);

         for (FileStatus s : fileStatuses) {

             System.out.println("路径: " + s.getPath().toString());

             System.out.println("权限: " + s.getPermission().toString());

             System.out.println("大小: " + s.getLen());

             /* 返回的是时间戳,转化为时间日期格式 */

             Long timeStamp = s.getModificationTime();

             SimpleDateFormat format = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

             String date = format.format(timeStamp);

             System.out.println("时间: " + date);

         }

         fs.close();

     }

     /**

      * 主函数

      */

     public static void main(String[] args) {

         Configuration conf = new Configuration();

         conf.set("fs.default.name", "hdfs://localhost:9000");

         String remoteFilePath = "/text.txt"; // HDFS路径

         try {

             System.out.println("读取文件信息: " + remoteFilePath);

             HDFSApi.ls(conf, remoteFilePath);

             System.out.println("\n读取完成");

         } catch (Exception e) {

             e.printStackTrace();

         }

     }

 }

ls-l

hadoop中常用的hdfs代码操作的更多相关文章

Java中常用的设计模式代码与理解
Java中常用的设计模式代码与理解一.单例模式 1.饿汉式 (太饿了,类加载的时候就创建实例) /** * 饿汉式单例模式 */ public class HungrySingleInstance ...
Hadoop中常用的InputFormat、OutputFormat（转）
Hadoop中的Map Reduce框架依赖InputFormat提供数据,依赖OutputFormat输出数据,每一个Map Reduce程序都离不开它们.Hadoop提供了一系列InputForm ...
【Hadoop】Hadoop 中 RPC框架原理、代码示例
0.内容 1.hadoop中的RPC框架封装思想 2.Hadoop RPC 实现方法 3.服务调用动态转发和负载均衡的实现思考 4.协议代码: package com.ares.hadoop.rpc; ...
SELECT中常用的子查询操作
MySQL中的子查询是在MySQL中经常使用到的一个操作,不仅仅是用在DQL语句中,在DDL语句.DML语句中也都会常用到子查询. 子查询的定义: 子查询是将一个查询语句嵌套在另一个查询语句中: 在 ...
使用配置hadoop中常用的Linux(ubuntu)命令
生成key: $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized ...
总结工作中常用的PHP代码
[目录] ◆PHP常用的代码 ◆HTML常用代码 [值传递和引用传递] [单例模式] [魔术常量] [代码调试(自定义一个简单的debug函数)] [thinkphp多表查询] [获取客户端IP地 ...
Java中常用到的文件操作那些事（一）——替换doc文档模板，生成真实合同案例
工作中,我们时常会遇到一些操作文件的操作,比如在线生成合同模板,上传/下载/解析Excel,doc文档转为pdf等操作.本文就已工作中遇到的在线生成合同为例,简要地介绍一种文档替换写法. 本文目的:给 ...
java程序中中常用到的linux操作
1.解压命令 tar -zxvf filename.tar.gz 其中zxvf含义分别如下 z: gzip 压缩格式 x: extract 解压 v: verbose 详细信息 2.lin ...
Java中常用到的文件操作那些事(二)——使用POI解析Excel的两种常用方式对比
最近生产环境有个老项目一直内存报警,不时的还出现内存泄漏,导致需要重启服务器,已经严重影响正常服务了.获取生成dump文件后,使用MAT工具进行分析,发现是其中有个Excel文件上传功能时,经常会导致 ...

随机推荐

java 最差实践
HashMap size 陷阱: 错误写法: Map map = new HashMap(collection.size()); for (Object o : collection) { map.p ...
vue-cli脚手架build目录下utils.js工具配置文件详解
此文章用来解释vue-cli脚手架build目录中的utils.js配置文件此配置文件是vue开发环境的wepack相关配置文件,主要用来处理css-loader和vue-style-loader ...
MFC 菜单栏杂记
1.关于为毛要使用detach()函数 CMenu menu; menu.LoadMenu(IDR_MAINFRAME); SetMenu(&menu); menu.Detach(); //如 ...
Python——List
一.集成开发环境集成开发环境(IDE,Integrated development Enviroment)是用于提供程序开发环境的应用程序,一般包括代码编辑器.编译器.调试器和图形用户界面等工具.集 ...
leetcode783
对BST树进行中序遍历,得到递增序列,然后依次计算相邻两元素之间的差,并保存最小的差. class Solution { public: vector<TreeNode*> V; void ...
const与指针的纠缠
当使用带有const的指针时其实有两种意思.一种指的是你不能修改指针本身的内容,另一种指的是你不能修改指针指向的内容. 先说指向const的指针,它的意思是指针指向的内容是不能被修改的.它有两种写法. ...
【HDU3394】Railway
[题目描述] 有一个公园有n个景点,公园的管理员准备修建m条道路,并且安排一些形成回路的参观路线.如果一条道路被多条道路公用,那么这条路是冲突的:如果一条道路没在任何一个回路内,那么这条路是不冲突的 ...
SpringBoot22 Ajax跨域、SpringBoot返回JSONP、CSRF、CORS
1 扫盲知识 1.1 Ajax为什么存在跨域问题因为浏览器处于安全性的考虑不允许JS执行跨域请求. 1.2 浏览器为什么要限制JS的跨域访问如果浏览器允许JS的跨域请求就很容易造成 CSRF (C ...
Python3.7安装Django
一.系统环境操作系统:Win7 64位 Python版本:3.7 二.安装参考 Django的下载网址:https://www.djangoproject.com/download/ 当前最新版本: ...
面试题:Java集合面试题（40道）背1
Java集合框架为Java编程语言的基础,也是Java面试中很重要的一个知识点.这里,我列出了一些关于Java集合的重要问题和答案. 1.Java集合框架是什么?说出一些集合框架的优点? 每种编程语言 ...

hadoop中常用的hdfs代码操作

hadoop中常用的hdfs代码操作的更多相关文章

随机推荐

热门专题