Hadoop HDFS文件操作

1、创建目录

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class MakeDir {

	public static void main(String[] args) throws IOException {

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		Path path = new Path("/user/hadoop/data/20130709");

		fs.create(path);

		fs.close();

	}

}

2、删除目录

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class DeleteDir {

	public static void main(String[] args) throws IOException {

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		Path path = new Path("/user/hadoop/data/20130710");

		fs.delete(path);

		fs.close();

	}

}

3、写文件

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class WriteFile {

	public static void main(String[] args) throws IOException {

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		Path path = new Path("/user/hadoop/data/write.txt");

		FSDataOutputStream out = fs.create(path);

		out.writeUTF("da jia hao,cai shi zhen de hao!");

		fs.close();

	}

}

4、读文件

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class ReadFile {

	public static void main(String[] args) throws IOException {

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		Path path = new Path("/user/hadoop/data/write.txt");

		if(fs.exists(path)){

			FSDataInputStream is = fs.open(path);

			FileStatus status = fs.getFileStatus(path);

			byte[] buffer = new byte[Integer.parseInt(String.valueOf(status.getLen()))];

			is.readFully(0, buffer);

			is.close();

            fs.close();

            System.out.println(buffer.toString());

		}

	}

}

5、上传本地文件到HDFS

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class CopyFromLocalFile {

	public static void main(String[] args) throws IOException {

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		Path src = new Path("/home/hadoop/word.txt");

		Path dst = new Path("/user/hadoop/data/");

		fs.copyFromLocalFile(src, dst);

		fs.close();

	}

}

6、删除文件

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class DeleteFile {

	public static void main(String[] args) throws IOException {

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		Path path = new Path("/user/hadoop/data/word.txt");

		fs.delete(path);

		fs.close();

	}

}

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class GetAllChildFile {

	static Configuration conf = new Configuration();

	public static void main(String[] args)throws IOException {

		FileSystem fs = FileSystem.get(conf);

		Path path = new Path("/user/hadoop");

		getFile(path,fs);

		//fs.close();

	}

	public static void getFile(Path path,FileSystem fs) throws IOException {

		FileStatus[] fileStatus = fs.listStatus(path);

		for(int i=0;i<fileStatus.length;i++){

			if(fileStatus[i].isDir()){

				Path p = new Path(fileStatus[i].getPath().toString());

				getFile(p,fs);

			}else{

				System.out.println(fileStatus[i].getPath().toString());

			}

		}

	}

}

8、查找某个文件在HDFS集群的位置

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.BlockLocation;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.hdfs.DistributedFileSystem;

import org.apache.hadoop.hdfs.protocol.DatanodeInfo;

public class FindFile {

	public static void main(String[] args) throws IOException {

		getFileLocal();

	}

	/**

	 * 查找某个文件在HDFS集群的位置

	 * @Title:

	 * @Description:

	 * @param

	 * @return

	 * @throws

	 */

	public static void getFileLocal() throws IOException{

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		Path path = new Path("/user/hadoop/data/write.txt");

		FileStatus status = fs.getFileStatus(path);

		BlockLocation[] locations = fs.getFileBlockLocations(status, 0, status.getLen());

		int length = locations.length;

		for(int i=0;i<length;i++){

			String[] hosts = locations[i].getHosts();

			System.out.println("block_" + i + "_location:" + hosts[i]);

		}

	}

}

9、HDFS集群上所有节点名称信息

package com.hadoop.file;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.BlockLocation;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.hdfs.DistributedFileSystem;

import org.apache.hadoop.hdfs.protocol.DatanodeInfo;

public class FindFile {

	public static void main(String[] args) throws IOException {

		getHDFSNode();

	}

	/**

	 * HDFS集群上所有节点名称信息

	 * @Title:

	 * @Description:

	 * @param

	 * @return

	 * @throws

	 */

	public static void getHDFSNode() throws IOException{

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(conf);

		DistributedFileSystem  dfs = (DistributedFileSystem)fs;

		DatanodeInfo[] dataNodeStats = dfs.getDataNodeStats();

		for(int i=0;i<dataNodeStats.length;i++){

			System.out.println("DataNode_" + i + "_Node:" + dataNodeStats[i].getHostName());

		}

	}

}

Hadoop HDFS文件操作的更多相关文章

Hadoop之HDFS文件操作常有两种方式（转载）
摘要:Hadoop之HDFS文件操作常有两种方式,命令行方式和JavaAPI方式.本文介绍如何利用这两种方式对HDFS文件进行操作. 关键词:HDFS文件命令行 Java API HD ...
Hadoop HDFS文件常用操作及注意事项
Hadoop HDFS文件常用操作及注意事项 1.Copy a file from the local file system to HDFS The srcFile variable needs t ...
hadoop的hdfs文件操作实现上传文件到hdfs
这篇文章主要介绍了使用hadoop的API对HDFS上的文件访问,其中包括上传文件到HDFS上.从HDFS上下载文件和删除HDFS上的文件,需要的朋友可以参考下hdfs文件操作操作示例,包括上传文件到 ...
Hadoop之HDFS文件操作
摘要:Hadoop之HDFS文件操作常有两种方式.命令行方式和JavaAPI方式.本文介绍怎样利用这两种方式对HDFS文件进行操作. 关键词:HDFS文件命令行 Java API HD ...
HDFS文件操作(命令行)
HDFS是一种分布式文件系统,为MapReduce这种框架下的海量数据分布式处理而设计. Hadoop之HDFS文件操作常有两种方式,一种是命令行方式,即Hadoop提供了一套与Linux文件命令类似 ...
JAVA API 实现hdfs文件操作
java api 实现hdfs 文件操作会出现错误提示: Permission denied: user=hp, access=WRITE, inode="/":hdfs:supe ...
Hadoop HDFS文件常用操作及注意事项（更新）
1.Copy a file from the local file system to HDFS The srcFile variable needs to contain the full name ...
HDFS文件操作
hadoop装好后,文件系统中没有任何目录与文件 1. 创建文件夹 hadoop fs -mkdir -p /hkx/learn 参数-p表示递归创建文件夹 2. 浏览文件 hadoop fs -ls ...
eclipse 对 hadoop1.2.1 hdfs 文件操作
package com.hdfs; import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io ...

随机推荐

Linq to Sql：N层应用中的查询(上) : 返回自定义实体
原文:Linq to Sql:N层应用中的查询(上) : 返回自定义实体如果允许在UI层直接访问Linq to Sql的DataContext,可以省去很多问题,譬如在处理多表join的时候,我们使 ...
x240 uefi ubuntu 12.04.4
http://askubuntu.com/questions/355034/ubuntu-12-04-3-lts-installation-failed-says-grub-installation- ...
Fedora 20中解决zip解压文件时中文文件名的乱码问题[已解决]
该方法的原文地址: http://wangqige.com/the-solution-of-unzip-files-which-zip-under-windows/(链接已失效) 解决方法:保存如下P ...
Visual Studio 2010 单元测试－－运行测试并查看代码覆盖率
原文:Visual Studio 2010 单元测试--运行测试并查看代码覆盖率运行测试并查看代码覆盖率对程序集中的代码运行测试时,可以通过收集代码覆盖率数据来查看正在测试的项目代码部分. 运行测试 ...
Crystal Report 在 VS 2010 中的使用和发布
原文:Crystal Report 在 VS 2010 中的使用和发布使用: 打开CrystalReport官网下载页目前最新版本为13.0.4 选择“SAP Crystal Reports, v ...
自制 Word、Excel 批转 PDF 工具
原文:自制 Word.Excel 批转 PDF 工具目前做金融业的项目,该公司每天会产生很多 Word.Excel 文档,需要大量地转换为 PDF,除了自己保存外,也要给金融主管机构作为备份.由于文 ...
HDOJ 5063 Operation the Sequence
注意到查询次数不超过50次,那么能够从查询位置逆回去操作,就能够发现它在最初序列的位置,再逆回去就可以求得当前查询的值,对于一组数据复杂度约为O(50*n). Operation the Sequen ...
VC++注射过程
2014/10/19 11:12 // stdafx.h : // // // #pragma once #include "targetver.h" #include <s ...
生活小助手--Android项目
每次想做一个Android项目都不知道要怎么开始,所谓前期工作,都是辅助于项目能顺利完成而做的. 每一个项目开始都要有几首准备: 第一,项目要做什么? 第二,项目中有那些版块? 项目的概要设计项目流 ...
QTP知识总结（一）
QTP知识总结(一) (2010-12-22 16:30:41) 转载▼ 标签: 杂谈分类: QTP File menu Process guidance management,View > ...

Hadoop HDFS文件操作

Hadoop HDFS文件操作的更多相关文章

随机推荐

热门专题